Algoritmo de Orden de Eventos
Resumen
El enriquecimiento Algoritmo de Orden de Eventos es una configuración a nivel de sistema que controla cómo mindzieStudio ordena los eventos dentro de cada caso cuando las marcas de tiempo carecen de granularidad suficiente o cuando múltiples eventos comparten la misma marca de tiempo. Este enriquecimiento es fundamental para garantizar un análisis y visualización precisos del flujo de procesos, especialmente cuando se trabaja con fuentes de datos que registran solo fechas sin horas específicas, o cuando los eventos se insertan en el registro después de la carga inicial de datos.
En la minería de procesos, la secuencia de actividades es fundamental para comprender el comportamiento del proceso, calcular duraciones, identificar cuellos de botella y detectar problemas de conformidad. Sin embargo, muchos sistemas fuente solo registran la fecha de un evento sin la hora precisa, o múltiples eventos pueden registrarse con marcas de tiempo idénticas. El enriquecimiento Algoritmo de Orden de Eventos proporciona estrategias inteligentes de ordenación para establecer un orden consistente y significativo para estos eventos, asegurando que tu análisis refleje la secuencia verdadera de operaciones.
Este enriquecimiento opera a nivel del registro de eventos y afecta cómo todo análisis, visualizaciones y cálculos posteriores interpretan las secuencias de eventos. Se configura típicamente una sola vez al comienzo de tu cadena de enriquecimientos, aunque puede ser necesario ajustarlo si descubres que tus datos tienen requisitos específicos de orden o si agregas nuevas fuentes de datos con características de marca de tiempo diferentes.
Usos Comunes
- Establecer un orden determinista de eventos cuando las marcas de tiempo del sistema fuente carecen de información de hora (solo fechas)
- Manejar importaciones de datos donde los eventos se insertan en el registro con marcas de tiempo actuales en lugar de los tiempos reales del evento
- Asegurar una secuencia consistente de eventos a través de diferentes extracciones de datos y reconstrucciones de registros
- Mejorar la precisión de la visualización del flujo del proceso al trabajar con datos de marca de tiempo de baja resolución
- Apoyar la verificación de conformidad proporcionando secuencias de eventos predecibles para comparar contra modelos esperados
- Optimizar el rendimiento eliminando operaciones de ordenamiento innecesarias cuando el orden de eventos ya es correcto
- Manejar migraciones de datos heredados donde eventos históricos pueden cargarse con marcas de tiempo de inserción
Configuraciones
Order Event Algorithm: Especifica el algoritmo usado para ordenar eventos dentro de cada caso. Esta configuración determina cómo mindzieStudio resuelve la secuencia de eventos cuando las marcas de tiempo por sí solas no son suficientes para establecer un orden definitivo. Las opciones disponibles son:
Insert Date Events Before (Predeterminado): Este es el algoritmo recomendado para la mayoría de escenarios. Ordena los eventos dentro de cada caso por marca de tiempo y, cuando varios eventos comparten la misma marca de tiempo (especialmente cuando la marca solo contiene la fecha sin hora), utiliza el atributo Expected Order para determinar la secuencia. Este algoritmo asume que los eventos con marcas de tiempo solo de fecha se insertaron en el registro después del hecho y deben ordenarse usando metadatos adicionales. El atributo Expected Order normalmente se configura mediante el enriquecimiento Expected Order, que permite definir la secuencia lógica de actividades en tu proceso. Esta opción ofrece manejo inteligente de marcas de tiempo con precisión mixta mientras mantiene un buen rendimiento.
Insert Date Events Before (Old): Esta es una versión heredada del algoritmo Insert Date Events Before mantenida para compatibilidad con registros de eventos antiguos. Implementa la misma lógica de ordenamiento pero utiliza un camino de código más viejo que puede tener características de rendimiento diferentes en conjuntos de datos muy grandes. Usa esta opción solo si necesitas mantener consistencia con análisis históricos o si encuentras problemas específicos de compatibilidad con el algoritmo más reciente. Para nuevos análisis, se prefiere la opción Insert Date Events Before estándar.
No Sorting: Esta opción deshabilita completamente el ordenamiento automático de eventos, preservando el orden original en que aparecen los eventos en los datos de origen. Usa esta configuración cuando tus datos fuente ya tienen los eventos en el orden cronológico correcto y quieres maximizar el rendimiento evitando operaciones de ordenación innecesarias. Esto es apropiado para fuentes de datos que proporcionan marcas de tiempo de alta precisión (incluidos milisegundos) y cuando confías en que el orden de inserción coincide con el orden cronológico. Sin embargo, ten precaución con esta opción, ya que puede llevar a flujos de proceso incorrectos si tu fuente no garantiza el orden adecuado. Si posteriormente agregas eventos calculados o integras datos de múltiples fuentes, puede ser necesario cambiar a un algoritmo de ordenación activo.
Ejemplos
Ejemplo 1: Procesamiento de Orden de Compra con Marcas de Tiempo Solo Fecha
Escenario: Un sistema de adquisiciones sigue órdenes de compra a través de la aprobación, pero el sistema ERP heredado solo registra la fecha de aprobación sin horas específicas. Múltiples pasos de aprobación (gerente de departamento, controlador financiero, aprobación ejecutiva) pueden ocurrir el mismo día, pero la marca de tiempo muestra solo "2024-03-15" para las tres aprobaciones. Sin un orden adecuado, la minería de procesos mostraría secuencias aleatorias, imposibilitando identificar la verdadera ruta de aprobación o calcular tiempos de entrega precisos.
Configuración:
- Order Event Algorithm: Insert Date Events Before
Configuración Adicional:
Antes de aplicar este enriquecimiento, usarías primero el enriquecimiento Expected Order para definir que:
- La aprobación del gerente de departamento siempre ocurre primero
- La aprobación del controlador financiero es la segunda
- La aprobación ejecutiva es la última
Resultado:
Con Insert Date Events Before seleccionado, los eventos con marca de tiempo "2024-03-15 00:00:00" se ordenan correctamente:
| Case ID | Actividad | Marca de Tiempo Original | Posición Ordenada | Orden Esperado |
|---|---|---|---|---|
| PO-1234 | Aprobación Gerente Departamento | 2024-03-15 | 1 | 10 |
| PO-1234 | Aprobación Controlador Financiero | 2024-03-15 | 2 | 20 |
| PO-1234 | Aprobación Ejecutiva | 2024-03-15 | 3 | 30 |
El flujo del proceso ahora muestra correctamente la jerarquía de aprobación, los cálculos de duración entre pasos son significativos y la verificación de conformidad puede validar que se siguió la secuencia esperada de aprobaciones.
Perspectivas: Esta configuración asegura que incluso con marcas de tiempo solo de fecha, el análisis de minería de procesos representa con precisión la jerarquía obligatoria de aprobación. Sin este enriquecimiento, las tres aprobaciones podrían aparecer en orden aleatorio en diferentes casos, ocultando patrones e imposibilitando detectar casos donde las aprobaciones ocurrieron fuera de secuencia.
Ejemplo 2: Análisis de Alto Rendimiento con Marcas de Tiempo Precisas
Escenario: Un sistema MES registra cada paso de producción con marcas de tiempo de precisión milisegundos. Cada estación registra inicio y finalización para operaciones como "Material Cargado", "Soldadura Completa", "Inspección de Calidad" y "Empaque Terminó" con marcas como "2024-03-15 14:32:18.437". El volumen de datos es alto (millones de eventos) y se desea optimizar el rendimiento del enriquecimiento dado que las marcas de tiempo ya proporcionan un orden inequívoco.
Configuración:
- Order Event Algorithm: No Sorting
Resultado:
Los eventos se procesan en su orden original de inserción sin ordenación adicional:
| Case ID | Actividad | Marca de Tiempo | Orden Original Preservado |
|---|---|---|---|
| WO-5678 | Material Cargado | 2024-03-15 14:32:18.437 | Posición 1 |
| WO-5678 | Soldadura Completa | 2024-03-15 14:35:42.891 | Posición 2 |
| WO-5678 | Inspección de Calidad | 2024-03-15 14:38:15.234 | Posición 3 |
| WO-5678 | Empaque Terminó | 2024-03-15 14:41:03.567 | Posición 4 |
El procesamiento del enriquecimiento completa un 15-20% más rápido comparado con algoritmos con ordenación activa, notorio especialmente cuando se regenera la vista de casos tras aplicar múltiples enriquecimientos.
Perspectivas: Cuando tu fuente proporciona marcas de tiempo de alta calidad y precisión, deshabilitar la ordenación puede mejorar significativamente el rendimiento en grandes conjuntos de datos sin sacrificar precisión. Esto es valioso en escenarios de minería de procesos en tiempo real o casi real donde la velocidad del enriquecimiento importa. Sin embargo, monitorea cuidadosamente los flujos de proceso al implementar esta configuración para asegurar que tus datos fuente mantengan realmente el orden correcto.
Ejemplo 3: Migración de Datos Históricos con Marcas de Tiempo Mixtas
Escenario: Una empresa financiera migra 10 años de datos de solicitudes de crédito desde un sistema heredado hacia una nueva plataforma de minería de procesos. Los eventos históricos (2015-2020) solo tienen sellos de fecha, mientras los eventos recientes (2021 en adelante) incluyen marcas de tiempo precisas. Además, algunos eventos históricos se cargaron en bloque en el sistema actual y llevan marcas de tiempo de inserción de la fecha de migración en lugar de las fechas reales. El enriquecimiento Expected Order ha sido configurado para definir la secuencia estándar de origination de créditos: Solicitud Recibida, Verificación de Crédito, Verificación de Ingresos, Revisión de Suscripción, Decisión de Aprobación.
Configuración:
- Order Event Algorithm: Insert Date Events Before
Resultado:
Para un caso histórico de 2017:
| Case ID | Actividad | Marca de Tiempo Almacenada | Fecha del Evento | Posición Ordenada | Orden Esperado |
|---|---|---|---|---|---|
| LN-9012 | Solicitud Recibida | 2017-06-12 | 2017-06-12 | 1 | 10 |
| LN-9012 | Verificación de Crédito | 2017-06-12 | 2017-06-12 | 2 | 20 |
| LN-9012 | Verificación de Ingresos | 2017-06-13 | 2017-06-13 | 3 | 30 |
| LN-9012 | Revisión de Suscripción | 2017-06-13 | 2017-06-13 | 4 | 40 |
| LN-9012 | Decisión de Aprobación | 2017-06-14 10:30:00 | 2017-06-14 | 5 | 50 |
Para un caso reciente de 2024:
| Case ID | Actividad | Marca de Tiempo Almacenada | Posición Ordenada |
|---|---|---|---|
| LN-9876 | Solicitud Recibida | 2024-03-15 09:15:23 | 1 |
| LN-9876 | Verificación de Crédito | 2024-03-15 09:47:11 | 2 |
| LN-9876 | Verificación de Ingresos | 2024-03-15 14:22:35 | 3 |
| LN-9876 | Revisión de Suscripción | 2024-03-16 08:30:12 | 4 |
| LN-9876 | Decisión de Aprobación | 2024-03-16 16:45:08 | 5 |
Perspectivas: El algoritmo Insert Date Events Before maneja sin inconvenientes escenarios de calidad mixta de datos, usando Expected Order para secuenciar eventos del mismo día en datos históricos mientras se apoya en marcas precisas para datos recientes. Esto permite realizar análisis consistentes a través de todo el conjunto de datos sin importar la precisión de las marcas de tiempo, habilitando análisis de tendencias y comparación entre desempeño histórico y actual. El algoritmo detecta automáticamente cuando las marcas carecen de información de hora y aplica la lógica de orden adecuada.
Ejemplo 4: Integración de Datos Multi-Sistema
Escenario: Un proveedor de salud combina datos del recorrido del paciente de tres sistemas: un sistema de citas (marcas de tiempo con precisión en segundos), un sistema de registros médicos electrónicos (EMR) con marcas solo de fecha para muchas entradas históricas, y un sistema de facturación (marcas con precisión en minutos). Eventos como "Cita Programada", "Paciente Llegó", "Signos Vitales Registrados", "Consulta Médica", "Orden de Laboratorio", "Resultados de Laboratorio", "Prescripción Emitida" y "Facturación Completa" provienen de fuentes con diferente precisión de marca de tiempo. El enriquecimiento Expected Order define la secuencia típica de la visita del paciente.
Configuración:
- Order Event Algorithm: Insert Date Events Before
Resultado:
Para una visita el 15 de marzo de 2024:
| Case ID | Actividad | Sistema Fuente | Marca de Tiempo Original | Posición Ordenada | Aplicación del Orden Esperado |
|---|---|---|---|---|---|
| PT-4455 | Cita Programada | Scheduling | 2024-03-10 14:30:00 | 1 | No (hora precisa) |
| PT-4455 | Paciente Llegó | Scheduling | 2024-03-15 09:00:00 | 2 | No (hora precisa) |
| PT-4455 | Signos Vitales Registrados | EMR | 2024-03-15 | 3 | Sí (solo fecha, orden 30) |
| PT-4455 | Consulta Médica | EMR | 2024-03-15 | 4 | Sí (solo fecha, orden 40) |
| PT-4455 | Orden de Laboratorio | EMR | 2024-03-15 | 5 | Sí (solo fecha, orden 50) |
| PT-4455 | Resultados de Laboratorio | EMR | 2024-03-15 | 6 | Sí (solo fecha, orden 60) |
| PT-4455 | Prescripción Emitida | EMR | 2024-03-15 | 7 | Sí (solo fecha, orden 70) |
| PT-4455 | Facturación Completa | Billing | 2024-03-15 17:00 | 8 | No (hora/minuto) |
Perspectivas: El algoritmo Insert Date Events Before se adapta inteligentemente a la variación en la precisión de marcas de tiempo a través de sistemas integrados. Preserva el orden cronológico proporcionado por marcas precisas mientras usa Expected Order para secuenciar eventos de sistemas con menor resolución temporal. Esto permite una minería de procesos integral de extremo a extremo a través de sistemas dispares sin requerir costosas mejoras en calidad de datos o enriquecimiento de marcas en el nivel del sistema fuente. Los flujos de proceso resultantes representan con precisión los recorridos del paciente, habilitando análisis de entregas, tiempos de espera y utilización de recursos.
Ejemplo 5: Compatibilidad Retroactiva para Análisis Histórico
Escenario: Un equipo de minería de procesos ha estado analizando procesos de cumplimiento de pedidos durante tres años usando una versión antigua de mindzieStudio. Han publicado múltiples informes, paneles y KPIs basados en este análisis. Tras actualizar a una versión más reciente, notan diferencias leves en algunos métricas de proceso, particularmente en actividades del mismo día. La investigación revela que el algoritmo de ordenación se actualizó con mejoras de rendimiento. Para mantener consistencia con informes históricos y asegurar que las comparaciones año a año sigan siendo válidas, necesitan usar el algoritmo de ordenación heredado.
Configuración:
- Order Event Algorithm: Insert Date Events Before (Old)
Resultado:
Las métricas de proceso y diagramas de flujo coinciden exactamente con el análisis previamente publicado:
Análisis Actual (usando el algoritmo Antiguo):
- Tiempo promedio de procesamiento de pedidos: 4.2 días
- Tasa de entregas a tiempo: 87.3%
- Distribución de variantes de proceso coincide con la línea base histórica
- Tasa de conformidad: 91.2%
Comparación con el Algoritmo Nuevo:
- Tiempo promedio de procesamiento: 4.2 días (sin cambio, marcas precisas)
- Tasa de entregas a tiempo: 87.3% (sin cambio)
- Distribución de variantes: 2 variantes raras nuevas detectadas (0.1% de casos)
- Tasa de conformidad: 91.0% (ligera disminución debido a ordenación refinada)
Perspectivas: La opción de algoritmo antiguo brinda continuidad para iniciativas de minería de procesos a largo plazo donde la consistencia con análisis históricos es crucial. Mientras el algoritmo más nuevo ofrece mejor rendimiento y posiblemente una ordenación más precisa en casos límites, el algoritmo antiguo asegura que los KPIs, benchmarks y análisis de tendencias establecidos sigan siendo comparables a través del cambio de versión. Los equipos pueden usar esta opción durante un período de transición, validar diferencias entre algoritmos en un subconjunto de datos y luego cambiar al nuevo algoritmo para análisis futuros una vez establecidas las comparaciones base. Este enfoque mantiene la confianza de los interesados mientras permite la modernización de la plataforma.
Salida
El enriquecimiento Algoritmo de Orden de Eventos no crea nuevos atributos ni modifica los valores de datos existentes. En cambio, configura un ajuste a nivel de sistema que controla cómo mindzieStudio ordena internamente los eventos al construir la vista de caso para análisis y visualización. El impacto de este enriquecimiento es visible en:
Visualización del Flujo del Proceso: Los mapas de proceso, análisis de variantes y gráficos de directamente-sigue reflejarán las secuencias de eventos determinadas por el algoritmo seleccionado. Los casos con eventos con marcas iguales mostrarán patrones de flujo consistentes y lógicos en lugar de un orden aleatorio.
Cálculo de Duraciones: Los enriquecimientos que calculan tiempo entre actividades (como "Duración entre dos actividades" o "Duración entre actividad y inicio de caso") producirán resultados significativos porque los eventos están en la secuencia correcta. Sin un orden adecuado, los cálculos de duración entre eventos con la misma marca de tiempo serían cero o podrían mostrar duraciones negativas si los eventos aparecen en orden inverso.
Verificación de Conformidad: Los enriquecimientos de conformidad que validan secuencias de actividades contra modelos de proceso esperados identificarán desviaciones correctamente. Un orden correcto de eventos asegura que las violaciones de conformidad reflejen problemas reales del proceso y no problemas de calidad de datos.
Análisis de Rendimiento: Los enriquecimientos de categorización de rendimiento que clasifican casos basados en umbrales de duración o criterios temporales operarán sobre eventos correctamente secuenciados, garantizando evaluaciones de rendimiento precisas.
Enriquecimientos Posteriores: Todos los enriquecimientos posteriores en tu pipeline que dependen del orden de eventos (posición de actividad, relaciones predecesor/sucesor, cálculos de etapas de caso) operarán correctamente basados en el orden establecido por este enriquecimiento.
El enriquecimiento funciona durante la fase de generación de la vista de caso, que ocurre después de cargar el registro de eventos y cada vez que se aplican enriquecimientos. El impacto en rendimiento varía según el algoritmo:
- No Sorting ofrece el mejor rendimiento al omitir completamente el paso de ordenación
- Insert Date Events Before ofrece un equilibrio entre precisión y rendimiento, optimizado para conjuntos modernos de datos
- Insert Date Events Before (Old) mantiene compatibilidad hacia atrás pero puede ser más lento en datasets muy grandes
Al aplicar este enriquecimiento, mindzieStudio regenera la vista de caso usando el algoritmo seleccionado. La secuencia interna de eventos se actualiza, pero los valores originales de marca de tiempo en tus datos permanecen sin cambios. Esto significa que puedes cambiar entre algoritmos sin modificar tus datos de origen, permitiéndote experimentar con diferentes estrategias de orden para encontrar la que mejor represente la realidad de tu proceso.
Véase También
- Expected Order - Define la secuencia lógica de actividades en tu proceso, que es usada por los algoritmos Insert Date Events Before para ordenar eventos con la misma marca de tiempo
- Freeze Log Time - Establece un punto de referencia fijo para cálculos basados en tiempo, útil al analizar datos históricos o crear análisis reproducibles
- Shift Activity Time - Ajusta las marcas de tiempo por un desfase especificado, útil para corregir problemas de zona horaria o alinear datos de diferentes fuentes
Esta documentación forma parte de la plataforma de minería de procesos mindzieStudio.