Registro de Proceso de Filtro

Visión General

El enriquecimiento Registro de Proceso de Filtro es un operador poderoso de limpieza de datos que elimina permanentemente casos y eventos no deseados de su conjunto de datos de procesos basado en criterios de filtro especificados. A diferencia del filtrado temporal que solo oculta datos durante el análisis, este enriquecimiento elimina físicamente los datos filtrados del registro, creando un conjunto de datos más pequeño y enfocado. Este filtrado permanente es esencial para la gestión de calidad de datos, cumplimiento de privacidad y optimización del rendimiento en proyectos de minería de procesos.

Este enriquecimiento opera en el nivel más fundamental de la minería de procesos modificando la estructura real del registro de eventos. Cuando aplica filtros a través de este enriquecimiento, evalúa cada caso en función de los criterios definidos y elimina todos los casos (y sus eventos asociados) que no cumplan con los requisitos. El resultado es un conjunto de datos optimizado que contiene solo las instancias de proceso relevantes, haciendo que todos los análisis posteriores sean más rápidos y precisos. Esto es particularmente valioso al trabajar con grandes conjuntos de datos donde los datos irrelevantes pueden ocultar patrones importantes o cuando es necesario crear vistas especializadas de su proceso para diferentes grupos de interés.

El enriquecimiento Registro de Proceso de Filtro es único por su naturaleza permanente: una vez ejecutado, los datos filtrados se eliminan del conjunto de trabajo. Esto lo hace ideal para crear conjuntos de datos listos para producción, eliminar datos de prueba, eliminar valores atípicos o enfocarse en períodos de tiempo o segmentos de negocio específicos. El enriquecimiento aprovecha el mismo potente motor de filtros utilizado en todo mindzieStudio, que le permite combinar múltiples condiciones de filtro con lógica compleja para definir con precisión qué datos conservar.

Usos Comunes

  • Eliminar casos de prueba y datos ficticios antes del análisis de producción
  • Extraer períodos de tiempo específicos para comparaciones periódicas
  • Eliminar casos incompletos que distorsionarían las métricas del proceso
  • Crear conjuntos de datos específicos para departamentos o regiones de registros empresariales
  • Eliminar valores atípicos y anomalías que distorsionan patrones estándar del proceso
  • Garantizar la privacidad de los datos filtrando categorías sensibles de casos
  • Optimizar el rendimiento reduciendo el tamaño del conjunto de datos para análisis complejos

Configuración

Lista de Filtros: El componente central de configuración que define qué casos mantener o eliminar del registro de proceso. Acceda a la configuración de filtros mediante el menú de tres puntos, donde puede agregar múltiples condiciones de filtro. Cada filtro puede dirigirse a diferentes aspectos de sus datos: atributos de caso, atributos de evento, marcas de tiempo o nombres de actividades. Los filtros pueden combinarse usando lógica AND/OR para crear criterios de selección sofisticados. La interfaz de filtros proporciona un constructor visual que ayuda a construir lógica de filtros compleja sin escribir código. Los tipos comunes de filtros incluyen:

  • Filtros de atributo: Basados en valores de atributos de caso o evento
  • Filtros de tiempo: Seleccionar rangos de fechas o períodos específicos
  • Filtros de actividad: Incluir o excluir casos que contienen ciertas actividades
  • Filtros de rendimiento: Basados en duración, rendimiento u otras métricas
  • Filtros de conformidad: Casos que cumplen o violan reglas de proceso

La lista de filtros soporta guardar y cargar configuraciones de filtro, permitiendo reutilizar patrones comunes en diferentes conjuntos de datos o proyectos.

Ejemplos

Ejemplo 1: Eliminar Datos de Prueba del Conjunto de Producción

Escenario: Una implementación SAP contiene transacciones de prueba marcadas con prefijos específicos que deben eliminarse antes de analizar procesos comerciales reales. Los datos de prueba se crearon durante la validación del sistema y distorsionarían los KPIs si se incluyen en el análisis.

Configuración:

  • Configuración de la Lista de Filtros:
    • Filtro 1: Order_Number NO EMPIEZA CON "TEST"
    • Filtro 2: Customer_Name NO ES IGUAL A "Dummy Customer"
    • Filtro 3: Created_Date DESPUÉS DE "2024-01-01"
    • Lógica: Filtro 1 AND Filtro 2 AND Filtro 3

Resultado: El enriquecimiento elimina todos los casos donde:

  • Los números de orden comienzan con "TEST" (p. ej., "TEST_001", "TEST_PO_2024")
  • El nombre de cliente es exactamente "Dummy Customer"
  • Casos creados antes del 1 de enero de 2024

Conjunto original: 150,000 casos con 2.3 millones de eventos
Conjunto filtrado: 142,000 casos con 2.18 millones de eventos
Eliminados: 8,000 casos de prueba y sus 120,000 eventos asociados

Conclusiones: El conjunto de datos limpio ahora representa con precisión las operaciones comerciales reales, mejorando la confiabilidad de las métricas de proceso y el análisis de conformidad. Los cálculos de rendimiento, tiempos de ciclo y análisis de cuellos de botella reflejan desafíos operativos reales en lugar de escenarios de prueba artificiales.

Ejemplo 2: Extraer Órdenes de Compra de Alto Valor

Escenario: En un proceso de adquisiciones que abarca múltiples categorías, la dirección quiere enfocarse exclusivamente en órdenes de compra de alto valor superiores a $50,000 para optimizar flujos de aprobación e identificar oportunidades de ahorro.

Configuración:

  • Configuración de la Lista de Filtros:
    • Filtro 1: Total_Order_Value MAYOR QUE 50000
    • Filtro 2: Order_Status NO ES IGUAL A "Cancelled"
    • Filtro 3: Order_Type EN ["Standard PO", "Contract PO", "Planned PO"]
    • Lógica: Filtro 1 AND Filtro 2 AND Filtro 3

Resultado: Crea un conjunto de datos enfocado que contiene solo:

  • Órdenes de compra con valor total superior a $50,000
  • Órdenes activas (excluyendo las canceladas)
  • Tipos de orden estándar (excluyendo compras de emergencia o puntuales)

Antes del filtrado: 45,000 órdenes de compra totales
Después del filtrado: 3,200 órdenes de alto valor que representan el 72% del gasto total
Eventos reducidos de 890,000 a 95,000

Conclusiones: El conjunto filtrado revela que las órdenes de alto valor siguen patrones de aprobación diferentes, tienen tiempos de ciclo más largos e involucran más interesados. Esta vista enfocada permite una optimización dirigida del proceso para las órdenes con mayor impacto financiero.

Ejemplo 3: Crear Conjunto de Datos Específico por Región

Escenario: Una corporación multinacional necesita crear análisis de proceso separados para operaciones europeas por requisitos de cumplimiento GDPR y variaciones regionales del proceso.

Configuración:

  • Configuración de la Lista de Filtros:
    • Filtro 1: Region ES IGUAL A "Europe"
    • Filtro 2: Country EN ["Germany", "France", "Italy", "Spain", "Netherlands", "Belgium"]
    • Filtro 3: Process_Start_Date ENTRE "2024-01-01" Y "2024-12-31"
    • Lógica: (Filtro 1 OR Filtro 2) AND Filtro 3

Resultado: Extrae todos los casos europeos para el año calendario 2024:

  • Conjunto global original: 500,000 casos en 35 países
  • Conjunto europeo filtrado: 185,000 casos en 6 países
  • Eventos reducidos de 8.5 millones a 3.1 millones
  • Todos los datos no europeos eliminados permanentemente del conjunto de trabajo

Conclusiones: El conjunto específico regional habilita el cumplimiento con regulaciones locales de datos, revela patrones de proceso específicos de Europa y proporciona un tamaño de conjunto manejable para análisis detallados y proyectos de optimización regional.

Ejemplo 4: Enfocarse en Episodios Completados de Salud

Escenario: Un hospital quiere analizar solo episodios de tratamiento de pacientes completamente terminados, excluyendo tratamientos en curso y visitas solo administrativas, para medir con precisión la efectividad del tratamiento y la utilización de recursos.

Configuración:

  • Configuración de la Lista de Filtros:
    • Filtro 1: Episode_Status ES IGUAL A "Completed"
    • Filtro 2: Treatment_Type NO ES IGUAL A "Administrative"
    • Filtro 3: Has_Clinical_Outcome ES IGUAL A "Yes"
    • Filtro 4: Duration_Days ENTRE 1 Y 365
    • Lógica: Filtro 1 AND Filtro 2 AND Filtro 3 AND Filtro 4

Resultado: El conjunto filtrado incluye solo:

  • Episodios de tratamiento completados con resultados documentados
  • Tratamientos clínicos (excluyendo visitas administrativas)
  • Rango de duración realista (1-365 días)

Conjunto original: 120,000 episodios de pacientes
Conjunto filtrado: 78,000 episodios clínicos completados
Eliminados: 42,000 casos incompletos, administrativos o atípicos

Conclusiones: El conjunto limpio proporciona métricas precisas para duración del tratamiento, uso de recursos y rutas clínicas sin el ruido de datos incompletos, permitiendo métricas fiables de calidad e iniciativas de mejora de procesos.

Ejemplo 5: Eliminar Valores Atípicos para Análisis de Proceso Estándar

Escenario: Una empresa manufacturera desea analizar su proceso de producción estándar eliminando valores atípicos extremos que representan fallos de equipo o circunstancias excepcionales, enfocándose en el 95% típico de casos.

Configuración:

  • Configuración de la Lista de Filtros:
    • Filtro 1: Cycle_Time_Hours ENTRE 2 Y 48
    • Filtro 2: Number_of_Rework_Loops MENOR QUE 3
    • Filtro 3: Production_Status NO EN ["Emergency", "Experimental", "Failed"]
    • Filtro 4: Defect_Rate MENOR QUE 0.05
    • Lógica: Filtro 1 AND Filtro 2 AND Filtro 3 AND Filtro 4

Resultado: Elimina casos atípicos:

  • Casos con tiempos de ciclo extremos (< 2 horas o > 48 horas)
  • Reprocesos excesivos (3+ ciclos)
  • Corridas de producción no estándar
  • Altas tasas de defectos (> 5%)

Antes: 25,000 corridas de producción con alta varianza
Después: 23,750 corridas estándar de producción
Eliminados: 1,250 casos atípicos (5% del total)

Conclusiones: El conjunto filtrado representa condiciones normales de operación, permitiendo métricas base precisas, objetivos realistas de mejora e identificación de variaciones estándar vs eventos excepcionales.

Salida

El enriquecimiento Registro de Proceso de Filtro produce un conjunto de datos modificado permanentemente con las siguientes características:

Registro de Proceso Modificado: El enriquecimiento devuelve un nuevo objeto SuperLog que contiene solo los casos que cumplen con sus criterios de filtro. Todos los casos filtrados y sus eventos asociados son eliminados permanentemente del conjunto de trabajo. Esta es una operación irreversible dentro de la sesión de análisis actual.

Reducción del Conteo de Casos: El número de casos en su conjunto de datos disminuirá según los criterios de filtro. Puede monitorear esta reducción en las estadísticas del conjunto de datos para asegurarse de que el filtrado logró los resultados esperados.

Impacto en el Conteo de Eventos: Cuando se eliminan casos, todos los eventos pertenecientes a esos casos también se eliminan. Esto puede reducir significativamente el conteo total de eventos, especialmente para casos con muchos eventos.

Estructura de Datos Preservada: Todos los atributos existentes, tanto a nivel de caso como de evento, permanecen intactos para los casos retenidos. El enriquecimiento solo elimina casos completos; no modifica la estructura ni el contenido de los casos sobrevivientes.

Beneficios de Rendimiento: El tamaño reducido del conjunto de datos conduce a una ejecución más rápida de todos los enriquecimientos, filtros y cálculos posteriores. Esto se nota especialmente en operaciones complejas de minería de procesos.

Impacto en Análisis Posteriores: Todos los análisis, visualizaciones y exportaciones reflejarán el conjunto de datos filtrado. Asegúrese de guardar una copia del conjunto original si necesita referenciar los datos completos más adelante.

Consideraciones Importantes

Operación Permanente: A diferencia de los filtros de visualización que ocultan datos temporalmente, este enriquecimiento elimina datos permanentemente de su conjunto de trabajo. Mantenga siempre una copia de seguridad de sus datos originales antes de aplicar este enriquecimiento.

Orden de Operaciones: Aplique este enriquecimiento al inicio de su flujo de trabajo de análisis si sabe que ciertos datos son irrelevantes. Esto mejora el rendimiento de todas las operaciones posteriores.

Validación del Filtro: Pruebe sus filtros usando la funcionalidad de vista previa antes de ejecutar el enriquecimiento para asegurar que retiene los datos deseados.

Efectos en Cascada: La eliminación de casos podría afectar cálculos que dependen del conjunto completo de datos, como cálculos de percentiles o métricas de rendimiento relativas.


Esta documentación es parte de la plataforma de minería de procesos mindzieStudio.