Eliminar Datos de Períodos de Baja Actividad
Resumen
El filtro Eliminar Datos de Períodos de Baja Actividad recorta automáticamente el inicio y el final de tu registro de procesos identificando y eliminando períodos de baja actividad. Este filtro inteligente a nivel de caso calcula las frecuencias diarias de eventos, determina los niveles promedio de actividad y elimina los casos que se encuentran en períodos de "calentamiento" o "enfriamiento" donde los volúmenes de eventos están por debajo de los umbrales especificados. Es especialmente útil para eliminar períodos de arranque y apagado al analizar operaciones de proceso en estado estable.
Usos Comunes
- Eliminar períodos de calentamiento del sistema al inicio de los registros de proceso
- Eliminar períodos de enfriamiento al final de los lapsos de recolección de datos
- Enfocar el análisis en operaciones en estado estable excluyendo etapas de arranque
- Limpiar registros de programas piloto antes del despliegue completo
- Eliminar períodos de baja actividad durante migraciones o transiciones del sistema
- Recortar períodos de recolección de datos que no representan operaciones normales
Configuraciones
Start Factor: Un multiplicador aplicado al promedio diario de eventos para determinar el umbral del primer día a incluir. Los días se incluyen una vez que la actividad diaria supera StartFactor veces el promedio.
End Factor: Un multiplicador aplicado al promedio diario de eventos para determinar el umbral del último día a incluir. Los días se incluyen mientras la actividad diaria supere EndFactor veces el promedio.
| Configuración | Propósito | Valores Típicos | Efecto |
|---|---|---|---|
| Start Factor | Controla cuán agresivo es el recorte al inicio | 0.1 - 0.5 | Más bajo = menos estricto, Más alto = recorte más agresivo |
| End Factor | Controla cuán agresivo es el recorte al final | 0.1 - 0.5 | Más bajo = menos estricto, Más alto = recorte más agresivo |
Cómo funciona:
- Calcula el número de eventos por día en todo el registro
- Calcula el promedio (media) diario de eventos
- Encuentra el primer día donde la actividad supera (Start Factor x Promedio)
- Encuentra el último día donde la actividad supera (End Factor x Promedio)
- Elimina todos los casos que estén fuera de este rango de fechas
Ejemplos
Ejemplo 1: Eliminando el Período de Lanzamiento del Sistema
Escenario: Tu nuevo sistema de gestión de órdenes fue lanzado el 1 de enero, pero sólo unos pocos usuarios piloto estuvieron activos las primeras dos semanas mientras se validaba el sistema. Quieres eliminar este período de lanzamiento de baja actividad y enfocar el análisis en las operaciones normales que comenzaron a mediados de enero.
Configuraciones:
- Start Factor: 0.3
- End Factor: 0.1
Resultado:
El filtro calcula que tu promedio diario de eventos es de 500 eventos/día. Con Start Factor = 0.3, busca el primer día con al menos 150 eventos (30% del promedio). Se excluyen los días de enero temprano con sólo 20-80 eventos. El análisis comienza el 14 de enero cuando la actividad alcanzó más de 150 eventos. El recorte final es mínimo con End Factor = 0.1, sólo eliminando los últimos días si la actividad baja de 50 eventos/día.
Perspectivas: Esto elimina la fase piloto de tu análisis, asegurando que las métricas reflejen el desempeño operativo real y no las pruebas iniciales. Tus tiempos de ciclo, frecuencias de variantes y análisis de cuellos de botella ahora representan operaciones en estado estable después de la adopción completa del sistema.
Ejemplo 2: Limpieza de Recolección de Datos de Fin de Año
Escenario: Tu recolección de datos terminó el 31 de diciembre, pero la actividad naturalmente disminuyó a fines de diciembre debido a las vacaciones del personal. También tuviste un inicio lento en enero mientras las operaciones se aceleraban. Quieres analizar solo el período operativo central con personal normal.
Configuraciones:
- Start Factor: 0.2
- End Factor: 0.2
Resultado:
Con factores de inicio y fin equilibrados, el filtro recorta ambos períodos de baja actividad. Si tu promedio diario de eventos era 800, se excluyen los días con menos de 160 eventos en ambos extremos. Se elimina la desaceleración de vacaciones a fines de diciembre (quizás 50-100 eventos/día) así como el lento arranque de enero, dejando sólo períodos operativos con dotación completa para análisis.
Perspectivas: Tu análisis ahora refleja la capacidad operativa normal sin anomalías estacionales. Métricas como duración promedio de casos y utilización de recursos representan desempeño típico en lugar de estar sesgadas por períodos vacacionales con personal mínimo.
Ejemplo 3: Análisis de Operaciones de Sistema Maduro
Escenario: Estás analizando un sistema en producción desde hace años, pero quieres excluir los últimos días que pueden tener datos incompletos o casos en curso. Deseas un recorte agresivo al inicio pero suave al final.
Configuraciones:
- Start Factor: 0.5
- End Factor: 0.1
Resultado:
Con Start Factor = 0.5, solo se incluyen días que alcancen al menos el 50% de la actividad promedio desde el inicio, cortando agresivamente los períodos lentos. Con End Factor = 0.1, prácticamente todos los días recientes se mantienen mientras tengan al menos el 10% de la actividad promedio. Esto te da un período operacional maduro sin perder demasiados datos recientes.
Perspectivas: El recorte agresivo al inicio asegura que analices un sistema plenamente maduro, mientras que el recorte suave al final preserva datos recientes para análisis de tendencias. Este equilibrio es ideal cuando tienes años de datos históricos y quieres enfocarte en operaciones estables recientes.
Ejemplo 4: Recorte Conservador para Análisis Completo
Escenario: Quieres incluir la mayor cantidad posible de datos mientras eliminas sólo los períodos de actividad extremadamente baja al inicio y al final del registro. Estás analizando un proceso con niveles de actividad naturalmente variables y no quieres perder datos operativos válidos.
Configuraciones:
- Start Factor: 0.1
- End Factor: 0.1
Resultado:
Con ambos factores en 0.1, sólo se excluyen días con menos del 10% de eventos diarios promedio. Si el promedio es 1000 eventos/día, sólo se recortan días con menos de 100 eventos. Este enfoque conservador elimina solo los períodos más evidentes de calentamiento y enfriamiento mientras preserva todos los períodos operativos normales, incluso aquellos con menor actividad.
Perspectivas: Este recorte mínimo asegura que no pierdas datos valiosos de períodos naturalmente más tranquilos como fines de semana o vacaciones que siguen siendo tiempo operativo legítimo. Úsalo cuando tu proceso tenga alta variabilidad o necesites cobertura histórica completa.
Salida
Este filtro opera a nivel de caso y utiliza filtrado basado en fechas:
- Calcula automáticamente las fechas óptimas de inicio y fin basadas en umbrales de actividad
- Elimina casos enteros que estén fuera del rango de fechas calculado
- Conserva todos los casos dentro del período activo sin cambios
- No modifica datos de eventos, solo filtra casos por fecha
- Devuelve los datos originales si no es posible calcular la actividad
El dataset resultante se enfoca en operaciones en estado estable, excluyendo períodos de arranque y apagado de baja actividad que podrían sesgar tu análisis de minería de procesos.
Esta documentación es parte de la plataforma de minería de procesos mindzie Studio.