Filtro de Extremos Pequeños
Visión General
El filtro de Extremos Pequeños recorta automáticamente los periodos de baja actividad al inicio y al final de tu registro de eventos. Este filtro inteligente a nivel de caso detecta los periodos de "calentamiento" y "enfriamiento" donde el volumen de eventos es significativamente inferior al promedio, y elimina los casos que caen completamente dentro de estos periodos. Esto ayuda a asegurar que tu análisis se enfoque en periodos de actividad empresarial normal en lugar de en artefactos de la recopilación de datos o puntos bajos estacionales.
Usos Comunes
- Eliminar datos de los periodos iniciales tras la puesta en marcha del sistema antes de que los procesos se estabilizaran
- Excluir periodos finales de extracción donde los datos pueden estar incompletos
- Filtrar los periodos festivos con actividad reducida
- Eliminar problemas de calidad de datos en los límites del registro
- Enfocar el análisis en periodos con comportamiento representativo del proceso
- Limpiar los registros de eventos para obtener métricas precisas de rendimiento y rendimiento
Configuración
Start Factor: Un multiplicador (de 0.0 a 1.0) aplicado al recuento medio diario de eventos. Los días al inicio del registro con un número de eventos inferior a (Start Factor x Media de Eventos por Día) son recortados. Un valor menor es más permisivo (mantiene más datos); un valor mayor es más agresivo (elimina más datos iniciales).
End Factor: Un multiplicador (de 0.0 a 1.0) aplicado al recuento medio diario de eventos. Los días al final del registro con un número de eventos inferior a (End Factor x Media de Eventos por Día) son recortados. Funciona igual que Start Factor pero para el final del registro.
Valores Predeterminados: Ambos factores tienen un valor predeterminado de 0.1 (10%), lo que significa que los días con menos del 10% de la actividad diaria media se consideran "pequeños" y son recortados.
Ejemplos
Ejemplo 1: Limpieza Estándar
Escenario: Tu registro de eventos comienza con un periodo de implementación del sistema donde ocurrieron pocas transacciones, y termina con datos incompletos de la fecha de extracción. Quieres recortar automáticamente estos periodos de baja actividad.
Configuración:
- Start Factor: 0.1
- End Factor: 0.1
Resultado:
El filtro calcula el promedio de eventos por día en todo el registro (por ejemplo, 500 eventos/día). Los días con menos de 50 eventos se consideran de baja actividad. Si los primeros 5 días tienen respectivamente 10, 25, 30, 45 y 80 eventos, el filtro empezará a contar desde el día 4 en adelante. De forma similar, los días de baja actividad al final son recortados.
Perspectivas: Esto maneja automáticamente problemas en los límites de los datos sin necesidad de seleccionar fechas manualmente, asegurando que el análisis cubra solo los periodos con niveles de actividad representativos.
Ejemplo 2: Recorte Agresivo al Inicio
Escenario: Tus datos de proceso incluyen un largo periodo piloto antes del despliegue completo. Quieres recortar agresivamente los datos iniciales manteniendo los datos del final del registro.
Configuración:
- Start Factor: 0.3
- End Factor: 0.1
Resultado:
Los días al inicio con menos del 30% de la actividad diaria media son recortados. Esto elimina más del periodo piloto/de rampa inicial. El final usa el umbral estándar del 10%, preservando más datos recientes.
Perspectivas: Factores asimétricos te permiten manejar situaciones donde el inicio y el final del registro tienen características diferentes. Los periodos piloto suelen tener rampas más largas que el enfriamiento.
Ejemplo 3: Recorte Mínimo
Escenario: Quieres conservar la mayor cantidad de datos posible pero aún así eliminar problemas obvios de calidad en los límites del registro.
Configuración:
- Start Factor: 0.05
- End Factor: 0.05
Resultado:
Solo se recortan los días con menos del 5% de la actividad diaria media. Esto atrapa solo los periodos de actividad extremadamente baja mientras conserva la gran mayoría de los datos, incluidas las variaciones estacionales moderadas.
Perspectivas: Usa factores bajos cuando tu negocio tiene variaciones naturales de actividad y no quieres eliminar accidentalmente periodos legítimos de baja actividad como fines de semana o caídas estacionales.
Ejemplo 4: Eliminando Límites Estacionales
Escenario: Tu registro abarca un año completo pero incluye diciembre (temporada festiva) tanto al inicio como al final debido al momento de la extracción. Quieres enfocarte en los periodos no festivos.
Configuración:
- Start Factor: 0.4
- End Factor: 0.4
Resultado:
Se recortan los días con menos del 40% de la actividad promedio en ambos extremos. Esto elimina efectivamente los periodos festivos donde la actividad cayó significativamente por debajo de los niveles normales.
Perspectivas: Factores más altos ayudan a excluir variaciones estacionales que podrían sesgar el análisis. Sin embargo, ten cuidado de no eliminar demasiados datos válidos.
Ejemplo 5: Implementación de Nuevo Sistema
Escenario: Los datos fueron extraídos de un nuevo sistema que se puso en marcha hace 3 meses. El primer mes tuvo muy poca actividad mientras los usuarios se capacitaban y migraban.
Configuración:
- Start Factor: 0.5
- End Factor: 0.1
Resultado:
Se elimina la primera parte del registro (periodo de implementación/capacitación con < 50% de actividad), mientras se preservan los datos recientes con un recorte mínimo al final. Esto enfoca el análisis en el periodo después de que el sistema se estabilizó.
Perspectivas: Los periodos de implementación suelen mostrar patrones que no representan operaciones normales. Recortarlos asegura que tus métricas de proceso reflejen el desempeño operativo real.
Cómo Funciona
- Calcular Frecuencias Diarias: El filtro cuenta eventos por cada día en el registro
- Calcular Actividad Media: Calcula el promedio de eventos por día en todo el período
- Encontrar Límite de Inicio: Escanea desde el comienzo para encontrar el primer día que supere (Start Factor x Media)
- Encontrar Límite de Fin: Escanea desde el final para encontrar el último día que supere (End Factor x Media)
- Aplicar Rango de Fecha: Filtra para conservar solo casos dentro de los límites de fecha calculados
Resultado
Este filtro opera a nivel de caso basándose en límites temporales:
- Calcula automáticamente umbrales de actividad basados en la media de eventos diarios
- Identifica el primer día de actividad "normal" al inicio del registro
- Identifica el último día de actividad "normal" al final del registro
- Devuelve los casos contenidos dentro del periodo de actividad normal calculado
- Conserva todos los atributos de caso y evento para los casos incluidos
- Los factores deben estar entre 0 y 1 (exclusivo)
Usa el filtro de Extremos Pequeños para limpiar automáticamente los límites de tu registro de eventos, asegurando que tu análisis refleje operaciones comerciales normales en lugar de fases de implementación, artefactos de extracción de datos o anomalías estacionales.
Esta documentación forma parte de la plataforma de minería de procesos mindzie Studio.