Encontrar Valores Atípicos de Fecha
Descripción General
El calculador Encontrar Valores Atípicos de Fecha identifica valores de fechas y marcas de tiempo en su registro de eventos que están fuera de rangos normales esperados, ayudándole a detectar problemas de calidad de datos antes de que afecten su análisis de procesos. Este calculador especializado en calidad de datos escanea automáticamente todos los atributos de fecha y marca de tiempo en todo su registro de eventos para encontrar valores que sean claramente inválidos, tales como fechas en el pasado lejano, muy en el futuro o valores cero.
A diferencia de la inspección manual de datos, este calculador examina sistemáticamente cada campo de fecha en sus datos de proceso para resaltar posibles problemas que podrían distorsionar su análisis de minería de procesos, tales como sellos de tiempo de actividad incorrectos, importaciones de datos mal formateadas o valores predeterminados de marcador de posición que nunca fueron actualizados.
Usos Comunes
- Validar la calidad de datos tras importar registros de eventos desde sistemas heredados o nuevas fuentes de datos
- Detectar fechas de marcador de posición o valores predeterminados que indican entradas de datos incompletas
- Identificar errores de reloj del sistema o problemas de conversión de zona horaria que generan marcas de tiempo imposibles
- Encontrar fechas de datos de prueba que accidentalmente llegaron a registros de eventos en producción
- Verificar que los datos de marca de tiempo estén dentro de los períodos esperados de operación del negocio
- Evaluar rápidamente la calidad general de los campos de fecha en todos los atributos antes del análisis detallado
Configuración
Este calculador no requiere configuraciones. Examina automáticamente todos los atributos de fecha y de marca de tiempo en su registro de eventos e identifica valores atípicos basándose en reglas predefinidas sobre qué constituye fechas no realistas o problemáticas.
Campos Estándar:
- Título: Título personalizado opcional para la salida del calculador
- Descripción: Descripción opcional para propósitos de documentación
Reglas de Detección:
El calculador identifica valores atípicos de fecha comprobando:
- Fechas anteriores a 1990: Valores anteriores al 1 de enero de 1990 se marcan como probables errores de datos o marcadores de posición
- Fechas posteriores a 2040: Valores posteriores al 1 de enero de 2040 se consideran poco realistas para procesos empresariales actuales
- Fechas nulas o cero: Valores faltantes, nulos o cero en marcas de tiempo que indican datos incompletos
- Formatos de fecha inválidos: Valores de fecha mal formados que no pueden analizarse correctamente
Ejemplos
Ejemplo 1: Validación de Migración de Sistema Heredado
Escenario: Su organización recientemente migró datos de procesamiento de facturas desde un sistema ERP heredado de 20 años a una plataforma moderna. Antes de realizar análisis de minería de procesos, desea verificar que todos los campos de fecha se convirtieron correctamente y que no quedan fechas predeterminadas o marcadores de posición en el conjunto de datos.
Configuración:
- Título: "Validación Migración de Datos de Facturas"
- Descripción: "Verificar problemas de conversión de fechas desde el sistema heredado"
Salida:
El calculador produce una tabla que muestra valores problemáticos de fecha agrupados por atributo. Cada fila representa un atributo específico donde se encontraron valores atípicos:
| Nombre del Atributo | Conteo de Valores Atípicos | Valor Ejemplo Atípico | Tipo de Problema |
|---|---|---|---|
| Invoice_Date | 847 | 1900-01-01 | Antes de 1990 |
| Payment_Due_Date | 847 | 1900-01-01 | Antes de 1990 |
| Last_Modified_Date | 23 | 2099-12-31 | Después de 2040 |
| Approval_Timestamp | 156 | NULL | Cero/Nulo |
Perspectivas:
La salida revela problemas significativos de calidad de datos derivados de la migración. Las 847 facturas con fechas del 1 de enero de 1900 son claramente valores de marcador de posición del sistema heredado que no fueron convertidos correctamente — esta fecha se usaba comúnmente como un valor "vacío" predeterminado en sistemas antiguos. Los 23 registros con fecha 2099 en Last_Modified_Date sugieren que fueron registros de prueba que migraron accidentalmente a producción. Los 156 valores nulos en Approval_Timestamp indican registros incompletos que carecen de información crítica de tiempos de proceso.
Antes de realizar cualquier análisis de procesos, debe:
- Trabajar con el equipo de datos para corregir o eliminar los 847 registros con fechas de marcador de posición
- Filtrar los 23 registros de prueba con fechas 2099
- Investigar por qué 156 facturas carecen de marcas de aprobación
Esta validación le ahorró sacar conclusiones incorrectas sobre los tiempos de procesamiento de facturas y patrones de aprobación basados en datos de fecha corruptos.
Ejemplo 2: Detección de Problemas de Reloj del Sistema
Escenario: Los usuarios han reportado que algunas marcas de tiempo en su proceso de cumplimiento de pedidos "no tienen sentido", con actividades que parecen ocurrir en el orden incorrecto. Sospecha que puede haber problemas de sincronización de relojes de servidor o conversiones de zona horaria que afectan las marcas de tiempo de eventos.
Configuración:
- Título: "Validación de Marcas de Tiempo en Cumplimiento de Pedidos"
- Descripción: "Identificar problemas de sincronización de reloj o zona horaria"
Salida:
El calculador muestra valores atípicos en los campos de marca de tiempo de actividad:
| Nombre del Atributo | Conteo de Valores Atípicos | Valor Ejemplo Atípico | Tipo de Problema |
|---|---|---|---|
| Activity_Timestamp | 1,247 | 2043-08-15 14:23:00 | Después de 2040 |
| Event_Start_Time | 1,247 | 2043-08-15 14:23:00 | Después de 2040 |
Perspectivas:
Los 1,247 eventos tienen marcas de tiempo en agosto de 2043 — exactamente 20 años en el futuro. Esto es un signo clásico de un error en el reloj del sistema en uno de sus servidores de aplicación o un error en la conversión de zona horaria que agregó décadas en vez de horas. El hecho de que tanto Activity_Timestamp como Event_Start_Time muestren conteos idénticos de valores atípicos y ejemplos confirma que son los mismos eventos capturados por múltiples campos.
La investigación revela que un servidor del sistema de gestión de almacenes tuvo su reloj configurado incorrectamente tras una ventana de mantenimiento, y todos los eventos procesados por ese servidor durante un periodo de 6 horas recibieron marcas de tiempo con 20 años en el futuro. Estos 1,247 eventos representan actividades críticas de procesamiento de pedidos (picking, empaquetado, envío) que deben corregirse para restaurar el análisis correcto del flujo de procesos.
Sin este calculador, estos errores de marca de tiempo habrían causado que sus mapas de procesos mostraran actividades completamente fuera de secuencia, imposibilitando analizar correctamente el desempeño del cumplimiento de pedidos durante el periodo afectado.
Ejemplo 3: Verificación de Calidad de Datos Antes del Análisis
Escenario: Está a punto de realizar un análisis exhaustivo de minería de procesos del ciclo de compra a pago que abarca tres años de datos. Como buena práctica, ejecuta primero el calculador Encontrar Valores Atípicos de Fecha para asegurarse de que su conjunto de datos esté limpio antes de invertir tiempo en un análisis detallado.
Configuración:
- Título: "Escaneo de Calidad de Datos Compra-a-Pago"
- Descripción: "Chequeo de validación previo al análisis"
Salida:
El calculador devuelve una tabla que muestra que todos los atributos tienen rangos de fechas válidos sin valores atípicos detectados.
Resultado: No se encontraron valores atípicos en ningún atributo de fecha.
Perspectivas:
Este es el mejor resultado posible — un diagnóstico limpio para sus datos de fecha. El calculador examinó todos los campos de fecha y marca de tiempo en todo su registro de eventos de compra a pago de tres años y no encontró valores antes de 1990, después de 2040 ni nulos/cero. Esto le da confianza para proceder con su análisis de minería de procesos sabiendo que:
- Todas las marcas de tiempo reflejan con precisión cuándo ocurrieron las actividades
- No hay fechas de marcador de posición que distorsionen sus métricas basadas en tiempo
- No hay datos de prueba que contaminan accidentalmente su conjunto de datos de producción
- Los relojes del sistema estuvieron sincronizados correctamente durante todo el periodo de recopilación de datos
Ahora puede confiar en el orden temporal de las actividades en los mapas de procesos, en la precisión de los cálculos de duración y en la fiabilidad de los conocimientos basados en tiempo. Esta validación inicial le ahorra incontables horas de solución de problemas por resultados confusos que habrían sido causados por datos de fecha corruptos.
Ejemplo 4: Identificación de Entradas de Datos Incompletas
Escenario: Su sistema de tickets de servicio al cliente permite que los agentes de soporte ingresen manualmente ciertas fechas, y sospecha que muchos tickets tienen información faltante o incompleta de marcas de tiempo que podría afectar su análisis del tiempo de resolución de casos.
Configuración:
- Título: "Chequeo de Completitud de Fechas en Tickets de Soporte"
- Descripción: "Identificar tickets con información de fecha faltante"
Salida:
| Nombre del Atributo | Conteo de Valores Atípicos | Valor Ejemplo Atípico | Tipo de Problema |
|---|---|---|---|
| First_Response_Date | 3,456 | NULL | Cero/Nulo |
| Resolution_Date | 892 | NULL | Cero/Nulo |
| Escalation_Date | 12,034 | NULL | Cero/Nulo |
| Follow_Up_Date | 8,721 | 1970-01-01 | Antes de 1990 |
Perspectivas:
El análisis revela brechas significativas en la entrada de datos. El alto número de valores nulos indica que los agentes no están registrando de manera consistente fechas críticas:
- 3,456 tickets sin First_Response_Date: Estos casos no pueden incluirse en el análisis de SLA de tiempo de respuesta
- 892 tickets sin Resolution_Date: Es imposible calcular tiempo de resolución para estos casos
- 12,034 tickets sin Escalation_Date: Esto es aceptable; la mayoría de tickets no deberían escalarse, por lo que un valor nulo es esperado aquí
- 8,721 tickets con Follow_Up_Date de 1970-01-01: Esta fecha de época Unix (1 de enero de 1970) es un valor predeterminado clásico que indica que el campo nunca fue correctamente establecido
El problema más preocupante es que 3,456 tickets carecen de fecha de primera respuesta, lo que representa el 15 % de su volumen de tickets y afecta directamente su capacidad para medir la capacidad de respuesta del servicio al cliente. Debería:
- Configurar su sistema de tickets para que First_Response_Date sea un campo obligatorio
- Capacitar a los agentes sobre la importancia de completar las fechas correctamente
- Considerar capturar automáticamente las marcas de tiempo en lugar de entradas manuales cuando sea posible
- Filtrar los 892 tickets no resueltos del análisis de casos finalizados
Esta validación le ayudó a entender que sus métricas de resolución de casos han estado subestimadas porque excluyeron tickets con datos faltantes, dando a la gerencia una visión falsamente optimista del desempeño del equipo de soporte.
Salida
El calculador produce una tabla de datos que lista todos los atributos de fecha y marca de tiempo que contienen valores atípicos. La tabla está diseñada para ayudarle a identificar y priorizar problemas de calidad de datos rápidamente:
Nombre del Atributo (Texto): El nombre del campo de atributo de caso o evento que contiene valores atípicos de fecha. Esto le permite identificar exactamente qué campos tienen problemas.
Conteo de Valores Atípicos (Número): El número de casos o eventos que tienen valores problemáticos de fecha en este atributo. Conteos más altos indican problemas más graves de calidad de datos que requieren atención urgente.
Valor Ejemplo Atípico (DateTime): Una muestra de uno de los valores problemáticos encontrados en el atributo, ayudándole a entender la naturaleza del problema (por ejemplo, "1900-01-01" indica fechas de marcador de posición, mientras que "2050-01-15" sugiere errores de reloj).
Tipo de Problema (Categoría): El tipo de valor atípico detectado — "Antes de 1990", "Después de 2040" o "Cero/Nulo" — para entender si el problema son fechas de marcador de posición, fechas futuras o valores faltantes.
Análisis Interactivo:
La tabla de salida es completamente interactiva — puede:
- Hacer clic en cualquier fila para profundizar en los casos específicos que contienen esos valores atípicos
- Ordenar por Conteo de Valores Atípicos para priorizar qué atributos corregir primero
- Filtrar los resultados para enfocarse en tipos específicos de problemas
- Exportar la lista de valores atípicos para compartir con los equipos de calidad de datos
Buenas Prácticas:
- Ejecute este calculador como el primer paso en cualquier nuevo proyecto de minería de procesos
- Re ejecútelo después de cualquier importación de datos o migración de sistemas
- Aborde los valores atípicos antes de crear mapas de procesos o calcular métricas de desempeño
- Use el calculador regularmente en flujos de datos continuos para detectar deterioro de calidad tempranamente
Nota: El calculador sólo examina atributos con tipos de datos fecha o marca de tiempo. No se analizan campos de texto que contengan fechas. Si no se encuentran valores atípicos, el calculador mostrará "No date outliers detected" — esto indica que la calidad de sus datos es excelente.
Esta documentación es parte de la plataforma de minería de procesos mindzie Studio.