Información del Conjunto de Datos
Resumen
El calculador de Información del Conjunto de Datos proporciona un resumen estadístico integral de todo su conjunto de datos de procesos. Muestra métricas clave que incluyen rangos de tiempo, recuentos de casos y eventos, estadísticas de actividades e información sobre la estructura de los datos en una sola vista fácil de leer.
Este calculador no requiere configuración y es ideal para comprender rápidamente el alcance y las características de sus datos de proceso.
Usos Comunes
- Comprender el alcance de un nuevo conjunto de datos antes de comenzar el análisis
- Validar que la extracción de datos capturó el volumen y rango de tiempo esperados
- Comparar conjuntos de datos revisando sus perfiles estadísticos lado a lado
- Monitorear tendencias de volumen del proceso al rastrear recuentos de casos y eventos a lo largo del tiempo
- Verificar la calidad de los datos revisando rangos de duración de casos y distribución de eventos
- Generar metadatos del conjunto de datos para informes y presentaciones
Configuración
No hay configuraciones específicas para este calculador más allá de los campos estándar de título y descripción. El calculador analiza automáticamente todo el conjunto de datos y muestra todas las métricas disponibles.
Ejemplos
Ejemplo 1: Descubrimiento Inicial del Proceso
Escenario: Acaba de importar un nuevo conjunto de datos de compra a pago y desea comprender sus características antes de comenzar su análisis.
Configuración:
- Título: "Resumen del Conjunto de Datos de Compra a Pago"
- Descripción: "Datos de adquisiciones del Q4 2024"
Salida:
El calculador muestra una tabla completa con las siguientes métricas:
- Inicio del Conjunto de Datos: 2024-10-01 00:00:00
- Fin del Conjunto de Datos: 2024-12-31 23:59:59
- Duración del Conjunto de Datos: 92 días
- Duración Mínima del Caso: 2 horas
- Duración Máxima del Caso: 45 días
- Duración Promedio del Caso: 8.5 días
- Duración Mediana del Caso: 6.2 días
- Conteo Total de Casos: 1,847
- Conteo Total de Actividades: 14,776
- Promedio de actividades por caso: 8.0
- Actividades: 23 actividades únicas
- Columnas de Caso: 15 atributos
- Columnas de Actividad: 12 atributos
Perspectivas: Este conjunto de datos cubre un trimestre completo con casi 1,900 órdenes de compra. La duración promedio de 8.5 días por caso es razonable para un proceso de adquisiciones, aunque algunos casos tardan hasta 45 días, lo que sugiere posibles retrasos que valen la pena investigar. Con un promedio de 8 actividades por caso distribuidas en 23 actividades únicas, el proceso muestra una complejidad moderada con alguna variación en las rutas de ejecución.
Ejemplo 2: Comparación de Datos Filtrados vs. No Filtrados
Escenario: Desea entender cómo afecta la aplicación de un filtro de tiempo a las características de su conjunto de datos.
Configuración:
- Crear dos calculadores de Información del Conjunto de Datos:
- "Resumen del Conjunto de Datos Completo" (sin filtros)
- "Resumen de los Últimos 30 Días" (con filtro de periodo de tiempo)
Salida:
Conjunto de Datos Completo:
- Conteo Total de Casos: 1,847
- Duración del Conjunto de Datos: 92 días
- Duración Promedio del Caso: 8.5 días
Últimos 30 Días:
- Conteo Total de Casos: 623
- Duración del Conjunto de Datos: 30 días
- Duración Promedio del Caso: 9.2 días
Perspectivas: La vista filtrada muestra que aproximadamente un tercio de los casos corresponden al último mes. Curiosamente, la duración promedio por caso aumentó de 8.5 a 9.2 días en el período más reciente, lo que sugiere que el desempeño del proceso podría estar deteriorándose y merece una investigación más profunda.
Ejemplo 3: Validación de la Calidad de Datos
Escenario: Después de completar una extracción de datos, necesita verificar que todos los datos esperados fueron capturados correctamente.
Configuración:
- Título: "Chequeo de Calidad de Datos"
- Descripción: "Validación de la extracción de enero 2025"
Salida:
- Inicio del Conjunto de Datos: 2025-01-01 00:00:00
- Fin del Conjunto de Datos: 2025-01-31 23:59:59
- Conteo Total de Casos: 412
- Conteo Total de Actividades: 3,296
- Actividades: 18 actividades únicas
Perspectivas: El conjunto de datos abarca correctamente todo el mes de enero 2025 como se esperaba. El conteo de casos de 412 coincide con el volumen mensual esperado. Las 18 actividades estándar están presentes en los datos, confirmando que la extracción capturó todos los tipos de actividades. El promedio de 8 actividades por caso es consistente con los patrones históricos.
Ejemplo 4: Documentación de Línea Base de Rendimiento
Escenario: Necesita documentar métricas base para su proceso antes de implementar iniciativas de mejora.
Configuración:
- Título: "Métricas de Línea Base Pre-Mejora"
- Descripción: "Línea base de procesamiento de facturas - enero 2025"
Salida:
- Conteo Total de Casos: 2,156
- Duración Promedio del Caso: 12.3 días
- Duración Mediana del Caso: 9.5 días
- Duración Mínima del Caso: 4 horas
- Duración Máxima del Caso: 67 días
- Promedio de actividades por caso: 11.2
Perspectivas: El procesamiento actual de facturas promedia 12.3 días con una variación significativa (de 4 horas a 67 días). La diferencia entre la media (12.3 días) y la mediana (9.5 días) sugiere que un subconjunto de facturas con tiempos muy largos está elevando el promedio. Estas métricas establecen una línea base clara para medir mejoras tras implementar cambios en el proceso.
Salida
El calculador de Información del Conjunto de Datos muestra una única tabla con dos columnas:
Nombre: El nombre de cada métrica
Valor: El valor correspondiente para esa métrica
Métricas Incluidas
Métricas de Tiempo:
- Inicio del Conjunto de Datos: El timestamp del evento más temprano en el conjunto de datos
- Fin del Conjunto de Datos: El timestamp del evento más reciente en el conjunto de datos
- Duración del Conjunto de Datos: El período total de tiempo cubierto por el conjunto de datos
Métricas de Duración del Caso:
- Duración Mínima del Caso: La duración más corta de un caso en el conjunto de datos
- Duración Máxima del Caso: La duración más larga de un caso en el conjunto de datos
- Duración Promedio del Caso: La duración media de todos los casos
- Duración Mediana del Caso: La duración mediana (valor central) de los casos
Métricas de Volumen:
- Conteo Total de Casos: El número de casos únicos en el conjunto de datos
- Conteo Total de Actividades: El número total de eventos en todos los casos
- Promedio de actividades por caso: El número medio de eventos por caso
Métricas de Estructura:
- Actividades: El número de tipos únicos de actividades en el proceso
- Columnas de Caso: El número de atributos a nivel de caso
- Columnas de Actividad: El número de atributos a nivel de evento
Todos los valores de tiempo se muestran en un formato legible (por ejemplo, "8.5 días" o "2 horas 30 minutos"). La salida puede añadirse a paneles para monitoreo continuo o exportarse para fines de documentación.
Esta documentación es parte de la plataforma de minería de procesos mindzie Studio.