Entendiendo la Arquitectura de Doble Conjunto de Datos de mindzie
Resumen
Cuando cargas datos en mindzie Studio, la plataforma crea automáticamente dos conjuntos de datos distintos que trabajan juntos para potenciar tu análisis de minería de procesos. Entender la diferencia entre estos conjuntos de datos y cuándo usar cada uno es fundamental para trabajar eficazmente con mindzie Studio.
Esta guía explica la arquitectura de doble conjunto de datos, cómo la canalización de datos de mindzie transforma tus datos, y qué sucede automáticamente cuando importas datos por primera vez.
Los Dos Conjuntos de Datos
Conjunto de Datos Original
El Conjunto de Datos Original es el registro de eventos sin procesar que subes inicialmente a mindzie Studio. Este conjunto de datos contiene tus datos de proceso exactamente como fueron proporcionados, ya sea subidos mediante un archivo CSV o ingeridos a través de mindzie Data Designer desde sistemas fuente.
Características:
- Contiene los datos en su forma original
- Incluye solo las columnas y atributos que importaste (ID de Caso, Actividad, Marca de Tiempo, Recurso y cualquier atributo adicional)
- Permanece sin cambios a lo largo de tu análisis
- Sirve como la base para todo el procesamiento de datos posterior
Cuándo usar el Conjunto de Datos Original:
- Cuando necesites verificar los datos fuente
- Para revisiones de calidad y validación de datos
- Para entender qué se proporcionó originalmente antes de cualquier transformación
Conjunto de Datos Enriquecido
El Conjunto de Datos Enriquecido es creado automáticamente por mindzie Studio después de que se ejecuta la canalización de datos. Esta es la versión mejorada de tus datos que incluye todos los atributos calculados, métricas de rendimiento, indicadores de conformidad y otros enriquecimientos añadidos mediante el motor de enriquecimiento de registros.
Características:
- Creado automáticamente al importar datos
- Contiene todos los atributos originales más nuevos atributos calculados
- Se actualiza cada vez que realizas cálculos de enriquecimiento
- Alimenta todos los análisis, investigaciones y paneles de control
Cuándo usar el Conjunto de Datos Enriquecido:
- Para todo el análisis e investigaciones (este es el conjunto de datos principal para el análisis)
- Al crear paneles de control y KPIs
- Al trabajar con métricas de rendimiento, reglas de conformidad, o enriquecimientos personalizados
- Para las actividades diarias de minería de procesos
La vista de Conjuntos de Datos mostrando tanto el Conjunto de Datos Original como el Conjunto de Datos Enriquecido
Cómo Funciona la Canalización de Datos
Cuando cargas datos en mindzie Studio, esto es lo que sucede automáticamente:
Paso 1: Importación y Validación de Datos
Tu archivo CSV o datos desde mindzie Data Designer se cargan en mindzie Studio. El sistema:
- Valida el formato y la estructura de los datos
- Mapea las columnas clave (ID de Caso, Actividad, Marca de Tiempo, Recurso)
- Asigna tipos de columnas y tipos de datos
- Crea el Conjunto de Datos Original
Paso 2: Ejecución Automática de la Canalización
Una vez que haces clic en "Guardar" tras cargar tus datos, mindzie Studio automáticamente:
- Ejecuta la canalización de datos
- Crea el Conjunto de Datos Enriquecido
- Agrega atributos fundamentales que mejoran tus capacidades de análisis
Paso 3: Generación de Análisis Predeterminado
Para darte un inicio rápido, mindzie Studio genera automáticamente análisis predeterminados útiles que incluyen:
- Resumen del proceso
- Duraciones largas de casos
- Duraciones entre los principales pasos del proceso
- Otros insights clave
Estos análisis preconstruidos te ayudan a comenzar a explorar tu proceso inmediatamente sin tener que crearlo todo desde cero.
Investigación predeterminada creada automáticamente al importar datos
Análisis predeterminado mostrando 10,000 casos y 121,000 eventos con insights clave del proceso
Entendiendo el Tamaño del Conjunto de Datos: El Ejemplo
En la demostración, el conjunto de datos de incorporación bancaria contiene:
- 10,000 casos - Cada caso representa un viaje de incorporación de un cliente
- 121,000 eventos - El número total de pasos del proceso a través de todos los casos
Esto significa que en promedio, cada caso de incorporación de cliente implica aproximadamente 12 actividades o pasos del proceso. Este tipo de información se hace visible inmediatamente una vez que tus datos están cargados en mindzie Studio.
El Rol del Enriquecimiento de Registros
El poder de la arquitectura de doble conjunto de datos se vuelve claro cuando comienzas a usar el motor de enriquecimiento de registros. Aquí es donde el Conjunto de Datos Enriquecido realmente se diferencia del Conjunto de Datos Original.
Qué Hace el Enriquecimiento de Registros
El enriquecimiento de registros te permite mejorar tus datos con:
Métricas de Rendimiento:
- Cálculos de duración entre pares de actividades
- Duración del caso de inicio a fin
- Clasificación de rendimiento (rápido, normal, lento)
- Seguimiento personalizado de cumplimiento de SLA
Reglas de Conformidad:
- Indicadores para actividades no deseadas
- Pasos obligatorios faltantes
- Orden incorrecto de actividades
- Actividades repetidas y ciclos de retrabajo
Atributos Personalizados:
- Costeo basado en actividades
- Predicciones AI
- Categorizaciones personalizadas
- Transformaciones matemáticas
- Cálculos basados en tiempo
Cómo las Enriquecimientos Actualizan el Conjunto de Datos
Cada vez que creas nuevos enriquecimientos y los calculas:
- Se ejecuta la canalización de datos
- Se agregan nuevos atributos al Conjunto de Datos Enriquecido
- Estos nuevos atributos están disponibles para su uso en filtros y calculadoras
- Tu análisis se vuelve más poderoso con cada enriquecimiento
Resumen de datos mostrando tanto atributos originales como atributos enriquecidos con íconos que indican mejoras generadas por el sistema
Atributos Automáticos Añadidos por mindzie
Incluso sin enriquecimientos manuales, mindzie Studio añade automáticamente varios atributos útiles a tu Conjunto de Datos Enriquecido, incluyendo:
- Hora del Día - Cuándo ocurrieron las actividades
- Inicio del Caso - Cuándo comenzó cada caso
- Fin del Caso - Cuándo terminó cada caso
- Duración del Caso - Tiempo total desde inicio a fin
- Primer Recurso - Quién inició el caso
- Frecuencia de Actividad - Con qué frecuencia ocurren las actividades
- Y muchos más...
Estos enriquecimientos automáticos te brindan capacidades analíticas inmediatas sin necesidad de configuración.
Elegir el Conjunto de Datos Correcto para el Análisis
Al crear investigaciones y notebooks de análisis en mindzie Studio, necesitas seleccionar qué conjunto de datos analizar.
Mejor Práctica: Selecciona siempre el Conjunto de Datos Enriquecido para tus investigaciones y trabajo de análisis. Este conjunto de datos contiene todos los atributos mejorados y métricas calculadas que hacen tu análisis potente y revelador.
El Conjunto de Datos Original debe usarse principalmente para:
- Referencia y validación
- Auditorías de calidad de datos
- Entender la estructura de los datos fuente
El Ciclo Continuo de Mejora
La arquitectura de doble conjunto de datos soporta un flujo de trabajo iterativo:
- Cargar - Importa tus datos para crear el Conjunto de Datos Original
- Enriquecer - Añade métricas de rendimiento, reglas de conformidad y atributos personalizados
- Calcular - Ejecuta la canalización para actualizar el Conjunto de Datos Enriquecido
- Analizar - Crea investigaciones y análisis usando los atributos enriquecidos
- Repetir - Añade más enriquecimientos según sea necesario para profundizar tus insights
Cada ciclo hace que tu Conjunto de Datos Enriquecido sea más valioso y tu análisis más sofisticado.
Puntos Clave
- Se crean dos conjuntos de datos: Original (datos en bruto) y Enriquecido (datos mejorados)
- Creación automática: El Conjunto de Datos Enriquecido se crea automáticamente al cargar datos
- Usa el Conjunto de Datos Enriquecido: Este es tu conjunto de datos principal para todo análisis e investigaciones
- Ejecución de la canalización: La canalización de datos transforma el Original en Enriquecido
- Mejora continua: Cada cálculo de enriquecimiento añade nuevos atributos al Conjunto de Datos Enriquecido
- Análisis predeterminado: mindzie Studio proporciona análisis iniciales útiles automáticamente
- Proceso iterativo: Puedes seguir agregando enriquecimientos para hacer tu análisis más poderoso