Casos Duplicados en el Registro
Visión General
El enriquecimiento Casos Duplicados en el Registro crea copias físicas de casos existentes dentro de tu registro de eventos. Esta es una herramienta especializada disponible solo para administradores, diseñada para fines de prueba, que permite expandir rápidamente tu conjunto de datos duplicando casos con IDs de caso modificados. Cada caso duplicado conserva todos los eventos y atributos originales pero recibe un nuevo identificador único para distinguirlo del caso fuente.
Este enriquecimiento es particularmente útil cuando necesitas probar cómo tu análisis de minería de procesos, filtros o paneles funcionan con conjuntos de datos más grandes, o cuando quieres crear datos sintéticos para propósitos de entrenamiento y demostración.
Nota: Este enriquecimiento está disponible solo para administradores debido a su impacto significativo en el volumen de datos y su uso previsto para escenarios de prueba y desarrollo, no para análisis en producción.
Usos Comunes
- Expandir pequeños conjuntos de datos de prueba para simular volúmenes de datos a escala de producción
- Crear escenarios de prueba de estrés para evaluación del rendimiento de paneles y calculadoras
- Generar datos duplicados para probar el comportamiento de filtros con un mayor número de casos
- Preparar conjuntos de datos de demostración con volumen suficiente para fines de capacitación
- Probar el rendimiento del sistema y tiempos de respuesta con cargas de datos incrementadas
- Validar que los enriquecimientos y cálculos manejan correctamente grandes conjuntos de datos
Configuración
Número de Copias: Especifica cuántas copias de cada caso crear. Por ejemplo, configurar esto en 5 resultará en que cada caso original se duplique 5 veces, multiplicando efectivamente tu número total de casos por 6 (original más 5 copias). El valor predeterminado es 1, lo que duplica tu conjunto de datos.
Ejemplo
Expansión del conjunto de datos para pruebas de rendimiento
Escenario: Tienes un registro de procesos con 100 casos y necesitas probar cómo funciona tu panel con 1,000 casos antes de desplegar a producción.
Configuración:
- Número de Copias: 9
Antes: | Case ID | Actividad | Marca de tiempo | |---------|-----------|-----------------| | PO-001 | Crear Orden | 2024-01-15 09:00 | | PO-001 | Aprobar Orden | 2024-01-15 10:00 | | PO-002 | Crear Orden | 2024-01-15 11:00 | | PO-002 | Aprobar Orden | 2024-01-15 12:00 |
Después (mostrando copias de PO-001): | Case ID | Actividad | Marca de tiempo | |---------|-----------|-----------------| | PO-001 | Crear Orden | 2024-01-15 09:00 | | PO-001 | Aprobar Orden | 2024-01-15 10:00 | | PO-001_2 | Crear Orden | 2024-01-15 09:00 | | PO-001_2 | Aprobar Orden | 2024-01-15 10:00 | | PO-001_3 | Crear Orden | 2024-01-15 09:00 | | ... | ... | ... | | PO-001_10 | Crear Orden | 2024-01-15 09:00 | | PO-001_10 | Aprobar Orden | 2024-01-15 10:00 |
Resultado: Tu conjunto de datos inicial con 100 casos ahora contiene 1,000 casos, permitiéndote probar características de rendimiento a gran escala.
Perspectivas: Después de duplicar casos, puedes identificar cuellos de botella en rendimiento de calculadoras y qué visualizaciones necesitan optimización antes de desplegar con volúmenes de datos de producción.
Cómo Funciona
- Iteración de Casos: El enriquecimiento recorre todos los casos existentes en tu registro de eventos.
- Duplicación de Casos: Para cada caso original, crea el número especificado de copias.
- Generación de ID: Cada copia recibe un ID de caso único agregando "_n" al ID original (donde n es el número de copia comenzando desde 2).
- Copia de Eventos: Todos los eventos del caso original se duplican al nuevo caso, preservando marcas de tiempo y todos los atributos de eventos.
- Preservación de Atributos: Todos los atributos a nivel de caso (excepto las columnas calculadas) se copian a los nuevos casos.
- Finalización del Registro: El registro de eventos se finaliza con las tablas de casos y eventos ampliadas.
Salida
El enriquecimiento modifica el registro de eventos mediante:
- Nuevos Casos: Crea (NumberOfCopies * cantidad de casos originales) casos adicionales.
- IDs de Casos: Los nuevos casos tienen IDs en el formato "OriginalCaseId_n" donde n es el índice de la copia (2, 3, 4, etc.)
- Eventos: Cada nuevo caso contiene copias exactas de todos los eventos del caso original.
- Atributos: Todos los atributos de casos y eventos se preservan en los casos y eventos duplicados.
Notas Importantes:
- Este enriquecimiento no crea atributos nuevos.
- Los casos originales permanecen sin cambios.
- Las columnas calculadas no se copian (se recalcularán basándose en los datos).
- Las columnas ocultas no se copian a los nuevos eventos.
Mejores Prácticas
- Usa este enriquecimiento solo en entornos de desarrollo o de prueba.
- Ten cuidado con el volumen de datos: duplicar grandes conjuntos puede aumentar significativamente el tiempo de procesamiento.
- Elimina el enriquecimiento o guarda una copia separada de tu notebook tras la prueba.
- Considera el impacto en métricas calculadas que pueden verse afectadas por patrones de datos duplicados.
Esta documentación es parte de la plataforma mindzie Studio de minería de procesos.