Convertir a Atributos de Caso
Resumen
El enriquecimiento Convertir a Atributos de Caso es un operador inteligente de optimización de datos que identifica y convierte automáticamente atributos a nivel de evento en atributos a nivel de caso cuando sus valores permanecen constantes a lo largo de cada caso. Esta poderosa herramienta de limpieza analiza todo tu conjunto de datos para encontrar atributos de evento que nunca cambian dentro de un caso, como IDs de clientes, categorías de producto o códigos de región que se repiten innecesariamente a nivel de evento, y los eleva a atributos de caso para mejorar el rendimiento y obtener modelos de datos más limpios.
Este enriquecimiento resuelve un problema común de calidad de datos en minería de procesos, donde los sistemas fuente exportan datos redundantes a nivel de evento, creando conjuntos de datos inflados y complicando el análisis. Al detectar y convertir automáticamente estos atributos estables al nivel de caso, el enriquecimiento reduce la redundancia de datos, mejora el rendimiento de las consultas y crea una estructura de datos más lógica. El proceso de conversión es completamente automático y no requiere configuración, convirtiéndolo en un paso esencial inicial en la preparación de datos que puede reducir significativamente el tamaño del conjunto de datos manteniendo toda la integridad de la información.
Usos Comunes
- Optimizar datos importados de ERP donde la información del cliente se repite en cada evento pero nunca cambia dentro de un pedido
- Convertir atributos estáticos de producto como categoría, familia o tipo de nivel de evento a nivel de caso en procesos de manufactura
- Elevar atributos fijos de proyectos como gerente del proyecto, presupuesto o departamento en conjuntos de datos de gestión de proyectos
- Mover datos demográficos constantes del paciente como grupo de edad, tipo de seguro o tipo de admisión a nivel de caso en datos sanitarios
- Convertir atributos financieros estables como tipo de préstamo, tasa de interés o código de sucursal en datos de procesos bancarios
- Limpiar datos de compras trasladando información de proveedores, números de contrato y términos de pago a nivel de caso
- Optimizar datos logísticos convirtiendo propiedades de envíos como país de destino, nivel de servicio o transportista a atributos de caso
Configuraciones
Este enriquecimiento opera automáticamente sin requerir ninguna configuración. Analiza todos los atributos de evento en tu conjunto de datos y determina inteligentemente cuáles pueden ser convertidos de manera segura a atributos de caso basándose en la consistencia de sus valores dentro de cada caso.
Ejemplos
Ejemplo 1: Optimización de Datos de Procesamiento de Pedidos
Escenario: El sistema de procesamiento de pedidos de una empresa de comercio electrónico exporta datos donde la información del cliente, detalles de envío y propiedades del pedido se repiten innecesariamente en cada evento, creando un conjunto de datos un 60% más grande de lo necesario.
Datos de Evento Antes del Enriquecimiento: | Case ID | Activity | Customer_Name | Customer_Region | Order_Priority | Product_Category | Timestamp | |---------|----------|---------------|-----------------|----------------|------------------|-----------| | ORD-001 | Create Order | John Smith | North America | High | Electronics | 2024-01-10 08:00 | | ORD-001 | Verify Payment | John Smith | North America | High | Electronics | 2024-01-10 08:15 | | ORD-001 | Pick Items | John Smith | North America | High | Electronics | 2024-01-10 09:00 | | ORD-001 | Ship Order | John Smith | North America | High | Electronics | 2024-01-10 14:00 | | ORD-002 | Create Order | Jane Doe | Europe | Normal | Clothing | 2024-01-10 08:30 | | ORD-002 | Verify Payment | Jane Doe | Europe | Normal | Clothing | 2024-01-10 08:45 |
Atributos de Caso Después del Enriquecimiento: | Case ID | Customer_Name | Customer_Region | Order_Priority | Product_Category | |---------|---------------|-----------------|----------------|------------------| | ORD-001 | John Smith | North America | High | Electronics | | ORD-002 | Jane Doe | Europe | Normal | Clothing |
Datos de Evento Después del Enriquecimiento: | Case ID | Activity | Timestamp | |---------|----------|-----------| | ORD-001 | Create Order | 2024-01-10 08:00 | | ORD-001 | Verify Payment | 2024-01-10 08:15 | | ORD-001 | Pick Items | 2024-01-10 09:00 | | ORD-001 | Ship Order | 2024-01-10 14:00 | | ORD-002 | Create Order | 2024-01-10 08:30 | | ORD-002 | Verify Payment | 2024-01-10 08:45 |
Resultado: El enriquecimiento identificó que Customer_Name, Customer_Region, Order_Priority y Product_Category nunca cambian dentro de cada caso y los convirtió automáticamente en atributos de caso. La tabla de eventos ahora es 60% más pequeña, conteniendo solo la información esencial específica de evento.
Perspectivas: Después de la conversión, las consultas en el panel de control corren 3 veces más rápido debido al volumen reducido de datos. El filtrado a nivel de caso para segmentos de clientes y categorías de producto es ahora más intuitivo, y el modelo de datos distingue claramente entre propiedades del caso y detalles del evento, facilitando a los analistas la comprensión y el trabajo con los datos.
Ejemplo 2: Optimización del Recorrido del Paciente en Salud
Escenario: El sistema de gestión de pacientes de un hospital exporta datos de admisión donde demografías del paciente, información de seguro y clasificaciones médicas se repiten en cada evento de tratamiento, haciendo el conjunto de datos innecesariamente complejo y lento para analizar.
Datos de Evento Antes del Enriquecimiento: | Case ID | Activity | Patient_Age_Group | Insurance_Type | Admission_Type | Department | Diagnosis_Code | Resource | |---------|----------|------------------|----------------|----------------|------------|---------------|----------| | PAT-501 | Registration | 45-60 | Private | Emergency | ER | CARD-01 | Nurse Smith | | PAT-501 | Triage | 45-60 | Private | Emergency | ER | CARD-01 | Dr. Jones | | PAT-501 | Treatment | 45-60 | Private | Emergency | ER | CARD-01 | Dr. Jones | | PAT-501 | Discharge | 45-60 | Private | Emergency | ER | CARD-01 | Nurse Brown |
Después del Enriquecimiento:
Atributos de Caso: | Case ID | Patient_Age_Group | Insurance_Type | Admission_Type | Diagnosis_Code | |---------|------------------|----------------|----------------|---------------| | PAT-501 | 45-60 | Private | Emergency | CARD-01 |
Atributos de Evento (valores variables permanecen): | Case ID | Activity | Department | Resource | |---------|----------|------------|----------| | PAT-501 | Registration | ER | Nurse Smith | | PAT-501 | Triage | ER | Dr. Jones | | PAT-501 | Treatment | ER | Dr. Jones | | PAT-501 | Discharge | ER | Nurse Brown |
Resultado: Demografías del paciente e información médica fija se trasladan a nivel de caso, mientras que Departamento y Recurso permanecen como atributos de evento porque podrían variar (los pacientes pueden cambiar de departamento). El conjunto de datos ahora es un 40% más pequeño y está mejor organizado lógicamente.
Perspectivas: La estructura optimizada permite análisis de cohortes de pacientes más rápidos, con filtros para tipo de seguro y grupo de edad ejecutándose instantáneamente a nivel de caso. La minería de procesos basada en diagnóstico es más eficiente, y el hospital puede identificar rápidamente patrones de tratamiento para segmentos específicos sin procesar datos redundantes del evento.
Ejemplo 3: Limpieza de Datos del Proceso de Manufactura
Escenario: El sistema MES de una planta manufacturera exporta datos de producción donde especificaciones del producto, detalles de pedido y estándares de calidad se duplican en cada paso de producción, creando problemas de rendimiento en el análisis de procesos.
Antes del Enriquecimiento: Cada evento de producción contiene: Product_ID, Product_Type, Material_Grade, Quality_Standard, Customer_Code, Order_Size, Target_Date
Después del Enriquecimiento:
- Convertidos a Atributos de Caso: Product_ID, Product_Type, Material_Grade, Quality_Standard, Customer_Code, Order_Size, Target_Date (todos constantes dentro de cada corrida de producción)
- Atributos de Evento Restantes: Activity, Timestamp, Machine_ID, Operator, Temperature, Pressure (valores variables)
Resultado: Siete atributos que nunca cambian dentro de cada corrida de producción son elevados automáticamente a nivel de caso. La tabla de eventos ahora se enfoca únicamente en detalles de ejecución del proceso que varían entre actividades.
Perspectivas: La conversión redujo el tamaño del conjunto de datos en un 65%, permitiendo monitoreo en tiempo real del proceso que antes era imposible debido al volumen de datos. El análisis de calidad por tipo de producto y grado de material es sencillo utilizando filtros a nivel de caso, y la planta puede monitorear KPIs eficientemente a través de diferentes categorías de productos.
Ejemplo 4: Simplificación del Proceso de Préstamos Financieros
Escenario: El sistema de procesamiento de préstamos de un banco exporta datos de solicitudes donde parámetros del préstamo, perfiles de cliente y clasificaciones regulatorias se repiten en cada paso del flujo de trabajo, complicando los informes de cumplimiento y la optimización de procesos.
Muestra de Datos de Evento (Antes): Cada evento incluye: Loan_Type, Interest_Rate, Loan_Amount, Credit_Score_Range, Branch, Region, Product_Code, Regulatory_Class, Customer_Segment
Después del Enriquecimiento:
- Nivel de Caso: Todos los parámetros de préstamo y clasificaciones de cliente (9 atributos) movidos a la tabla de casos
- Nivel de Evento: Solo Activity, Timestamp, Approver, Decision y Comments permanecen
Resultado: El enriquecimiento detectó que los parámetros del préstamo y la información del cliente nunca cambian durante el proceso de solicitud y los convirtió a atributos de caso. La tabla de eventos se reduce a la información esencial del flujo de trabajo.
Perspectivas: Los informes de cumplimiento regulatorio que antes tomaban horas ahora se ejecutan en minutos. El banco puede analizar instantáneamente patrones de aprobación por rango de puntaje crediticio y tipo de préstamo usando datos a nivel de caso, y la minería de procesos revela cuellos de botella específicos para ciertos segmentos de clientes sin la sobrecarga de datos redundantes a nivel de evento.
Ejemplo 5: Optimización de Datos de la Cadena de Suministro
Escenario: El sistema de seguimiento de una empresa logística registra detalles de envíos en cada punto de escaneo, con propiedades fijas del envío como nivel de servicio, destino, clase de peso y cuenta del cliente repetidos millones de veces a través de eventos de seguimiento.
Antes del Enriquecimiento: 500,000 envíos × 15 puntos de escaneo × 8 atributos estáticos = 60 millones de datos redundantes
Después del Enriquecimiento:
- Atributos de Caso: Service_Level, Origin_Country, Destination_Country, Weight_Class, Customer_Account, Declared_Value, Shipment_Type, Contract_ID
- Atributos de Evento: Activity (Scan Location), Timestamp, Scanner_ID, Location_Code, Exception_Flag
Resultado: Ocho propiedades del envío se convierten a nivel de caso, almacenándose una sola vez por envío en lugar de repetirse en cada escaneo. El tamaño de la tabla de eventos se reduce en un 70%, conteniendo solo información dinámica de seguimiento.
Perspectivas: El análisis de rutas por destino y nivel de servicio ahora es 10 veces más rápido usando consultas a nivel de caso. La empresa puede identificar patrones de entrega para diferentes segmentos de clientes y optimizar rutas basándose en características del envío sin procesar grandes cantidades de datos duplicados. El rendimiento del seguimiento en tiempo real mejoró drásticamente, permitiendo actualizaciones en vivo del panel de control que antes eran imposibles.
Resultado
El enriquecimiento Convertir a Atributos de Caso modifica la estructura de tu conjunto de datos trasladando inteligentemente atributos del nivel de evento al nivel de caso. El enriquecimiento realiza un análisis exhaustivo para identificar atributos de evento cuyos valores nunca cambian dentro de cada caso, y luego los convierte automáticamente en atributos de caso para una organización óptima de datos.
Proceso de Conversión:
- Analiza todas las columnas de datos a nivel de evento excepto las columnas del sistema (Activity, Timestamp, Resource)
- Para cada atributo, verifica si los valores permanecen constantes dentro de cada caso del conjunto de datos
- Solo convierte atributos que tienen valores idénticos en todos los eventos dentro de cada caso
- Conserva los nombres originales de los atributos y sus tipos de datos durante la conversión
- Mantiene la integridad de datos usando el último valor no nulo cuando esté presente
Atributos Que Se Convierten:
- Atributos de evento con valores constantes a lo largo de cada caso (IDs de cliente, códigos de producto, categorías)
- Propiedades estáticas que se repiten innecesariamente a nivel de evento (regiones, tipos, clasificaciones)
- Datos de referencia que lógicamente pertenecen al nivel de caso (números de contrato, códigos de proyecto, propiedades de pedido)
Atributos Que Permanecen a Nivel de Evento:
- Columnas del sistema (Activity, Timestamp, Start Time, Resource, Expected Order)
- Atributos con valores variables dentro de casos (recursos diferentes, estados cambiantes, mediciones)
- Atributos ocultos del sistema que no deben modificarse
- Atributos que ya existen a nivel de caso con el mismo nombre
Impacto en Tu Conjunto de Datos: El enriquecimiento crea una estructura de datos más limpia y eficiente donde cada pieza de información existe en su nivel lógico. El filtrado y la agregación a nivel de caso se vuelven más intuitivos al organizarse correctamente las propiedades del caso. El rendimiento de las consultas mejora significativamente debido a la reducción de datos redundantes, y el tamaño del conjunto de datos típicamente disminuye entre un 30% y 70% dependiendo de la cantidad de datos redundantes a nivel de evento.
Los atributos convertidos se integran perfectamente con todas las funcionalidades de mindzieStudio. Los filtros pueden consultar eficientemente los atributos de caso sin escanear los datos de evento, los calculadores pueden referenciar atributos de caso directamente sin funciones de agregación, y otros enriquecimientos se benefician de la estructura de datos optimizada. El descubrimiento de procesos y la comprobación de conformidad operan más eficientemente sobre los datos de evento optimizados, manteniendo el acceso completo a las propiedades de caso cuando se requiere.
Esta documentación es parte de la plataforma de minería de procesos mindzie Studio.