Establecer Valor de Grupo
Descripción General
El enriquecimiento Establecer Valor de Grupo crea poderosas agregaciones de datos al calcular estadísticas resumidas para grupos de casos y asignar esos valores calculados de nuevo a cada caso en el grupo. Este enriquecimiento transforma sus datos de proceso al calcular métricas agregadas como sumas, promedios, conteos u otras funciones estadísticas a través de casos que comparten valores comunes de atributos, luego llena un nuevo atributo con el valor agregado del grupo para cada caso en ese grupo. Esto permite análisis sofisticados basados en grupos donde cada caso lleva información sobre las características colectivas de su grupo de pares.
Este enriquecimiento es esencial para análisis comparativos y benchmarking en minería de procesos. Le permite enriquecer casos individuales con información contextual sobre el desempeño global de su grupo, posibilitando insights como "el valor de esta orden comparado con el promedio de su categoría de producto" o "la duración del tratamiento de este paciente en relación con otros con el mismo diagnóstico". Al llevar métricas a nivel grupo al nivel caso, puede identificar valores atípicos, establecer líneas base y entender cómo las instancias individuales de proceso se relacionan con sus grupos de pares. El enriquecimiento soporta diversas funciones de agregación y puede trabajar con subconjuntos filtrados de datos, proporcionando flexibilidad para definir qué constituye un grupo significativo para el análisis.
Usos Comunes
- Calcular el tiempo promedio de procesamiento por departamento y asignarlo a todos los casos de cada departamento
- Determinar el valor total de orden por cliente y llenar cada orden con el gasto total del cliente
- Contar el número de casos por proveedor y añadir este conteo a cada caso para análisis de volumen de proveedor
- Encontrar los valores máximo o mínimo dentro de categorías de productos para análisis de precios
- Calcular la mediana de duración de tratamiento por grupo diagnóstico para benchmarking en salud
- Calcular la suma de cantidades por ubicación de almacén para insights de distribución de inventario
- Determinar el tiempo promedio de aprobación por región para comparación de desempeño geográfico
Configuración
Filtro (Opcional): Aplique filtros para limitar qué casos se incluyen en los cálculos grupales. Solo se considerarán los casos que cumplan con los criterios del filtro al calcular valores agregados. Esto permite calcular estadísticas grupales en subconjuntos específicos, como solo casos finalizados, ítems de alta prioridad o transacciones dentro de un cierto período. Los casos excluidos por el filtro no recibirán el nuevo valor de atributo.
Nombre del Nuevo Atributo: Especifique el nombre para el nuevo atributo de caso que almacenará el valor calculado de grupo. Elija un nombre descriptivo que indique tanto la lógica de agrupamiento como la función de agregado aplicada. Por ejemplo, "Avg_Duration_By_Department" o "Total_Orders_Per_Customer". El nombre debe ser único y no puede entrar en conflicto con atributos existentes en su conjunto de datos.
Agrupar por nombre de columna: Seleccione el atributo que se usará para definir grupos. Los casos con el mismo valor en este atributo se agruparán para el cálculo agregado. Puede ser cualquier atributo categórico como departamento, proveedor, categoría de producto, ID de cliente o región. El atributo de agrupamiento determina cómo se segmentan sus datos para la agregación. Cada valor único en esta columna crea un grupo separado.
Nombre de columna de valor: Elija el atributo cuyos valores serán agregados dentro de cada grupo. Esta es la fuente de datos para su cálculo — por ejemplo, si calcula la duración promedio por departamento, este sería su atributo de duración. Las funciones de agregación disponibles se ajustarán según el tipo de datos de esta columna. Las columnas numéricas soportan operaciones matemáticas, mientras que las columnas de texto y fecha tienen opciones de agregación limitadas.
Función de Agregado: Seleccione la función estadística que se aplicará a los valores dentro de cada grupo. Las funciones disponibles dependen del tipo de dato de su columna de valores:
- Sum: Totaliza todos los valores en el grupo (solo atributos numéricos y de duración)
- Average: Calcula la media aritmética de los valores del grupo (atributos numéricos y de duración)
- Median: Encuentra el valor medio cuando los valores del grupo están ordenados (atributos numéricos y de duración)
- Min: Identifica el valor más pequeño en el grupo (funciona con números, fechas y duraciones)
- Max: Identifica el valor más grande en el grupo (funciona con números, fechas y duraciones)
- Count: Cuenta valores no nulos en el grupo (todos los tipos de datos)
- Distinct Count: Cuenta valores únicos en el grupo (todos los tipos de datos)
- Null Count: Cuenta valores faltantes/nulos en el grupo (todos los tipos de datos)
Ejemplos
Ejemplo 1: Tiempo Promedio de Procesamiento por Departamento
Escenario: En un proceso de aprobación de préstamos, la gerencia quiere entender el tiempo promedio de procesamiento para cada departamento para identificar variaciones de desempeño y establecer objetivos reales de SLA.
Configuración:
- Filtro: Status = "Completed"
- Nombre del Nuevo Atributo: Avg_Processing_Hours_By_Dept
- Agrupar por nombre de columna: Department
- Nombre de columna de valor: Total_Processing_Hours
- Función de Agregado: Average
Salida: Para cada solicitud de préstamo, se añade "Avg_Processing_Hours_By_Dept" que contiene el tiempo promedio de procesamiento para todos los préstamos completados en ese departamento:
- Promedio del departamento de Banca Comercial: 72.5 horas (asignado a los 150 casos)
- Promedio del departamento de Banca Minorista: 24.3 horas (asignado a los 890 casos)
- Promedio del departamento de Banca Privada: 48.7 horas (asignado a los 75 casos)
Ahora cada caso muestra tanto su tiempo individual de procesamiento como el promedio de su departamento, permitiendo una comparación inmediata.
Insights: Los oficiales de préstamos pueden identificar rápidamente si una solicitud particular está tomando más tiempo que el promedio del departamento, y la gerencia puede ver que Banca Comercial tiene el tiempo promedio de procesamiento más largo, sugiriendo necesidad de optimización o recursos adicionales.
Ejemplo 2: Valor Total de Orden por Cliente
Escenario: Una empresa de comercio electrónico necesita identificar clientes de alto valor calculando el valor total de orden de cada cliente a través de todas sus compras y agregando esta información a cada orden.
Configuración:
- Filtro: Order_Status NOT IN ("Cancelled", "Returned")
- Nombre del Nuevo Atributo: Customer_Total_Spend
- Agrupar por nombre de columna: Customer_ID
- Nombre de columna de valor: Order_Amount
- Función de Agregado: Sum
Salida: Cada orden ahora incluye el gasto total histórico del cliente:
- Customer_ID "C10234": Gasto total $15,750 (asignado a las 23 órdenes)
- Customer_ID "C10891": Gasto total $3,200 (asignado a las 8 órdenes)
- Customer_ID "C11567": Gasto total $45,900 (asignado a las 67 órdenes)
Insights: Los equipos de ventas pueden ver de inmediato al procesar una orden si es de un cliente de alto valor, permitiendo un servicio prioritario. Marketing puede identificar clientes VIP para promociones especiales basadas en umbrales de gasto total.
Ejemplo 3: Conteo de Casos por Proveedor para Análisis de Carga de Trabajo
Escenario: Un departamento de compras quiere entender la distribución de carga de trabajo de proveedores contando cuántas órdenes de compra maneja cada proveedor, añadiendo este conteo a cada PO para contexto.
Configuración:
- Filtro: PO_Date >= "2024-01-01"
- Nombre del Nuevo Atributo: Vendor_PO_Count
- Agrupar por nombre de columna: Vendor_Name
- Nombre de columna de valor: Case_ID
- Función de Agregado: Count
Salida: Cada orden de compra muestra cuántas órdenes totales ha recibido ese proveedor:
- Proveedor "TechSupplies Inc": 145 órdenes (conteo añadido a cada una de sus órdenes)
- Proveedor "Office Essentials": 892 órdenes (conteo añadido a cada una de sus órdenes)
- Proveedor "Industrial Parts Co": 43 órdenes (conteo añadido a cada una de sus órdenes)
Insights: Compras puede identificar dependencia excesiva en proveedores específicos (Office Essentials manejando 892 órdenes sugiere alta dependencia) y proveedores subutilizados que podrían manejar más volumen.
Ejemplo 4: Costo Máximo de Tratamiento por Diagnóstico
Escenario: Un hospital quiere identificar el costo de tratamiento más alto dentro de cada grupo diagnóstico para entender variaciones de costos e identificar casos costosos atípicos.
Configuración:
- Filtro: Treatment_Complete = "Yes" AND Billing_Finalized = "Yes"
- Nombre del Nuevo Atributo: Max_Cost_In_Diagnosis_Group
- Agrupar por nombre de columna: Primary_Diagnosis_Code
- Nombre de columna de valor: Total_Treatment_Cost
- Función de Agregado: Max
Salida: Cada caso de paciente incluye el costo máximo observado para su diagnóstico:
- Diagnóstico "J18.9" (Neumonía): Costo máximo $45,000 (todos los 234 casos muestran este máximo)
- Diagnóstico "I21.9" (Infarto de miocardio): Costo máximo $125,000 (todos los 89 casos muestran este máximo)
- Diagnóstico "K35.8" (Apendicitis): Costo máximo $32,000 (todos los 156 casos muestran este máximo)
Los pacientes pueden ver inmediatamente si su costo de tratamiento se acerca o supera el máximo para su grupo diagnóstico.
Insights: Los administradores de salud pueden identificar casos donde los costos se acercan significativamente al máximo, potencialmente indicando complicaciones o ineficiencias que requieren investigación.
Ejemplo 5: Tiempo de Resolución Mediano por Nivel de Prioridad
Escenario: Un centro de servicio de TI quiere establecer tiempos base de resolución calculando el tiempo mediano para resolver tickets en cada nivel de prioridad.
Configuración:
- Filtro: Ticket_Status = "Resolved" AND Created_Date >= DateAdd(Today(), -90, "days")
- Nombre del Nuevo Atributo: Median_Resolution_Hours_By_Priority
- Agrupar por nombre de columna: Priority_Level
- Nombre de columna de valor: Resolution_Duration_Hours
- Función de Agregado: Median
Salida: Cada ticket muestra el tiempo mediano de resolución para su nivel de prioridad:
- Prioridad 1 (Crítica): Mediana 2.5 horas (asignado a 145 tickets)
- Prioridad 2 (Alta): Mediana 8.0 horas (asignado a 512 tickets)
- Prioridad 3 (Media): Mediana 24.0 horas (asignado a 1,234 tickets)
- Prioridad 4 (Baja): Mediana 72.0 horas (asignado a 2,891 tickets)
Insights: Los gerentes de service desk pueden identificar inmediatamente tickets que exceden el tiempo mediano de resolución para su prioridad, indicando posibles violaciones de SLA o problemas de proceso que requieren atención.
Salida
El enriquecimiento Establecer Valor de Grupo crea un nuevo atributo de caso que contiene el valor agregado calculado para el grupo de cada caso. Cada caso dentro del mismo grupo recibe el valor calculado idéntico, permitiendo comparaciones y análisis a nivel individual basados en grupos.
Determinación del Tipo de Datos: El tipo de datos del atributo de salida depende tanto de la función de agregado seleccionada como del tipo de columna fuente:
- Las funciones de conteo (Count, Distinct Count, Null Count) siempre producen valores enteros
- Sum, Average y Median preservan el tipo de columna fuente (los valores numéricos permanecen numéricos, las duraciones permanecen duraciones)
- Min y Max mantienen el tipo de dato exacto de la columna fuente
- Al trabajar con columnas TimeSpan, las operaciones Sum, Average y Median devuelven valores TimeSpan
Proceso de Cálculo de Grupo: El enriquecimiento primero identifica todos los valores únicos en la columna de agrupamiento, luego calcula la función de agregado por separado para cada grupo usando solo los casos que pertenecen a ese grupo (y que cumplen cualquier filtro aplicado). Finalmente, asigna el valor calculado de nuevo a cada caso en el grupo correspondiente.
Manejo de Valores Nulos: Si la columna de agrupamiento contiene valores nulos, los casos con valor nulo forman su propio grupo. Para la columna de valor, el manejo de nulos depende de la función de agregado: Count excluye nulos, Null Count los cuenta específicamente, y Sum/Average/Median omiten valores nulos en los cálculos. Los casos filtrados o con valores nulos en la agrupación pueden no recibir el nuevo atributo.
Capacidades de Integración: El nuevo atributo de valor grupal se integra perfectamente con otras funcionalidades de mindzieStudio. Úselo en filtros para identificar casos por encima o debajo de promedios grupales, en calculadoras para derivar métricas adicionales como "porcentaje del total del grupo", en mapas de proceso para colorear basado en estadísticas grupales, o en otros enriquecimientos para crear agregaciones multinivel. El atributo está inmediatamente disponible en todas las herramientas de análisis y puede exportarse con su conjunto de datos enriquecido.
Véase También
- Valores de Atributo por Grupo - Cree agrupamientos personalizados combinando múltiples valores de atributos en categorías
- Categorizar Valores de Atributo - Defina rangos numéricos y asigne etiquetas de categoría para segmentación
- Atributo Representativo de Caso - Seleccione un solo valor representativo de atributos de eventos para análisis a nivel caso
- Contar Atributos Booleanos con Valor - Contar ocurrencias de condiciones booleanas específicas a través de atributos
- Agregar - Realizar sumas simples de múltiples atributos numéricos sin agrupamiento
Esta documentación es parte de la plataforma mindzie Studio para minería de procesos.