Predecir Valor

Visión General

El enriquecimiento Predecir Valor utiliza técnicas avanzadas de regresión para predecir valores numéricos de atributos basándose en patrones históricos en sus datos de proceso. Este poderoso operador estadístico analiza casos completados con resultados conocidos para construir modelos predictivos que pueden estimar valores para casos en curso o nuevos. Al examinar las relaciones entre atributos de entrada y variables dependientes, el enriquecimiento identifica patrones y los aplica para realizar predicciones basadas en datos sobre valores futuros.

Este enriquecimiento es particularmente valioso para la previsión y planificación en escenarios de minería de procesos. Permite a las organizaciones predecir resultados de procesos antes de la finalización, estimar impactos financieros basados en indicadores tempranos y tomar decisiones proactivas basadas en valores futuros probables. El enriquecimiento utiliza funciones de agregación configurables y análisis de casos históricos para proporcionar no solo predicciones sino también puntuaciones de confianza, ayudando a los usuarios a entender la fiabilidad de cada predicción. El operador puede manejar escenarios complejos que incluyen restricciones de valor mínimo y cálculos de respaldo, asegurando predicciones robustas incluso cuando los datos históricos son limitados.

Usos Comunes

  • Predecir tiempos de entrega basados en características del pedido y ubicación del cliente
  • Estimar montos finales de factura a partir de detalles iniciales del pedido de compra
  • Pronosticar producción en base a materiales de entrada y parámetros del proceso
  • Predecir puntuaciones de satisfacción del cliente a partir de indicadores tempranos de interacción
  • Estimar fechas de finalización de proyectos basadas en hitos iniciales
  • Predecir consumo de recursos según atributos del proceso
  • Predecir puntuaciones de calidad basadas en parámetros de la línea de producción

Configuración

Nombre del Nuevo Atributo: Especifique el nombre para el nuevo atributo que almacenará el valor predicho. Este atributo contendrá la predicción numérica para cada caso. Elija un nombre descriptivo que indique claramente qué valor se está prediciendo, como "Predicted_Delivery_Days" o "Estimated_Final_Cost".

Nombre del Algoritmo (Opcional): Proporcione un nombre personalizado para el algoritmo de predicción. Este nombre se almacenará en un atributo acompñante (junto con la predicción y la puntuación de confianza) para ayudar a rastrear qué método se utilizó en cada predicción. Es útil al probar diferentes configuraciones de predicción o cuando se aplican múltiples enriquecimientos de predicción.

Nombres de Atributos de Entrada: Seleccione uno o más atributos de tipo string que se usarán para agrupar casos para la predicción. Los casos con valores coincidentes en estos atributos se considerarán similares y se usarán juntos para predecir. Por ejemplo, seleccionar "Customer_Region" y "Product_Category" significa que las predicciones se basarán en casos históricos de la misma región y categoría de producto. Si no se seleccionan atributos, todos los casos con la variable dependiente se usarán como predictores.

Nombre del Atributo Dependiente: Seleccione el atributo numérico que desea predecir. Este debe ser un campo numérico (entero o decimal) que exista en algunos casos completados pero que puede faltar en casos en curso. El enriquecimiento analizará valores históricos de este atributo para hacer predicciones en casos donde aún no está disponible.

Nombre del Atributo de Valor Mínimo (Opcional): Seleccione un atributo numérico que proporcione un umbral mínimo para las predicciones. Cuando se especifica, las predicciones nunca serán inferiores a este valor. Esto es útil para reglas de negocio como "el tiempo de entrega predicho no puede ser menor que el tiempo transcurrido actual" o "el costo estimado no puede estar por debajo del costo de materiales". El atributo debe ser diferente del atributo dependiente.

Filtro (Opcional): Aplique filtros para limitar qué casos históricos se usan para construir el modelo de predicción. Esto permite excluir valores atípicos, enfocarse en datos recientes o usar solo casos de alta calidad para la predicción. Por ejemplo, podría filtrar para usar solo casos de los últimos 6 meses o excluir casos con problemas de calidad de datos.

Función de Agregación: Elija la función estadística usada para combinar valores históricos en una predicción:

  • Promedio: Usa la media de valores históricos (por defecto, balancea todas las observaciones)
  • Mediana: Usa el valor medio (robusto ante valores atípicos)
  • Máximo: Usa el valor histórico más alto (conservador para límites superiores)
  • Mínimo: Usa el valor histórico más bajo (conservador para límites inferiores)

Casos Mínimos: Establezca el número mínimo de casos históricos requeridos para hacer una predicción. El valor por defecto es 2. Si hay menos casos coincidentes, no se hará ninguna predicción a menos que una restricción de valor mínimo provea un respaldo. Valores más altos aumentan la confiabilidad de la predicción pero pueden reducir la cantidad de predicciones.

Casos Máximos: Establezca el número máximo de casos recientes para usar en la predicción. El valor por defecto es 10. El enriquecimiento usa los casos más recientes hasta este límite, asegurando que las predicciones reflejen patrones actuales en lugar de datos históricos desactualizados. Valores menores hacen que las predicciones responden más a cambios recientes.

Constante de Valor Mínimo: Al usar restricciones de valor mínimo, esta constante se añade al valor mínimo para crear una predicción de respaldo. El valor por defecto es 0. Por ejemplo, con un valor mínimo de 100 y constante de 10, el respaldo sería 110. Esto asegura que las predicciones cumplan con requisitos comerciales incluso cuando los datos históricos son insuficientes.

Factor de Valor Mínimo: Al usar restricciones de valor mínimo, este factor multiplica el valor mínimo en el cálculo de respaldo. El valor por defecto es 1.0. Por ejemplo, con un valor mínimo de 100 y un factor de 1.2, el respaldo sería 120. Esto permite ajustes proporcionales basados en el umbral mínimo.

Ejemplos

Ejemplo 1: Predicción de Tiempos de Entrega en Comercio Electrónico

Escenario: Un minorista en línea quiere predecir tiempos de entrega para nuevos pedidos basándose en patrones históricos, considerando la ubicación del cliente y método de envío para establecer expectativas precisas.

Configuración:

  • Nombre del Nuevo Atributo: Predicted_Delivery_Days
  • Nombre del Algoritmo: Regional_Shipping_Model
  • Nombres de Atributos de Entrada: Customer_Region, Shipping_Method
  • Nombre del Atributo Dependiente: Actual_Delivery_Days
  • Nombre del Atributo de Valor Mínimo: Current_Days_In_Transit
  • Filtro: Order_Date > hace 30 días
  • Función de Agregación: Promedio
  • Casos Mínimos: 5
  • Casos Máximos: 20
  • Constante de Valor Mínimo: 1
  • Factor de Valor Mínimo: 1.1

Salida: Crea tres nuevos atributos de caso:

  • Predicted_Delivery_Days: Número estimado de días para la entrega (por ejemplo, 5.3 días)
  • Predicted_Delivery_Days - Confidence: Puntuación de confianza entre 0 y 1 (por ejemplo, 0.75)
  • Predicted_Delivery_Days - Algorithm: Algoritmo usado ("Regional_Shipping_Model" o "Fixed" para respaldo)

Para un nuevo pedido de Region_West usando Express_Shipping, el enriquecimiento encuentra 15 pedidos similares con un promedio de 3.2 días, produciendo una predicción de 3.2 días con confianza 0.75.

Perspectivas: La predicción ayuda a establecer expectativas realistas de entrega, identificar pedidos que probablemente se retrasarán y optimizar la selección del método de envío basándose en tiempos predichos versus prometidos.

Ejemplo 2: Pronóstico de Montos de Factura en Compras

Escenario: Un departamento de compras necesita predecir montos finales de facturas basándose en detalles iniciales de requisiciones para mejorar la planificación presupuestaria e identificar costos excesivos potenciales temprano.

Configuración:

  • Nombre del Nuevo Atributo: Predicted_Invoice_Amount
  • Nombres de Atributos de Entrada: Vendor_Name, Material_Category
  • Nombre del Atributo Dependiente: Final_Invoice_Amount
  • Nombre del Atributo de Valor Mínimo: Initial_PO_Amount
  • Función de Agregación: Mediana
  • Casos Mínimos: 3
  • Casos Máximos: 15
  • Constante de Valor Mínimo: 0
  • Factor de Valor Mínimo: 1.05

Salida: Crea atributos de predicción mostrando monto estimado final de factura. Para un nuevo pedido de $10,000 de Vendor_A para Raw_Materials:

  • Predicted_Invoice_Amount: $10,750 (basado en la mediana histórica 7.5% por encima del monto del pedido)
  • Confianza: 0.6 (usando 9 casos históricos)
  • Algoritmo: Predicción basada en mediana

Perspectivas: Permite una gestión presupuestaria proactiva, identificación temprana de proveedores con sobrecostos constantes y mejora en la precisión de la planificación financiera.

Ejemplo 3: Estimación de Puntuaciones de Calidad en Manufactura

Escenario: Una planta de manufactura desea predecir puntuaciones de calidad para productos actualmente en producción basándose en parámetros tempranos del proceso, permitiendo intervenciones tempranas para problemas de calidad.

Configuración:

  • Nombre del Nuevo Atributo: Predicted_Quality_Score
  • Nombres de Atributos de Entrada: Production_Line, Product_Type, Shift
  • Nombre del Atributo Dependiente: Final_Quality_Score
  • Filtro: Production_Date > hace 60 días Y Quality_Score NO ES NULL
  • Función de Agregación: Promedio
  • Casos Mínimos: 10
  • Casos Máximos: 30

Salida: Para productos en producción en Line_A fabricando Product_Type_X durante el Day_Shift:

  • Predicted_Quality_Score: 92.5 (escala 0-100)
  • Confianza: 0.87 (basada en 26 casos históricos similares)
  • Algoritmo: Predicción estándar

Perspectivas: Permite a los equipos de calidad enfocar inspecciones en productos con bajas puntuaciones predichas, ajustar parámetros de proceso proactivamente y reducir costos por reprocesos relacionados con calidad.

Ejemplo 4: Predicción de Duración de Estancia en Salud

Escenario: Un hospital quiere predecir la duración de estancia de los pacientes basándose en el diagnóstico de admisión y datos iniciales de evaluación para optimizar la gestión de camas y asignación de recursos.

Configuración:

  • Nombre del Nuevo Atributo: Predicted_LOS_Days
  • Nombres de Atributos de Entrada: Admission_Diagnosis, Patient_Age_Group, Admission_Type
  • Nombre del Atributo Dependiente: Actual_LOS_Days
  • Nombre del Atributo de Valor Mínimo: Current_LOS_Days
  • Función de Agregación: Mediana
  • Casos Mínimos: 8
  • Casos Máximos: 25
  • Constante de Valor Mínimo: 1
  • Factor de Valor Mínimo: 1.0

Salida: Para un paciente anciano recién ingresado con neumonía vía admisión de emergencia y actualmente en día 2:

  • Predicted_LOS_Days: 7 días (mediana de casos similares)
  • Confianza: 0.72
  • Algoritmo: Usado si hay menos casos históricos mínimos, mostraría "Fixed" con estancia actual + 1 día

Perspectivas: Permite una mejor planificación de capacidad de camas, identifica pacientes con probabilidad de estancias prolongadas que requieren soporte adicional y mejora procesos de planificación de altas.

Ejemplo 5: Pronóstico de Costos de Proyectos en Construcción

Escenario: Una empresa constructora necesita predecir costos finales de proyectos basándose en características iniciales para mejorar la precisión de ofertas e identificar proyectos en riesgo de sobrecostos.

Configuración:

  • Nombre del Nuevo Atributo: Predicted_Total_Cost
  • Nombres de Atributos de Entrada: Project_Type, Client_Industry, Project_Region
  • Nombre del Atributo Dependiente: Final_Project_Cost
  • Nombre del Atributo de Valor Mínimo: Current_Spent_Amount
  • Filtro: Project_Start_Date > hace 365 días
  • Función de Agregación: Promedio
  • Casos Mínimos: 4
  • Casos Máximos: 12
  • Constante de Valor Mínimo: 50000
  • Factor de Valor Mínimo: 1.15

Salida: Para un nuevo proyecto de edificio comercial en Region_North para un cliente retail con $2M ya gastados:

  • Predicted_Total_Cost: $3,500,000 (basado en 8 proyectos históricos similares)
  • Confianza: 0.67
  • Algoritmo: Muestra método de cálculo usado

Si los datos históricos son insuficientes, usa respaldo: $2,000,000 × 1.15 + $50,000 = $2,350,000

Perspectivas: Mejora la rentabilidad del proyecto mediante predicción precisa de costos, permite intervención temprana en proyectos con sobrecostos y soporta estrategias de oferta más competitivas y realistas.

Salida

El enriquecimiento Predecir Valor crea tres atributos relacionados en el caso que trabajan juntos para proporcionar información integral de la predicción:

Atributo Principal de Predicción: Nombrado según su configuración "Nombre del Nuevo Atributo", este atributo contiene el valor numérico predicho. El tipo de dato es siempre Double (número decimal) para acomodar predicciones precisas. Los valores se calculan basándose en patrones históricos o restricciones de valor mínimo cuando aplican.

Atributo de Puntuación de Confianza: Creado automáticamente con el formato de nombre "[Nombre del Nuevo Atributo] - Confidence", este atributo contiene una puntuación entre 0 y 1 que indica la fiabilidad de la predicción. Valores más altos indican que hubo más casos históricos disponibles para la predicción. La confianza se calcula como: (número de casos usados) / (casos máximos + 1).

Atributo de Seguimiento del Algoritmo: Creado automáticamente con el formato de nombre "[Nombre del Nuevo Atributo] - Algorithm", este atributo string registra qué método se usó en cada predicción. Contendrá su nombre personalizado de algoritmo (si se especificó) para predicciones estándar, o "Fixed" cuando se usaron cálculos de respaldo basados en valores mínimos.

Estos atributos se integran perfectamente con otras funciones de mindzieStudio: úselos en filtros para identificar predicciones con alta confianza, en calculadoras para comparar valores predichos versus reales, o en visualizaciones para analizar patrones de precisión de predicciones.

Véase También


Esta documentación es parte de la plataforma de minería de procesos mindzie Studio.