Prédire une Valeur

Vue d'ensemble

L'enrichissement Predict Value utilise des techniques avancées de régression pour prédire des valeurs numériques d'attributs basées sur les modèles historiques dans vos données de processus. Cet opérateur statistique puissant analyse des cas terminés avec des résultats connus pour construire des modèles prédictifs capables d'estimer des valeurs pour des cas en cours ou nouveaux. En examinant les relations entre les attributs d'entrée et les variables dépendantes, l'enrichissement identifie des tendances et les applique pour effectuer des prédictions basées sur les données concernant des valeurs futures.

Cet enrichissement est particulièrement utile pour la prévision et la planification dans des scénarios de process mining. Il permet aux organisations de prédire les résultats d’un processus avant son achèvement, d’estimer les impacts financiers à partir des indicateurs précoces et de prendre des décisions proactives basées sur les valeurs futures probables. L'enrichissement utilise des fonctions d’agrégation configurables et une analyse historique des cas pour fournir non seulement des prédictions, mais aussi des scores de confiance, aidant ainsi les utilisateurs à comprendre la fiabilité de chaque prédiction. L'opérateur peut gérer des scénarios complexes, y compris des contraintes de valeur minimale et des calculs de secours (fallback), assurant des prédictions robustes même lorsque les données historiques sont limitées.

Utilisations courantes

  • Prédire les délais de livraison en fonction des caractéristiques de la commande et de la localisation du client
  • Estimer les montants finaux des factures à partir des détails initiaux des bons de commande
  • Prévoir la production en fonction des matières premières et des paramètres de processus
  • Prédire les scores de satisfaction client à partir des premiers indicateurs d’interaction
  • Estimer les dates d’achèvement du projet en fonction des jalons initiaux
  • Prévoir la consommation de ressources en fonction des attributs du processus
  • Prédire les scores de qualité à partir des paramètres de la ligne de production

Paramètres

New Attribute Name : Spécifiez le nom du nouvel attribut qui stockera la valeur prédite. Cet attribut contiendra la prédiction numérique pour chaque cas. Choisissez un nom descriptif qui indique clairement la valeur prédite, par exemple « Predicted_Delivery_Days » ou « Estimated_Final_Cost ».

Algorithm Name (Optionnel) : Fournissez un nom personnalisé pour l’algorithme de prédiction. Ce nom sera stocké dans un attribut compagnon (aux côtés de la prédiction et du score de confiance) pour aider à suivre la méthode utilisée pour chaque prédiction. Utile lors de tests avec différentes configurations ou lorsque plusieurs enrichissements de prédiction sont appliqués.

Input Attribute Names : Sélectionnez un ou plusieurs attributs de type chaîne qui seront utilisés pour regrouper les cas lors de la prédiction. Les cas ayant des valeurs correspondantes dans ces attributs seront considérés similaires et utilisés ensemble pour la prédiction. Par exemple, sélectionner « Customer_Region » et « Product_Category » signifie que les prédictions seront basées sur des cas historiques de la même région et catégorie produit. Si aucun attribut n’est sélectionné, tous les cas avec la variable dépendante seront utilisés comme prédicteurs.

Dependent Attribute Name : Sélectionnez l’attribut numérique que vous souhaitez prédire. Il doit s’agir d’un champ numérique (entier ou décimal) qui existe dans certains cas terminés mais peut être manquant dans les cas en cours. L’enrichissement analysera les valeurs historiques de cet attribut pour faire des prédictions là où il n’est pas encore disponible.

Min Value Attribute Name (Optionnel) : Sélectionnez un attribut numérique fournissant un seuil minimum pour les prédictions. Lorsque spécifié, les prédictions ne seront jamais inférieures à cette valeur. Utile pour des règles métier telles que « le délai de livraison prédit ne peut être inférieur au temps déjà écoulé » ou « le coût estimé ne peut être inférieur au coût des matériaux ». L’attribut doit être différent de la variable dépendante.

Filter (Optionnel) : Appliquez des filtres pour limiter les cas historiques utilisés pour construire le modèle de prédiction. Cela permet d’exclure les valeurs aberrantes, de se concentrer sur des données récentes ou d’utiliser uniquement des cas de haute qualité pour la prédiction. Par exemple, vous pouvez filtrer pour n’utiliser que les cas des six derniers mois ou exclure les cas ayant des problèmes de qualité des données.

Aggregate Function : Choisissez la fonction statistique utilisée pour combiner les valeurs historiques en une prédiction :

  • Average : Utilise la moyenne des valeurs historiques (par défaut, équilibre toutes les observations)
  • Median : Utilise la valeur médiane (résistant aux valeurs aberrantes)
  • Max : Utilise la valeur maximale historique (conservateur pour les bornes supérieures)
  • Min : Utilise la valeur minimale historique (conservateur pour les bornes inférieures)

Min Cases : Définissez le nombre minimal de cas historiques requis pour effectuer une prédiction. Par défaut 2. Si moins de cas correspondants sont disponibles, aucune prédiction ne sera faite sauf si une contrainte de valeur minimale fournit un secours. Des valeurs plus élevées augmentent la fiabilité de la prédiction mais peuvent réduire le nombre de prédictions.

Max Cases : Définissez le nombre maximal de cas récents à utiliser pour la prédiction. La valeur par défaut est 10. L’enrichissement utilise les cas les plus récents jusqu’à cette limite, assurant que les prédictions reflètent les tendances actuelles plutôt que des données historiques obsolètes. Des valeurs plus basses rendent les prédictions plus réactives aux changements récents.

Min Value Constant : Lors de l’utilisation de contraintes de valeur minimale, cette constante est ajoutée à la valeur minimale pour créer une prédiction de secours. Par défaut 0. Par exemple, avec une valeur minimale de 100 et une constante de 10, le secours serait de 110. Ceci garantit que les prédictions respectent les exigences métier même lorsque les données historiques sont insuffisantes.

Min Value Factor : Lors de l’utilisation de contraintes de valeur minimale, ce facteur multiplie la valeur minimale dans le calcul de secours. Par défaut 1.0. Par exemple, avec une valeur minimale de 100 et un facteur de 1.2, le secours serait 120. Cela permet des ajustements proportionnels selon le seuil minimum.

Exemples

Exemple 1 : Prédiction des délais de livraison dans le e-commerce

Scénario : Un détaillant en ligne souhaite prédire les délais de livraison pour les nouvelles commandes basées sur les modèles historiques de livraison, en prenant en compte la localisation du client et le mode d’expédition pour fixer des attentes précises.

Paramètres :

  • New Attribute Name : Predicted_Delivery_Days
  • Algorithm Name : Regional_Shipping_Model
  • Input Attribute Names : Customer_Region, Shipping_Method
  • Dependent Attribute Name : Actual_Delivery_Days
  • Min Value Attribute Name : Current_Days_In_Transit
  • Filter : Order_Date > 30 days ago
  • Aggregate Function : Average
  • Min Cases : 5
  • Max Cases : 20
  • Min Value Constant : 1
  • Min Value Factor : 1.1

Résultat : Crée trois nouveaux attributs de cas :

  • Predicted_Delivery_Days : Nombre estimé de jours pour la livraison (ex. : 5,3 jours)
  • Predicted_Delivery_Days - Confidence : Score de confiance entre 0 et 1 (ex. : 0,75)
  • Predicted_Delivery_Days - Algorithm : Algorithme utilisé (« Regional_Shipping_Model » ou « Fixed » pour le secours)

Pour une nouvelle commande de la Région_Ouest utilisant Express_Shipping, l’enrichissement trouve 15 commandes historiques similaires avec une moyenne de 3,2 jours, produisant une prédiction de 3,2 jours avec une confiance de 0,75.

Aperçu : La prédiction aide à fixer des attentes réalistes de livraison, identifier les commandes susceptibles d’être retardées, et optimiser le choix du mode d’expédition basé sur les délais prédits versus promis.

Exemple 2 : Prévision des montants facturés en achat

Scénario : Un service achat doit prédire les montants finaux des factures à partir des détails initiaux des demandes d’achat pour améliorer la planification budgétaire et détecter précocement les dépassements de coûts.

Paramètres :

  • New Attribute Name : Predicted_Invoice_Amount
  • Input Attribute Names : Vendor_Name, Material_Category
  • Dependent Attribute Name : Final_Invoice_Amount
  • Min Value Attribute Name : Initial_PO_Amount
  • Aggregate Function : Median
  • Min Cases : 3
  • Max Cases : 15
  • Min Value Constant : 0
  • Min Value Factor : 1.05

Résultat : Crée des attributs de prédiction montrant le montant final estimé. Pour une nouvelle commande de 10 000 $ auprès de Vendor_A pour Raw_Materials :

  • Predicted_Invoice_Amount : 10 750 $ (basé sur une médiane historique de 7,5 % au-dessus du montant PO)
  • Confiance : 0,6 (sur 9 cas historiques)
  • Algorithme : Prédiction basée sur la médiane

Aperçu : Permet une gestion budgétaire proactive, identifie précocement les fournisseurs avec des dépassements constants, et améliore la précision de la planification financière.

Exemple 3 : Estimation des scores de qualité en fabrication

Scénario : Une usine souhaite prédire les scores de qualité pour des produits en cours de production basés sur les premiers paramètres du processus, permettant une intervention précoce en cas de risques qualité.

Paramètres :

  • New Attribute Name : Predicted_Quality_Score
  • Input Attribute Names : Production_Line, Product_Type, Shift
  • Dependent Attribute Name : Final_Quality_Score
  • Filter : Production_Date > 60 days ago AND Quality_Score IS NOT NULL
  • Aggregate Function : Average
  • Min Cases : 10
  • Max Cases : 30

Résultat : Pour des produits en production sur Line_A fabriquant Product_Type_X pendant Day_Shift :

  • Predicted_Quality_Score : 92,5 (échelle 0-100)
  • Confiance : 0,87 (sur 26 cas historiques similaires)
  • Algorithme : Prédiction standard

Aperçu : Permet aux équipes qualité de cibler les inspections sur les produits à faible score prédit, d’ajuster les paramètres du processus de façon proactive, et de réduire les coûts de retouche liés à la qualité.

Exemple 4 : Prédiction de la durée de séjour en milieu hospitalier

Scénario : Un hôpital souhaite prédire la durée de séjour des patients en fonction du diagnostic à l’admission et des premières évaluations, pour optimiser la gestion des lits et l’allocation des ressources.

Paramètres :

  • New Attribute Name : Predicted_LOS_Days
  • Input Attribute Names : Admission_Diagnosis, Patient_Age_Group, Admission_Type
  • Dependent Attribute Name : Actual_LOS_Days
  • Min Value Attribute Name : Current_LOS_Days
  • Aggregate Function : Median
  • Min Cases : 8
  • Max Cases : 25
  • Min Value Constant : 1
  • Min Value Factor : 1.0

Résultat : Pour un patient âgé nouvellement admis pour une pneumonie via admission d’urgence actuellement au 2e jour :

  • Predicted_LOS_Days : 7 jours (médiane des cas similaires)
  • Confiance : 0,72
  • Algorithme : Si moins de cas historiques minimum, affiche « Fixed » avec durée actuelle + 1 jour

Aperçu : Permet une meilleure planification de la capacité en lits, aide à identifier les patients susceptibles d’un séjour prolongé nécessitant un soutien supplémentaire, et améliore la planification des sorties.

Exemple 5 : Prévision des coûts de projet en construction

Scénario : Une entreprise de construction doit prédire les coûts finaux des projets basés sur les caractéristiques initiales afin d’améliorer l’exactitude des offres et d’identifier les projets à risque de dépassement.

Paramètres :

  • New Attribute Name : Predicted_Total_Cost
  • Input Attribute Names : Project_Type, Client_Industry, Project_Region
  • Dependent Attribute Name : Final_Project_Cost
  • Min Value Attribute Name : Current_Spent_Amount
  • Filter : Project_Start_Date > 365 days ago
  • Aggregate Function : Average
  • Min Cases : 4
  • Max Cases : 12
  • Min Value Constant : 50000
  • Min Value Factor : 1.15

Résultat : Pour un nouveau projet de bâtiment commercial dans Region_North pour un client retail avec 2 M$ déjà dépensés :

  • Predicted_Total_Cost : 3 500 000 $ (basé sur 8 projets historiques similaires)
  • Confiance : 0,67
  • Algorithme : Affiche la méthode de calcul utilisée

Si les données historiques sont insuffisantes, utilise un secours : 2 000 000 \(× 1,15 + 50 000\) = 2 350 000 $

Aperçu : Améliore la rentabilité des projets par une prédiction précise des coûts, permet une intervention précoce sur les projets en dépassement, et supporte des stratégies d’offre plus compétitives et réalistes.

Sortie

L’enrichissement Predict Value crée trois attributs de cas liés qui fonctionnent ensemble pour fournir une information complète de prédiction :

Attribut principal de prédiction : Nommé selon votre paramètre "New Attribute Name", cet attribut contient la valeur numérique prédite. Le type de données est toujours Double (nombre décimal) afin d’accueillir des prédictions précises. Les valeurs sont calculées en fonction des modèles historiques ou des contraintes de valeur minimale le cas échéant.

Attribut du score de confiance : Créé automatiquement avec le nom "[New Attribute Name] - Confidence", cet attribut contient un score de confiance entre 0 et 1 indiquant la fiabilité de la prédiction. Des valeurs plus élevées signifient que davantage de cas historiques ont été disponibles pour la prédiction. La confiance est calculée comme : (nombre de cas utilisés) / (maximum cases + 1).

Attribut de suivi de l’algorithme : Créé automatiquement avec le nom "[New Attribute Name] - Algorithm", cet attribut chaîne indique la méthode utilisée pour chaque prédiction. Il contiendra soit votre nom d’algorithme personnalisé (si spécifié) pour les prédictions standards, soit « Fixed » lorsque des calculs de secours basés sur les valeurs minimales ont été utilisés.

Ces attributs s’intègrent parfaitement avec les autres fonctionnalités de mindzieStudio - utilisez-les dans des filtres pour identifier les prédictions à haute confiance, dans des calculatrices pour comparer les valeurs prévues et réelles, ou dans des visualisations pour analyser les modèles d’exactitude des prédictions.

Voir aussi

  • Categorize Attribute Values - Regrouper les valeurs prédites continues en catégories
  • Representative Case Attribute - Approche alternative utilisant les valeurs les plus fréquentes
  • Python - Créer des modèles de prédiction personnalisés avec apprentissage machine
  • Add - Combiner plusieurs prédictions ou ajouter des ajustements
  • Multiply - Appliquer des facteurs d’échelle aux prédictions

Cette documentation fait partie de la plateforme de process mining mindzie Studio.