Convertir en Attributs de Cas
Vue d'ensemble
L'enrichissement Convertir en Attributs de Cas est un opérateur d'optimisation de données intelligent qui identifie automatiquement et convertit les attributs au niveau des événements en attributs au niveau des cas lorsque leurs valeurs restent constantes tout au long de chaque cas. Cet outil puissant de nettoyage analyse l'ensemble de votre jeu de données pour trouver des attributs d'événements qui ne changent jamais à l'intérieur d'un cas — tels que les identifiants clients, les catégories de produits ou les codes régionaux qui sont inutilement répétés au niveau des événements — et les élève en attributs de cas pour améliorer les performances et obtenir des modèles de données plus propres.
Cet enrichissement résout un problème courant de qualité des données en process mining où les systèmes sources exportent des données redondantes au niveau des événements, créant des jeux de données gonflés et compliquant l'analyse. En détectant et convertissant automatiquement ces attributs stables au niveau des cas, l'enrichissement réduit la redondance des données, améliore les performances des requêtes et crée une structure de données plus logique. Le processus de conversion est complètement automatique et ne nécessite aucune configuration, ce qui en fait une étape essentielle de la préparation des données pouvant réduire significativement la taille des jeux de données tout en maintenant toute l'intégrité des informations.
Usages courants
- Optimiser les données ERP importées où les informations client sont répétées dans chaque événement mais ne changent jamais au sein d'une commande
- Convertir des attributs produits statiques comme la catégorie, la famille ou le type du niveau événement au niveau cas dans les processus de fabrication
- Élever des attributs projet fixes tels que le chef de projet, le budget ou le département dans les jeux de données de gestion de projet
- Déplacer des données démographiques patients constantes telles que la tranche d'âge, le type d'assurance ou le type d'admission au niveau cas dans les données de santé
- Convertir des attributs financiers stables comme le type de prêt, le taux d'intérêt ou le code agence dans les données de processus bancaires
- Nettoyer les données d'approvisionnement en déplaçant les informations fournisseur, numéros de contrat et conditions de paiement au niveau cas
- Optimiser les données logistiques en convertissant les propriétés des expéditions telles que le pays de destination, le niveau de service ou le transporteur en attributs de cas
Paramètres
Cet enrichissement fonctionne automatiquement sans nécessite aucune configuration. Il analyse tous les attributs d'événements présents dans votre jeu de données et détermine intelligemment lesquels peuvent être convertis en toute sécurité en attributs de cas sur la base de la cohérence des valeurs au sein de chaque cas.
Exemples
Exemple 1 : Optimisation des données de traitement des commandes
Scénario : Le système de traitement des commandes d'une entreprise e-commerce exporte des données où les informations client, les détails d'expédition et les propriétés des commandes sont inutilement répétées dans chaque événement, créant un jeu de données 60% plus volumineux que nécessaire.
Données d'événements avant enrichissement : | Case ID | Activity | Customer_Name | Customer_Region | Order_Priority | Product_Category | Timestamp | |---------|----------|---------------|-----------------|----------------|------------------|-----------| | ORD-001 | Create Order | John Smith | North America | High | Electronics | 2024-01-10 08:00 | | ORD-001 | Verify Payment | John Smith | North America | High | Electronics | 2024-01-10 08:15 | | ORD-001 | Pick Items | John Smith | North America | High | Electronics | 2024-01-10 09:00 | | ORD-001 | Ship Order | John Smith | North America | High | Electronics | 2024-01-10 14:00 | | ORD-002 | Create Order | Jane Doe | Europe | Normal | Clothing | 2024-01-10 08:30 | | ORD-002 | Verify Payment | Jane Doe | Europe | Normal | Clothing | 2024-01-10 08:45 |
Attributs de cas après enrichment : | Case ID | Customer_Name | Customer_Region | Order_Priority | Product_Category | |---------|---------------|-----------------|----------------|------------------| | ORD-001 | John Smith | North America | High | Electronics | | ORD-002 | Jane Doe | Europe | Normal | Clothing |
Données d'événements après enrichment : | Case ID | Activity | Timestamp | |---------|----------|-----------| | ORD-001 | Create Order | 2024-01-10 08:00 | | ORD-001 | Verify Payment | 2024-01-10 08:15 | | ORD-001 | Pick Items | 2024-01-10 09:00 | | ORD-001 | Ship Order | 2024-01-10 14:00 | | ORD-002 | Create Order | 2024-01-10 08:30 | | ORD-002 | Verify Payment | 2024-01-10 08:45 |
Résultat : L'enrichissement a identifié que Customer_Name, Customer_Region, Order_Priority et Product_Category ne changent jamais au sein de chaque cas et les a automatiquement convertis en attributs de cas. La table des événements est désormais 60% plus petite, ne contenant que les informations spécifiques aux événements essentielles.
Aperçu : Après conversion, les requêtes sur les tableaux de bord s'exécutent 3 fois plus vite grâce à la réduction du volume de données. Le filtrage au niveau cas des segments clients et des catégories de produits est désormais plus intuitif, et le modèle de données distingue clairement entre propriétés de cas et détails d'événements, facilitant leur compréhension et leur exploitation par les analystes.
Exemple 2 : Optimisation du parcours patient hospitalier
Scénario : Le système de gestion des patients d'un hôpital exporte des données d'admission où les données démographiques patients, les informations d'assurance et les classifications médicales sont répétées dans chaque événement de traitement, rendant le jeu de données inutilement complexe et lent à analyser.
Données d'événements avant enrichissement : | Case ID | Activity | Patient_Age_Group | Insurance_Type | Admission_Type | Department | Diagnosis_Code | Resource | |---------|----------|------------------|----------------|----------------|------------|---------------|----------| | PAT-501 | Registration | 45-60 | Private | Emergency | ER | CARD-01 | Nurse Smith | | PAT-501 | Triage | 45-60 | Private | Emergency | ER | CARD-01 | Dr. Jones | | PAT-501 | Treatment | 45-60 | Private | Emergency | ER | CARD-01 | Dr. Jones | | PAT-501 | Discharge | 45-60 | Private | Emergency | ER | CARD-01 | Nurse Brown |
Après enrichment :
Attributs de cas : | Case ID | Patient_Age_Group | Insurance_Type | Admission_Type | Diagnosis_Code | |---------|------------------|----------------|----------------|---------------| | PAT-501 | 45-60 | Private | Emergency | CARD-01 |
Attributs d'événements (valeurs variables conservées) : | Case ID | Activity | Department | Resource | |---------|----------|------------|----------| | PAT-501 | Registration | ER | Nurse Smith | | PAT-501 | Triage | ER | Dr. Jones | | PAT-501 | Treatment | ER | Dr. Jones | | PAT-501 | Discharge | ER | Nurse Brown |
Résultat : Les données démographiques patient et les informations médicales fixes sont déplacées au niveau cas, tandis que Department et Resource restent des attributs d'événements car ils peuvent varier (les patients peuvent être déplacés entre services). Le jeu de données est désormais 40% plus petit et plus logiquement organisé.
Aperçu : La structure de données optimisée permet une analyse plus rapide des cohortes de patients, avec des filtres instantanés sur le type d'assurance et la tranche d'âge au niveau cas. Le process mining basé sur les diagnostics est plus efficace, et l'hôpital peut rapidement identifier les schémas de traitement pour certains segments de patients sans traiter de données d'événements redondantes.
Exemple 3 : Nettoyage des données de processus de fabrication
Scénario : Le système MES d'une usine de fabrication exporte des données de production où les spécifications produit, les détails de commandes et normes de qualité sont dupliqués à chaque étape de production, provoquant des problèmes de performance dans l'analyse des processus.
Avant enrichissement : Chaque événement de production contient : Product_ID, Product_Type, Material_Grade, Quality_Standard, Customer_Code, Order_Size, Target_Date
Après enrichment :
- Convertis en attributs de cas : Product_ID, Product_Type, Material_Grade, Quality_Standard, Customer_Code, Order_Size, Target_Date (tous constants dans chaque cycle de production)
- Attributs d'événements restants : Activity, Timestamp, Machine_ID, Operator, Temperature, Pressure (valeurs variables)
Résultat : Sept attributs qui ne changent jamais dans un cycle de production sont automatiquement élevés au niveau cas. La table d'événements se concentre désormais uniquement sur les détails d'exécution du processus qui varient selon les activités.
Aperçu : La conversion a réduit la taille du jeu de données de 65%, permettant une surveillance en temps réel du processus, auparavant impossible à cause du volume des données. L'analyse qualité par type de produit et grade de matériel est simplifiée grâce aux filtres niveau cas, et l'usine peut suivre efficacement les KPI sur différentes catégories de produits.
Exemple 4 : Simplification du traitement des prêts financiers
Scénario : Le système de traitement des prêts d'une banque exporte des données de candidature où les paramètres de prêt, profils clients et classifications réglementaires sont répétés à chaque étape du workflow, rendant les rapports de conformité et l'optimisation du processus plus complexes.
Exemple de données d'événements (avant) : Chaque événement inclut : Loan_Type, Interest_Rate, Loan_Amount, Credit_Score_Range, Branch, Region, Product_Code, Regulatory_Class, Customer_Segment
Après enrichment :
- Niveau cas : Tous les paramètres de prêt et classifications clients (9 attributs) déplacés à la table des cas
- Niveau événement : Seulement Activity, Timestamp, Approver, Decision, et Comments restent
Résultat : L'enrichissement a détecté que les paramètres de prêt et les informations clients ne changent jamais au cours du traitement et les a convertis en attributs de cas. La table d'événements est réduite aux informations essentielles du workflow.
Aperçu : Les rapports de conformité réglementaire, auparavant longs à générer, s'exécutent désormais en quelques minutes. La banque peut analyser instantanément les modèles d'approbation selon la tranche de score de crédit et le type de prêt avec les données niveau cas, et le process mining révèle les goulots d'étranglement spécifiques à certains segments clients sans surcharge due aux données répliquées.
Exemple 5 : Optimisation des données de chaîne logistique
Scénario : Le système de suivi d'une entreprise logistique enregistre les détails d'expédition à chaque point de scan, avec des propriétés fixes d'expédition comme le niveau de service, destination, catégorie de poids, et compte client répétées des millions de fois à travers les événements de suivi.
Avant enrichment : 500 000 expéditions × 15 points de scan × 8 attributs statiques = 60 millions de points de données redondants
Après enrichment :
- Attributs de cas : Service_Level, Origin_Country, Destination_Country, Weight_Class, Customer_Account, Declared_Value, Shipment_Type, Contract_ID
- Attributs d'événements : Activity (lieu du scan), Timestamp, Scanner_ID, Location_Code, Exception_Flag
Résultat : Huit propriétés d'expédition sont converties au niveau cas, stockées une seule fois par expédition au lieu d'être répétées à chaque scan. La table des événements est réduite de 70%, ne contenant que des informations de suivi dynamiques.
Aperçu : L'analyse des trajets par destination et niveau de service est désormais 10 fois plus rapide grâce aux requêtes niveau cas. La société peut identifier efficacement les schémas de livraison pour différents segments clients et optimiser les itinéraires selon les caractéristiques des expéditions sans traiter un volume massif de données dupliquées. La performance du suivi en temps réel s'est améliorée de manière spectaculaire, permettant des mises à jour live des tableaux de bord auparavant impossibles.
Résultat
L'enrichissement Convertir en Attributs de Cas modifie la structure de votre jeu de données en déplaçant intelligemment des attributs du niveau événement au niveau cas. L'enrichissement réalise une analyse complète pour identifier les attributs d'événements dont les valeurs ne changent jamais dans chaque cas, puis les convertit automatiquement en attributs de cas pour une organisation optimale des données.
Processus de conversion :
- Analyse toutes les colonnes des données au niveau événement sauf les colonnes système (Activity, Timestamp, Resource)
- Pour chaque attribut, vérifie si les valeurs restent constantes dans chaque cas du jeu de données
- Ne convertit que les attributs ayant des valeurs identiques sur tous les événements dans chaque cas
- Préserve les noms d'attributs et types de données originaux durant la conversion
- Maintient l'intégrité des données en utilisant la dernière valeur non nulle lorsqu'elle est présente
Attributs convertis :
- Attributs d'événements avec des valeurs constantes tout au long de chaque cas (identifiants clients, codes produits, catégories)
- Propriétés statiques répétées inutilement au niveau événement (régions, types, classifications)
- Données de référence qui appartiennent logiquement au niveau cas (numéros de contrat, codes projet, propriétés de commande)
Attributs qui restent au niveau événement :
- Colonnes système (Activity, Timestamp, Start Time, Resource, Expected Order)
- Attributs aux valeurs variables dans les cas (ressources différentes, statuts changeants, mesures)
- Attributs système cachés ne devant pas être modifiés
- Attributs déjà présents au niveau cas avec le même nom
Impact sur votre jeu de données : L'enrichissement crée une structure de données plus propre et efficace où chaque information existe à son niveau logique. Le filtrage et l'agrégation au niveau cas deviennent plus intuitifs car les propriétés de cas sont bien organisées. Les performances des requêtes s'améliorent significativement grâce à la réduction de la redondance des données, et la taille des jeux de données diminue typiquement de 30 à 70% selon le volume de données d'événements redondantes.
Les attributs convertis s'intègrent parfaitement avec toutes les fonctionnalités mindzieStudio. Les filtres peuvent interroger efficacement les attributs de cas sans scanner les données événementielles, les calculateurs peuvent référencer directement les attributs cas sans fonctions d'agrégation, et les autres enrichissements bénéficient de cette structure optimisée. La découverte de processus et la vérification de conformité fonctionnent plus efficacement sur les données événements simplifiées, tout en gardant un accès complet aux propriétés de cas lorsque nécessaire.
Cette documentation fait partie de la plateforme de process mining mindzie Studio.