In Case-Attribute umwandeln
Überblick
Die Anreicherung "Convert to Case Attributes" ist ein intelligenter Datenoptimierungsoperator, der automatisch Ereignisattribute erkennt und in Fallattribute umwandelt, wenn ihre Werte innerhalb jedes Falls konstant bleiben. Dieses leistungsstarke Bereinigungstool analysiert Ihren gesamten Datensatz, um Ereignisattribute zu finden, die innerhalb eines Falls nie wechseln – wie Kunden-IDs, Produktkategorien oder Regionsschlüssel, die auf Ereignisebene unnötig wiederholt werden – und hebt sie für verbesserte Leistung und sauberere Datenmodelle auf Fallattribute an.
Diese Anreicherung löst ein häufiges Problem der Datenqualität im Process Mining, bei dem Quellsysteme redundante Daten auf Ereignisebene exportieren, was zu aufgeblähten Datensätzen und erschwerter Analyse führt. Durch die automatische Erkennung und Umwandlung dieser stabilen Attribute auf die Fallebene reduziert die Anreicherung Datenredundanzen, verbessert die Abfrageleistung und schafft eine logischere Datenstruktur. Der Umwandlungsprozess ist vollkommen automatisiert und erfordert keine Konfiguration, was ihn zu einem unverzichtbaren ersten Schritt in der Datenvorbereitung macht, der die Datensatzgröße erheblich verringert und gleichzeitig die Informationsintegrität bewahrt.
Anwendungsgebiete
- Optimierung importierter ERP-Daten, bei denen Kundeninformationen in jedem Ereignis wiederholt werden, innerhalb einer Bestellung jedoch nie wechseln
- Umwandlung statischer Produktattribute wie Kategorie, Familie oder Typ von der Ereignis- auf die Fallebene in Fertigungsprozessen
- Anhebung fester Projektattribute wie Projektleiter, Budget oder Abteilung in Projektmanagement-Datensätzen
- Verschiebung konstanter Patientendemografien wie Altersgruppe, Versicherungstyp oder Aufnahmetyp auf die Fallebene in Gesundheitsdaten
- Umwandlung stabiler Finanzattribute wie Darlehensart, Zinssatz oder Filialcode in Bankprozessen
- Bereinigung von Beschaffungsdaten durch Verschieben von Lieferanteninformationen, Vertragsnummern und Zahlungsbedingungen auf die Fallebene
- Optimierung von Logistikdaten durch Umwandlung von Versandmerkmalen wie Zielland, Servicelevel oder Spediteur in Fallattribute
Einstellungen
Diese Anreicherung arbeitet automatisch, ohne dass eine Konfiguration erforderlich ist. Sie analysiert alle Ereignisattribute in Ihrem Datensatz und bestimmt intelligent, welche sicher in Fallattribute umgewandelt werden können, basierend auf Wertkonstanz innerhalb jedes Falls.
Beispiele
Beispiel 1: Optimierung von Bestellverarbeitungsdaten
Szenario: Das Bestellverarbeitungssystem eines E-Commerce-Unternehmens exportiert Daten, bei denen Kundeninformationen, Versanddetails und Bestelleigenschaften unnötig in jedem Ereignis wiederholt werden, wodurch der Datensatz 60 % größer als notwendig ist.
Ereignisdaten vor der Anreicherung: | Case ID | Activity | Customer_Name | Customer_Region | Order_Priority | Product_Category | Timestamp | |---------|----------|---------------|-----------------|----------------|------------------|-----------| | ORD-001 | Create Order | John Smith | Nordamerika | Hoch | Elektronik | 2024-01-10 08:00 | | ORD-001 | Verify Payment | John Smith | Nordamerika | Hoch | Elektronik | 2024-01-10 08:15 | | ORD-001 | Pick Items | John Smith | Nordamerika | Hoch | Elektronik | 2024-01-10 09:00 | | ORD-001 | Ship Order | John Smith | Nordamerika | Hoch | Elektronik | 2024-01-10 14:00 | | ORD-002 | Create Order | Jane Doe | Europa | Normal | Kleidung | 2024-01-10 08:30 | | ORD-002 | Verify Payment | Jane Doe | Europa | Normal | Kleidung | 2024-01-10 08:45 |
Fallattribute nach der Anreicherung: | Case ID | Customer_Name | Customer_Region | Order_Priority | Product_Category | |---------|---------------|-----------------|----------------|------------------| | ORD-001 | John Smith | Nordamerika | Hoch | Elektronik | | ORD-002 | Jane Doe | Europa | Normal | Kleidung |
Ereignisdaten nach der Anreicherung: | Case ID | Activity | Timestamp | |---------|----------|-----------| | ORD-001 | Create Order | 2024-01-10 08:00 | | ORD-001 | Verify Payment | 2024-01-10 08:15 | | ORD-001 | Pick Items | 2024-01-10 09:00 | | ORD-001 | Ship Order | 2024-01-10 14:00 | | ORD-002 | Create Order | 2024-01-10 08:30 | | ORD-002 | Verify Payment | 2024-01-10 08:45 |
Ergebnis: Die Anreicherung hat erkannt, dass Customer_Name, Customer_Region, Order_Priority und Product_Category innerhalb jedes Falls nie wechseln, und hat sie automatisch zu Fallattributen umgewandelt. Die Ereignistabelle ist jetzt 60 % kleiner und enthält nur noch die wesentlichen ereignisspezifischen Informationen.
Erkenntnisse: Nach der Umwandlung laufen Dashboard-Abfragen 3x schneller dank des reduzierten Datenvolumens. Fallbasierte Filter für Kundensegmente und Produktkategorien sind jetzt intuitiver, und das Datenmodell unterscheidet klar zwischen Falleigenschaften und Ereignisdetails, was die Datenverständnis und -verarbeitung für Analysten erleichtert.
Beispiel 2: Optimierung des Patientenverlaufs im Gesundheitswesen
Szenario: Das Patientverwaltungssystem eines Krankenhauses exportiert Aufnahmedaten, bei denen Patientendemografie, Versicherungsinformationen und medizinische Klassifikationen in jedem Behandlungsevent wiederholt werden, was den Datensatz unnötig komplex und langsam analysierbar macht.
Ereignisdaten vor der Anreicherung: | Case ID | Activity | Patient_Age_Group | Insurance_Type | Admission_Type | Department | Diagnosis_Code | Resource | |---------|----------|------------------|----------------|----------------|------------|---------------|----------| | PAT-501 | Registrierung | 45-60 | Privat | Notfall | Notaufnahme | CARD-01 | Schwester Smith | | PAT-501 | Triage | 45-60 | Privat | Notfall | Notaufnahme | CARD-01 | Dr. Jones | | PAT-501 | Behandlung | 45-60 | Privat | Notfall | Notaufnahme | CARD-01 | Dr. Jones | | PAT-501 | Entlassung | 45-60 | Privat | Notfall | Notaufnahme | CARD-01 | Schwester Brown |
Nach der Anreicherung:
Fallattribute: | Case ID | Patient_Age_Group | Insurance_Type | Admission_Type | Diagnosis_Code | |---------|------------------|----------------|----------------|---------------| | PAT-501 | 45-60 | Privat | Notfall | CARD-01 |
Ereignisattribute (wertevariieren verbleiben): | Case ID | Activity | Department | Resource | |---------|----------|------------|----------| | PAT-501 | Registrierung | Notaufnahme | Schwester Smith | | PAT-501 | Triage | Notaufnahme | Dr. Jones | | PAT-501 | Behandlung | Notaufnahme | Dr. Jones | | PAT-501 | Entlassung | Notaufnahme | Schwester Brown |
Ergebnis: Patientendemografie und feste medizinische Informationen werden auf die Fallebene verschoben, während Department und Resource als Ereignisattribute bleiben, da sie variieren können (Patienten können Abteilungen wechseln). Der Datensatz ist jetzt 40 % kleiner und logisch strukturierter.
Erkenntnisse: Die optimierte Datenstruktur ermöglicht schnellere Analysen von Patientengruppen, mit sofortigen Filtern für Versicherungstyp und Altersgruppen auf Fallbasis. Diagnosebasierte Process Mining-Analysen sind effizienter, und das Krankenhaus kann Behandlungsmuster spezieller Patientengruppen schnell identifizieren, ohne redundante Ereignisdaten zu verarbeiten.
Beispiel 3: Bereinigung von Fertigungsprozessdaten
Szenario: Das MES-System einer Fertigungsanlage exportiert Produktionsdaten, bei denen Produktspezifikationen, Bestelldetails und Qualitätsstandards in jedem Produktionsschritt dupliziert werden, was zu Performance-Problemen bei der Prozessanalyse führt.
Vor der Anreicherung: Jedes Produktionsevent enthält: Product_ID, Product_Type, Material_Grade, Quality_Standard, Customer_Code, Order_Size, Target_Date
Nach der Anreicherung:
- Zu Case Attributes konvertiert: Product_ID, Product_Type, Material_Grade, Quality_Standard, Customer_Code, Order_Size, Target_Date (alle innerhalb eines Produktionslaufs konstant)
- Verbleibende Ereignisattribute: Activity, Timestamp, Machine_ID, Operator, Temperature, Pressure (variable Werte)
Ergebnis: Sieben Attribute, die innerhalb eines Produktionslaufs nie wechseln, werden automatisch auf Fallniveau angehoben. Die Ereignistabelle konzentriert sich jetzt ausschließlich auf process-relevante Details, die zwischen Aktivitäten variieren.
Erkenntnisse: Die Umwandlung reduzierte die Datensatzgröße um 65 % und ermöglicht Echtzeitprozessüberwachung, die zuvor wegen des Datenvolumens unmöglich war. Qualitätsanalysen nach Produkttyp und Materialgrad sind jetzt mit Fallfiltern einfach möglich, und die Anlage kann KPIs über verschiedene Produktkategorien hinweg effizient überwachen.
Beispiel 4: Vereinfachung der Kreditbearbeitung im Finanzwesen
Szenario: Das Kreditbearbeitungssystem einer Bank exportiert Antragsdaten, bei denen Darlehensparameter, Kundenprofile und regulatorische Klassifikationen in jedem Workflow-Schritt wiederholt werden, was die Compliance-Berichterstattung und Prozessoptimierung erschwert.
Beispielhafte Ereignisdaten (vorher): Jedes Ereignis enthält: Loan_Type, Interest_Rate, Loan_Amount, Credit_Score_Range, Branch, Region, Product_Code, Regulatory_Class, Customer_Segment
Nach der Anreicherung:
- Fallebene: Alle Darlehensparameter und Kundenklassifikationen (9 Attribute) verschoben in die Falltabelle
- Ereignisebene: Nur Activity, Timestamp, Approver, Decision und Comments verbleiben
Ergebnis: Die Anreicherung erkannte, dass Darlehensparameter und Kundeninformationen während des Antragsprozesses nie wechseln, und konvertierte sie in Fallattribute. Die Ereignistabelle ist auf die wesentlichen Workflow-Informationen reduziert.
Erkenntnisse: Regulatorische Compliance-Berichte, die früher Stunden dauerten, laufen jetzt in Minuten. Die Bank kann Genehmigungsmuster nach Kredit-Score-Range und Darlehensart sofort mit Fallattributen analysieren, und Process Mining deckt Engpässe in bestimmten Kundensegmenten ohne redundante Ereignisdaten auf.
Beispiel 5: Optimierung von Lieferketten-Daten
Szenario: Das Tracking-System eines Logistikunternehmens erfasst Sendungsdetails an jedem Scanpunkt, wobei feste Sendungseigenschaften wie Servicelevel, Ziel, Gewichtsklasse und Kundenkonto millionenfach über Tracking-Ereignisse wiederholt werden.
Vor der Anreicherung: 500.000 Sendungen × 15 Scanpunkte × 8 statische Attribute = 60 Millionen redundante Datenpunkte
Nach der Anreicherung:
- Fallattribute: Service_Level, Origin_Country, Destination_Country, Weight_Class, Customer_Account, Declared_Value, Shipment_Type, Contract_ID
- Ereignisattribute: Activity (Scan Location), Timestamp, Scanner_ID, Location_Code, Exception_Flag
Ergebnis: Acht Sendungseigenschaften werden auf Folderebene verschoben und einmal pro Sendung gespeichert, statt bei jedem Scan mehrfach. Die Ereignistabellengröße reduziert sich um 70 % und enthält nur dynamische Tracking-Informationen.
Erkenntnisse: Routenanalysen nach Ziel und Servicelevel laufen dank Fallattribut-Abfragen jetzt 10x schneller. Das Unternehmen identifiziert effizient Zustellmuster für unterschiedliche Kundensegmente und optimiert Routen basierend auf Sendungseigenschaften ohne massenhafte Duplikate. Die Echtzeit-Tracking-Performance verbesserte sich deutlich, was bislang unmögliche Live-Dashboard-Updates ermöglicht.
Ausgabe
Die Anreicherung "Convert to Case Attributes" verändert die Struktur Ihres Datensatzes, indem sie Attribute intelligent von der Ereignis- auf die Fallebene verschiebt. Sie führt eine umfassende Analyse durch, um Ereignisattribute zu identifizieren, deren Werte innerhalb jedes Falls konstant bleiben, und wandelt diese dann automatisch in Fallattribute um, um eine optimale Datenorganisation zu gewährleisten.
Umwandlungsprozess:
- Analysiert alle Daten-Spalten auf Ereignisebene außer Systemspalten (Activity, Timestamp, Resource)
- Prüft für jedes Attribut, ob die Werte innerhalb jedes Falls im Datensatz konstant sind
- Konvertiert nur Attribute, die bei allen Ereignissen innerhalb eines Falls identische Werte haben
- Bewahrt die originalen Attributnamen und Datentypen bei der Umwandlung
- Erhält die Datenintegrität, indem der letzte nicht-leere Wert verwendet wird, falls vorhanden
Konvertierte Attribute:
- Ereignisattribute mit konstanten Werten in jedem Fall (Kunden-IDs, Produktcodes, Kategorien)
- Statische Eigenschaften, die auf Ereignisebene unnötig wiederholt werden (Regionen, Typen, Klassifikationen)
- Referenzdaten, die logisch auf Fallebene gehören (Vertragsnummern, Projektcodes, Bestelleigenschaften)
Verbleibende Attribute auf Ereignisebene:
- Systemspalten (Activity, Timestamp, Start Time, Resource, Expected Order)
- Attribute mit variierenden Werten innerhalb von Fällen (verschiedene Ressourcen, wechselnde Status, Messwerte)
- Versteckte Systemattribute, die nicht verändert werden sollen
- Attribute, die bereits mit demselben Namen auf der Fallebene existieren
Auswirkungen auf Ihren Datensatz: Die Anreicherung schafft eine sauberere und effizientere Datenstruktur, bei der jede Information auf der logischen Ebene vorhanden ist. Die fallbasierte Filterung und Aggregation werden intuitiver, weil Fallattribute angemessen organisiert sind. Die Abfrageleistung verbessert sich deutlich durch reduzierte Datenredundanz, und die Datensatzgröße verringert sich typischerweise um 30–70 %, abhängig von der Menge redundanter Ereignisdaten.
Die konvertierten Attribute integrieren sich nahtlos in alle mindzieStudio-Funktionen. Filter können effizient Fallattribute abfragen, ohne Ereignisdaten durchsuchen zu müssen, Kalkulatoren können direkt Fallattribute referenzieren ohne Aggregationsfunktionen, und weitere Anreicherungen profitieren von der optimierten Datenstruktur. Prozessentdeckung und Konformitätsprüfung arbeiten effizienter auf den gestrafften Ereignisdaten, während der volle Zugriff auf Falleigenschaften bei Bedarf erhalten bleibt.
Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.