Leere Attribute ausblenden
Übersicht
Die Bereicherung "Leere Attribute ausblenden" ist ein automatischer Datenbereinigungsoperator, der alle Attribute (Spalten) identifiziert und entfernt, die in Ihrem gesamten Datensatz keine Daten enthalten. Dieses leistungsstarke Bereinigungstool durchsucht sowohl Fall- als auch Ereignisattribute und blendet automatisch alle Spalten aus, bei denen jede einzelne Zeile null- oder leere Werte enthält. Durch das Entfernen dieser leeren Spalten vereinfacht die Bereicherung die Ansicht Ihres Datensatzes erheblich, reduziert visuelles Durcheinander in Analysetools und verbessert die Leistung bei der Arbeit mit großen Datensätzen.
Diese Bereicherung ist besonders wertvoll beim Import von Daten aus Unternehmenssystemen, die feste Schemata mit vielen optionalen Feldern exportieren, oder bei der Arbeit mit Datensätzen, die mehrere Transformationen durchlaufen haben, bei denen einige Attribute obsolet werden. Im Gegensatz zur manuellen Spaltenentfernung, die jede leere Spalte einzeln identifizieren muss, führt diese Bereicherung eine umfassende Überprüfung Ihres gesamten Datensatzes in einem einzigen Vorgang durch. Die Bereicherung behält alle Spalten bei, die mindestens einen Nicht-Null-Wert enthalten, wodurch keine potenziell nützlichen Daten verloren gehen und gleichzeitig die Sauberkeit und Benutzerfreundlichkeit Ihres Process-Mining-Arbeitsbereichs maximiert wird.
Häufige Anwendungsfälle
- Bereinigung importierter Datensätze aus ERP-Systemen, die Hunderte optionale Felder ohne befüllte Daten enthalten
- Vereinfachung der Datensatzansicht nach Filtervorgängen, die einige Attribute vollständig leer lassen können
- Reduzierung visuellen Durcheinanders in den Fall- und Ereignisattribut-Panels, um sich auf aussagekräftige Daten zu konzentrieren
- Verbesserung der Leistung und Reduzierung des Speicherverbrauchs bei der Arbeit mit breiten Datensätzen mit vielen ungenutzten Spalten
- Vorbereitung von Datensätzen für den Export oder die Weitergabe durch Entfernung irrelevanter leerer Spalten
- Bereinigung nach Daten-Transformationen, die mehrere Attribute in neue berechnete Felder konsolidieren
- Straffung der Conformance-Prüfung durch Entfernen von Attributen, die keinen analytischen Wert bieten
Einstellungen
Diese Bereicherung arbeitet automatisch und erfordert keine Konfiguration. Sie durchsucht alle nicht berechneten und nicht ausgeblendeten Attribute in Ihrem Datensatz und entfernt nur solche, die über alle Fälle und Ereignisse hinweg vollständig leer sind.
Beispiele
Beispiel 1: Bereinigung von ERP-System-Exporten
Szenario: Ein Fertigungsunternehmen exportiert Auftragsdaten aus SAP mit über 200 Standardfeldern, verwendet aber in ihrer speziellen Implementierung nur etwa 60 Felder, sodass über 140 Spalten komplett leer sind und die Analyse erschweren.
Vor der Bereicherung: Datensatz enthält insgesamt 215 Attribute, darunter:
- Fallattribute: 125 Spalten (75 leer)
- Ereignisattribute: 90 Spalten (65 leer)
- Beispiele leerer Spalten: Legacy_System_ID, Deprecated_Cost_Center, Old_Warehouse_Code, Custom_Field_1 bis Custom_Field_50
Nach der Bereicherung: Datensatz auf 75 aussagekräftige Attribute reduziert:
- Fallattribute: 50 Spalten (alle enthalten Daten)
- Ereignisattribute: 25 Spalten (alle enthalten Daten)
- Alle leeren Spalten automatisch ausgeblendet
Ergebnis: Die Bereicherung entfernte 140 leere Spalten und behielt alle 75 Spalten, die mindestens einen Wert enthielten. Die Datensatzansicht fokussiert sich nun nur noch auf Attribute mit tatsächlichen Daten, was Navigation und Analyse deutlich erleichtert.
Erkenntnisse: Nach der Bereinigung konnten Analysten schnell die relevanten Attribute für Process Mining identifizieren. Die vereinfachte Ansicht zeigte, dass die Auftragsbearbeitung tatsächlich nur 12 Schlüsselattribute für Entscheidungen enthielt, die zuvor zwischen Hunderten leerer Felder verborgen waren. Die Leistung beim Laden des Datensatzes verbesserte sich um 40 % durch reduzierten Speicherbedarf.
Beispiel 2: Bereinigung nach Filterung im Gesundheitswesen
Szenario: Ein Krankenhaus filtert seinen Patiententherapie-Datensatz, um nur Notaufnahmefälle zu analysieren, wodurch viele spezialisierte Stationsattribute vollständig leer werden, da Notfälle diese Felder nicht nutzen.
Vor der Bereicherung: Nach Filterung auf Notaufnahme-Fälle:
- Gesamtanzahl Attribute: 180
- Befüllte Attribute: Emergency_Triage_Level, Emergency_Wait_Time, Emergency_Treatment
- Leere Attribute: ICU_Ventilator_Settings, Surgery_Type, Rehabilitation_Plan, Oncology_Stage und 85 weitere spezialisierte Abteilungsfelder
Nach der Bereicherung:
- Sichtbare Gesamtattribute: 92
- Alle Attribute enthalten nun relevante Notaufnahmedaten
- 88 leere spezialisierte Abteilungsattribute ausgeblendet
Ergebnis: Die Bereicherung identifizierte automatisch alle Attribute, die nach Anwendung des Notaufnahmefilters leer geworden waren, und blendete sie aus. Die verbleibenden Attribute enthalten Daten, die für Notfälle relevant sind.
Erkenntnisse: Der bereinigte Datensatz ermöglichte Notfallmanagern, sich auf ihre spezifischen KPIs zu konzentrieren, ohne von irrelevanten Feldern abgelenkt zu werden. Die Analysezeit verringerte sich um 60 %, da das Personal nicht mehr durch leere Spalten scrollen musste, um relevante Daten zu finden.
Beispiel 3: Konsolidierung von Finanzprozessen
Szenario: Eine Bank fasst Rechnungsverarbeitungsdaten aus drei unterschiedlichen Systemen mit einzigartigen Feldstrukturen zusammen, wobei viele systemspezifische Attribute für Fälle aus anderen Systemen leer bleiben.
Vor der Bereicherung: Zusammengeführter Datensatz mit 340 Attributen:
- Gemeinsame Felder (von allen Systemen genutzt): 45 Attribute
- System-A-spezifische Felder: 95 Attribute (leer für System B und C Fälle)
- System-B-spezifische Felder: 110 Attribute (leer für System A und C Fälle)
- System-C-spezifische Felder: 90 Attribute (leer für System A und B Fälle)
Nach der Bereicherung: Fokussierter Datensatz mit sichtbaren 45 gemeinsamen Attributen plus nur den system-spezifischen Attributen, die für die aktuelle Fallauswahl Daten enthalten.
Ergebnis: Die Bereicherung entfernte alle vollständig leeren Spalten und behielt nur die 45 gemeinsamen Felder bei, die von allen drei Systemen befüllt werden. Systemspezifische Attribute, die im gesamten zusammengeführten Datensatz leer waren, wurden automatisch ausgeblendet.
Erkenntnisse: Die Konsolidierung zeigte, dass trotz unterschiedlicher Systemstrukturen alle drei Systeme dieselben 45 Kernprozessattribute erfassen. Diese Erkenntnis ermöglichte es der Bank, ihre Rechnungsverarbeitung systemübergreifend zu standardisieren und die Komplexität um 85 % zu reduzieren.
Beispiel 4: Vorbereitung von Beschaffungsdaten
Szenario: Der Beschaffungsdatensatz eines Einzelhandelsunternehmens enthält Attribute für verschiedene Genehmigungsebenen und spezielle Handhabungscodes, die jedoch nur für hochwertige oder regulierte Artikel verwendet werden, während sie bei Routinekäufen leer bleiben.
Vor der Bereicherung: Datensatz mit 150 Attributen, darunter:
- Standardfelder: PO_Number, Supplier, Amount, Create_Date (immer befüllt)
- Bedingte Felder: VP_Approval, Legal_Review, Hazmat_Code, Export_License, Compliance_Check (95 % leer)
- Legacy-Felder: Old_Vendor_Code, Previous_System_Ref (nach Migration 100 % leer)
Nach der Bereicherung: Vereinfachter Datensatz mit 67 aktiven Attributen:
- Alle standardmäßigen Beschaffungsfelder beibehalten
- Bedingte Felder mit mindestens einem Wert erhalten
- Vollständig leere Legacy-Felder entfernt
Ergebnis: Die Bereicherung blendete 83 Attribute aus, die keine Daten enthielten, darunter alle Legacy-Felder und bedingte Genehmigungsfelder, die im aktuellen Datensatz nie genutzt wurden. Die verbleibenden Attribute tragen alle zur Prozessanalyse bei.
Erkenntnisse: Nach der Bereinigung stellte das Beschaffungsteam fest, dass nur 5 % aller Einkäufe tatsächlich spezielle Genehmigungen benötigten, was ihnen ermöglichte, den Prozess für 95 % der Routinekäufe zu straffen. Die vereinfachte Ansicht erleichterte es, diese komplexen Fälle für eine separate Analyse zu identifizieren.
Beispiel 5: Qualitätskontrolle in der Fertigung
Szenario: Ein Hersteller von Autoteilen exportiert Qualitätskontrolldaten mit Hunderten von Messfeldern, aber jede Produktionslinie nutzt nur spezifische Messwerte, die für ihre Teile relevant sind, wodurch viele Felder leer bleiben.
Vor der Bereicherung: Qualitätsdatensatz mit 450 Attributen:
- Gemeinsame Felder: Part_Number, Production_Line, Timestamp, Pass_Fail (immer befüllt)
- Linien-spezifische Messungen: 200+ Messfelder pro Linie (leer für andere Linien)
- Veraltete Messungen: 50+ alte Qualitätskennzahlen, die nicht mehr erhoben werden
Nach der Bereicherung: Relevanter Datensatz mit 125 Attributen:
- Alle gemeinsamen Felder erhalten
- Nur Messungen mit Daten beibehalten
- Alle veralteten und ungenutzten Messfelder ausgeblendet
Ergebnis: Die Bereicherung entfernte 325 leere Messspalten und behielt die 125 Spalten mit tatsächlichen Qualitätsdaten. Die Ansicht jeder Produktionslinie zeigt nun nur relevante Messwerte.
Erkenntnisse: Die Bereinigung offenbarte, dass trotz 450 möglicher Messwerte jede Produktionslinie nur 20–30 kritische Qualitätskennzahlen aktiv überwachte. Diese Erkenntnis führte zu einem gezielten Qualitätsverbesserungsprogramm, das die Fehlerquote um 15 % senkte, indem es sich auf die tatsächlich wichtigen Messwerte konzentrierte.
Ausgabe
Die Bereicherung "Leere Attribute ausblenden" ändert die Sichtbarkeit bestehender Spalten, ohne Daten zu löschen:
Ausgeblendete Spalten:
- Fallattribute, bei denen jede Fallzeile null-/leere Werte enthält
- Ereignisattribute, bei denen jede Ereigniszeile null-/leere Werte enthält
- Spalten werden als ausgeblendet markiert, aber nicht aus dem Datensatz gelöscht
- Der Ausblendungsstatus kann bei Bedarf über die Spaltenverwaltung rückgängig gemacht werden
Beibehaltende Spalten:
- Alle Spalten, die mindestens einen Nicht-Null-Wert enthalten
- Alle berechneten Spalten (von anderen Bereicherungen erstellt)
- Alle Spalten, die bereits als ausgeblendet markiert sind (keine redundante Verarbeitung)
- Systemspalten wie Case ID und Aktivitätsnamen
Leistungsauswirkung:
- Reduzierter Speicherbedarf beim Laden von Datensätzen
- Schnellere Darstellung von Attributlisten und Filtern
- Verbesserte Abfrageleistung bei vereinfachten Spaltensätzen
- Sauberere Exportdateien bei Dataset-Freigaben
Die Wirkung der Bereicherung ist sofort in den Fall- und Ereignisattribut-Panels sichtbar, wo leere Spalten nicht mehr erscheinen. Dies schafft einen fokussierten, effizienten Arbeitsbereich für die Prozessanalyse.
Siehe auch
- Anonymisieren – Sensible Daten verbergen und gleichzeitig die Prozessstruktur erhalten
- Text kürzen – Leerzeichen aus Textattributen entfernen
- Textanfang – Anfangsabschnitte von Textattributen extrahieren
- Textende – Endabschnitte von Textattributen extrahieren
- Gruppieren von Attributwerten – Ähnliche Attributwerte zusammenfassen
Diese Dokumentation ist Teil der mindzie Studio Process-Mining-Plattform.