Leere Attribute ausblenden

Übersicht

Die Bereicherung "Leere Attribute ausblenden" ist ein automatischer Datenbereinigungsoperator, der alle Attribute (Spalten) identifiziert und entfernt, die in Ihrem gesamten Datensatz keine Daten enthalten. Dieses leistungsstarke Bereinigungstool durchsucht sowohl Fall- als auch Ereignisattribute und blendet automatisch alle Spalten aus, bei denen jede einzelne Zeile null- oder leere Werte enthält. Durch das Entfernen dieser leeren Spalten vereinfacht die Bereicherung die Ansicht Ihres Datensatzes erheblich, reduziert visuelles Durcheinander in Analysetools und verbessert die Leistung bei der Arbeit mit großen Datensätzen.

Diese Bereicherung ist besonders wertvoll beim Import von Daten aus Unternehmenssystemen, die feste Schemata mit vielen optionalen Feldern exportieren, oder bei der Arbeit mit Datensätzen, die mehrere Transformationen durchlaufen haben, bei denen einige Attribute obsolet werden. Im Gegensatz zur manuellen Spaltenentfernung, die jede leere Spalte einzeln identifizieren muss, führt diese Bereicherung eine umfassende Überprüfung Ihres gesamten Datensatzes in einem einzigen Vorgang durch. Die Bereicherung behält alle Spalten bei, die mindestens einen Nicht-Null-Wert enthalten, wodurch keine potenziell nützlichen Daten verloren gehen und gleichzeitig die Sauberkeit und Benutzerfreundlichkeit Ihres Process-Mining-Arbeitsbereichs maximiert wird.

Häufige Anwendungsfälle

Bereinigung importierter Datensätze aus ERP-Systemen, die Hunderte optionale Felder ohne befüllte Daten enthalten
Vereinfachung der Datensatzansicht nach Filtervorgängen, die einige Attribute vollständig leer lassen können
Reduzierung visuellen Durcheinanders in den Fall- und Ereignisattribut-Panels, um sich auf aussagekräftige Daten zu konzentrieren
Verbesserung der Leistung und Reduzierung des Speicherverbrauchs bei der Arbeit mit breiten Datensätzen mit vielen ungenutzten Spalten
Vorbereitung von Datensätzen für den Export oder die Weitergabe durch Entfernung irrelevanter leerer Spalten
Bereinigung nach Daten-Transformationen, die mehrere Attribute in neue berechnete Felder konsolidieren
Straffung der Conformance-Prüfung durch Entfernen von Attributen, die keinen analytischen Wert bieten

Einstellungen

Diese Bereicherung arbeitet automatisch und erfordert keine Konfiguration. Sie durchsucht alle nicht berechneten und nicht ausgeblendeten Attribute in Ihrem Datensatz und entfernt nur solche, die über alle Fälle und Ereignisse hinweg vollständig leer sind.

Beispiele

Beispiel 1: Bereinigung von ERP-System-Exporten

Szenario: Ein Fertigungsunternehmen exportiert Auftragsdaten aus SAP mit über 200 Standardfeldern, verwendet aber in ihrer speziellen Implementierung nur etwa 60 Felder, sodass über 140 Spalten komplett leer sind und die Analyse erschweren.

Vor der Bereicherung: Datensatz enthält insgesamt 215 Attribute, darunter:

Fallattribute: 125 Spalten (75 leer)
Ereignisattribute: 90 Spalten (65 leer)
Beispiele leerer Spalten: Legacy_System_ID, Deprecated_Cost_Center, Old_Warehouse_Code, Custom_Field_1 bis Custom_Field_50

Nach der Bereicherung: Datensatz auf 75 aussagekräftige Attribute reduziert:

Fallattribute: 50 Spalten (alle enthalten Daten)
Ereignisattribute: 25 Spalten (alle enthalten Daten)
Alle leeren Spalten automatisch ausgeblendet

Ergebnis: Die Bereicherung entfernte 140 leere Spalten und behielt alle 75 Spalten, die mindestens einen Wert enthielten. Die Datensatzansicht fokussiert sich nun nur noch auf Attribute mit tatsächlichen Daten, was Navigation und Analyse deutlich erleichtert.

Erkenntnisse: Nach der Bereinigung konnten Analysten schnell die relevanten Attribute für Process Mining identifizieren. Die vereinfachte Ansicht zeigte, dass die Auftragsbearbeitung tatsächlich nur 12 Schlüsselattribute für Entscheidungen enthielt, die zuvor zwischen Hunderten leerer Felder verborgen waren. Die Leistung beim Laden des Datensatzes verbesserte sich um 40 % durch reduzierten Speicherbedarf.

Beispiel 2: Bereinigung nach Filterung im Gesundheitswesen

Szenario: Ein Krankenhaus filtert seinen Patiententherapie-Datensatz, um nur Notaufnahmefälle zu analysieren, wodurch viele spezialisierte Stationsattribute vollständig leer werden, da Notfälle diese Felder nicht nutzen.

Vor der Bereicherung: Nach Filterung auf Notaufnahme-Fälle:

Gesamtanzahl Attribute: 180
Befüllte Attribute: Emergency_Triage_Level, Emergency_Wait_Time, Emergency_Treatment
Leere Attribute: ICU_Ventilator_Settings, Surgery_Type, Rehabilitation_Plan, Oncology_Stage und 85 weitere spezialisierte Abteilungsfelder

Nach der Bereicherung:

Sichtbare Gesamtattribute: 92
Alle Attribute enthalten nun relevante Notaufnahmedaten
88 leere spezialisierte Abteilungsattribute ausgeblendet

Ergebnis: Die Bereicherung identifizierte automatisch alle Attribute, die nach Anwendung des Notaufnahmefilters leer geworden waren, und blendete sie aus. Die verbleibenden Attribute enthalten Daten, die für Notfälle relevant sind.

Erkenntnisse: Der bereinigte Datensatz ermöglichte Notfallmanagern, sich auf ihre spezifischen KPIs zu konzentrieren, ohne von irrelevanten Feldern abgelenkt zu werden. Die Analysezeit verringerte sich um 60 %, da das Personal nicht mehr durch leere Spalten scrollen musste, um relevante Daten zu finden.

Beispiel 3: Konsolidierung von Finanzprozessen

Szenario: Eine Bank fasst Rechnungsverarbeitungsdaten aus drei unterschiedlichen Systemen mit einzigartigen Feldstrukturen zusammen, wobei viele systemspezifische Attribute für Fälle aus anderen Systemen leer bleiben.

Vor der Bereicherung: Zusammengeführter Datensatz mit 340 Attributen:

Gemeinsame Felder (von allen Systemen genutzt): 45 Attribute
System-A-spezifische Felder: 95 Attribute (leer für System B und C Fälle)
System-B-spezifische Felder: 110 Attribute (leer für System A und C Fälle)
System-C-spezifische Felder: 90 Attribute (leer für System A und B Fälle)

Nach der Bereicherung: Fokussierter Datensatz mit sichtbaren 45 gemeinsamen Attributen plus nur den system-spezifischen Attributen, die für die aktuelle Fallauswahl Daten enthalten.

Ergebnis: Die Bereicherung entfernte alle vollständig leeren Spalten und behielt nur die 45 gemeinsamen Felder bei, die von allen drei Systemen befüllt werden. Systemspezifische Attribute, die im gesamten zusammengeführten Datensatz leer waren, wurden automatisch ausgeblendet.

Erkenntnisse: Die Konsolidierung zeigte, dass trotz unterschiedlicher Systemstrukturen alle drei Systeme dieselben 45 Kernprozessattribute erfassen. Diese Erkenntnis ermöglichte es der Bank, ihre Rechnungsverarbeitung systemübergreifend zu standardisieren und die Komplexität um 85 % zu reduzieren.

Beispiel 4: Vorbereitung von Beschaffungsdaten

Szenario: Der Beschaffungsdatensatz eines Einzelhandelsunternehmens enthält Attribute für verschiedene Genehmigungsebenen und spezielle Handhabungscodes, die jedoch nur für hochwertige oder regulierte Artikel verwendet werden, während sie bei Routinekäufen leer bleiben.

Vor der Bereicherung: Datensatz mit 150 Attributen, darunter:

Standardfelder: PO_Number, Supplier, Amount, Create_Date (immer befüllt)
Bedingte Felder: VP_Approval, Legal_Review, Hazmat_Code, Export_License, Compliance_Check (95 % leer)
Legacy-Felder: Old_Vendor_Code, Previous_System_Ref (nach Migration 100 % leer)

Nach der Bereicherung: Vereinfachter Datensatz mit 67 aktiven Attributen:

Alle standardmäßigen Beschaffungsfelder beibehalten
Bedingte Felder mit mindestens einem Wert erhalten
Vollständig leere Legacy-Felder entfernt

Ergebnis: Die Bereicherung blendete 83 Attribute aus, die keine Daten enthielten, darunter alle Legacy-Felder und bedingte Genehmigungsfelder, die im aktuellen Datensatz nie genutzt wurden. Die verbleibenden Attribute tragen alle zur Prozessanalyse bei.

Erkenntnisse: Nach der Bereinigung stellte das Beschaffungsteam fest, dass nur 5 % aller Einkäufe tatsächlich spezielle Genehmigungen benötigten, was ihnen ermöglichte, den Prozess für 95 % der Routinekäufe zu straffen. Die vereinfachte Ansicht erleichterte es, diese komplexen Fälle für eine separate Analyse zu identifizieren.

Beispiel 5: Qualitätskontrolle in der Fertigung

Szenario: Ein Hersteller von Autoteilen exportiert Qualitätskontrolldaten mit Hunderten von Messfeldern, aber jede Produktionslinie nutzt nur spezifische Messwerte, die für ihre Teile relevant sind, wodurch viele Felder leer bleiben.

Vor der Bereicherung: Qualitätsdatensatz mit 450 Attributen:

Gemeinsame Felder: Part_Number, Production_Line, Timestamp, Pass_Fail (immer befüllt)
Linien-spezifische Messungen: 200+ Messfelder pro Linie (leer für andere Linien)
Veraltete Messungen: 50+ alte Qualitätskennzahlen, die nicht mehr erhoben werden

Nach der Bereicherung: Relevanter Datensatz mit 125 Attributen:

Alle gemeinsamen Felder erhalten
Nur Messungen mit Daten beibehalten
Alle veralteten und ungenutzten Messfelder ausgeblendet

Ergebnis: Die Bereicherung entfernte 325 leere Messspalten und behielt die 125 Spalten mit tatsächlichen Qualitätsdaten. Die Ansicht jeder Produktionslinie zeigt nun nur relevante Messwerte.

Erkenntnisse: Die Bereinigung offenbarte, dass trotz 450 möglicher Messwerte jede Produktionslinie nur 20–30 kritische Qualitätskennzahlen aktiv überwachte. Diese Erkenntnis führte zu einem gezielten Qualitätsverbesserungsprogramm, das die Fehlerquote um 15 % senkte, indem es sich auf die tatsächlich wichtigen Messwerte konzentrierte.

Ausgabe

Die Bereicherung "Leere Attribute ausblenden" ändert die Sichtbarkeit bestehender Spalten, ohne Daten zu löschen:

Ausgeblendete Spalten:

Fallattribute, bei denen jede Fallzeile null-/leere Werte enthält
Ereignisattribute, bei denen jede Ereigniszeile null-/leere Werte enthält
Spalten werden als ausgeblendet markiert, aber nicht aus dem Datensatz gelöscht
Der Ausblendungsstatus kann bei Bedarf über die Spaltenverwaltung rückgängig gemacht werden

Beibehaltende Spalten:

Alle Spalten, die mindestens einen Nicht-Null-Wert enthalten
Alle berechneten Spalten (von anderen Bereicherungen erstellt)
Alle Spalten, die bereits als ausgeblendet markiert sind (keine redundante Verarbeitung)
Systemspalten wie Case ID und Aktivitätsnamen

Leistungsauswirkung:

Reduzierter Speicherbedarf beim Laden von Datensätzen
Schnellere Darstellung von Attributlisten und Filtern
Verbesserte Abfrageleistung bei vereinfachten Spaltensätzen
Sauberere Exportdateien bei Dataset-Freigaben

Die Wirkung der Bereicherung ist sofort in den Fall- und Ereignisattribut-Panels sichtbar, wo leere Spalten nicht mehr erscheinen. Dies schafft einen fokussierten, effizienten Arbeitsbereich für die Prozessanalyse.

Siehe auch

Anonymisieren – Sensible Daten verbergen und gleichzeitig die Prozessstruktur erhalten
Text kürzen – Leerzeichen aus Textattributen entfernen
Textanfang – Anfangsabschnitte von Textattributen extrahieren
Textende – Endabschnitte von Textattributen extrahieren
Gruppieren von Attributwerten – Ähnliche Attributwerte zusammenfassen

Diese Dokumentation ist Teil der mindzie Studio Process-Mining-Plattform.