Filterprozessprotokoll

Übersicht

Die Filter Process Log-Anreicherung ist ein leistungsstarker Datenbereinigungsoperator, der unerwünschte Fälle und Ereignisse aus Ihrem Prozessdatensatz basierend auf festgelegten Filterkriterien dauerhaft entfernt. Im Gegensatz zu temporären Filtern, die Daten nur während der Analyse verstecken, entfernt diese Anreicherung die gefilterten Daten physisch aus dem Protokoll und erzeugt so einen kleineren, fokussierteren Datensatz. Diese dauerhafte Filterung ist essenziell für Datenqualitätsmanagement, Datenschutzkonformität und Leistungsoptimierung in Process Mining-Projekten.

Diese Anreicherung arbeitet auf der fundamentalsten Ebene des Process Minings, indem sie die tatsächliche Struktur des Ereignisprotokolls verändert. Wenn Sie Filter über diese Anreicherung anwenden, prüft sie jeden Fall anhand Ihrer definierten Kriterien und entfernt alle Fälle (und deren zugehörige Ereignisse), die die Anforderungen nicht erfüllen. Das Ergebnis ist ein optimierter Datensatz, der nur die relevanten Prozessinstanzen enthält, wodurch alle nachfolgenden Analysen schneller und präziser werden. Dies ist besonders wertvoll bei großen Datensätzen, bei denen irrelevante Daten wichtige Muster verdecken können, oder wenn Sie spezialisierte Ansichten Ihres Prozesses für unterschiedliche Stakeholder-Gruppen erstellen müssen.

Die Filter Process Log-Anreicherung ist einzigartig durch ihre permanente Natur – einmal ausgeführt, werden die gefilterten Daten aus dem Arbeitssatz entfernt. Dadurch eignet sie sich ideal zur Erstellung produktionsbereiter Datensätze, zum Entfernen von Testdaten, zur Eliminierung von Ausreißern oder zum Fokus auf bestimmte Zeiträume oder Geschäftssegmente. Die Anreicherung nutzt dieselbe leistungsstarke Filter-Engine, die in mindzieStudio verwendet wird, und erlaubt Ihnen, mehrere Filterbedingungen mit komplexer Logik zu kombinieren, um präzise zu definieren, welche Daten beibehalten werden sollen.

Häufige Anwendungen

  • Entfernen von Testfällen und Dummy-Daten vor der Produktionsanalyse
  • Extrahieren spezifischer Zeiträume für Zeit-Vergleichsanalysen
  • Eliminieren unvollständiger Fälle, die Prozesskennzahlen verzerren würden
  • Erstellen von abteilungs- oder regionsspezifischen Datensätzen aus unternehmensweiten Protokollen
  • Entfernen von Ausreißern und Anomalien, die Standardprozessmuster verfälschen
  • Sicherstellen des Datenschutzes durch Herausfiltern sensibler Fallkategorien
  • Optimieren der Leistung durch Reduzierung der Datensatzgröße für komplexe Analysen

Einstellungen

Filterliste: Das zentrale Konfigurationselement, das definiert, welche Fälle im Prozessprotokoll behalten oder entfernt werden. Greifen Sie über das Drei-Punkte-Menü auf die Filterkonfiguration zu, wo Sie mehrere Filterbedingungen hinzufügen können. Jeder Filter kann verschiedene Aspekte Ihrer Daten ansprechen – Fallattribute, Ereignisattribute, Zeitstempel oder Aktivitätsnamen. Filter können mit AND/OR-Logik kombiniert werden, um komplexe Auswahlkriterien zu erstellen. Die Filteroberfläche bietet einen visuellen Builder, der Ihnen hilft, komplexe Filterlogik ohne Programmierung zu erstellen. Übliche Filtertypen sind:

  • Attributfilter: basierend auf Fall- oder Ereignisattributwerten
  • Zeitfilter: Auswahl spezifischer Datums- oder Zeitbereiche
  • Aktivitätsfilter: Einschluss oder Ausschluss von Fällen mit bestimmten Aktivitäten
  • Leistungsfilter: basierend auf Dauer, Durchsatz oder anderen Kennzahlen
  • Konformitätsfilter: Fälle, die Prozessregeln erfüllen oder verletzen

Die Filterliste unterstützt das Speichern und Laden von Filterkonfigurationen, sodass Sie häufig genutzte Filtermuster in verschiedenen Datensätzen oder Projekten wiederverwenden können.

Beispiele

Beispiel 1: Testdaten aus Produktionsdatensatz entfernen

Szenario: Eine SAP-Implementierung enthält Testtransaktionen, die mit spezifischen Präfixen markiert sind und vor der Analyse realer Geschäftsprozesse entfernt werden müssen. Die Testdaten wurden während der Systemvalidierung erzeugt und würden KPIs verfälschen, wenn sie in die Analyse einbezogen würden.

Einstellungen:

  • Filterlisten-Konfiguration:
    • Filter 1: Order_Number NICHT BEGINNT MIT "TEST"
    • Filter 2: Customer_Name NICHT GLEICH "Dummy Customer"
    • Filter 3: Created_Date NACH "2024-01-01"
    • Logik: Filter 1 UND Filter 2 UND Filter 3

Ergebnis: Die Anreicherung entfernt alle Fälle, bei denen:

  • Bestellnummern mit "TEST" beginnen (z. B. "TEST_001", "TEST_PO_2024")
  • Kundenname exakt "Dummy Customer" ist
  • Fälle vor dem 1. Januar 2024 erstellt wurden

Originaldatensatz: 150.000 Fälle mit 2,3 Mio. Ereignissen
Gefilterter Datensatz: 142.000 Fälle mit 2,18 Mio. Ereignissen
Entfernt: 8.000 Testfälle und deren zugehörige 120.000 Ereignisse

Fazit: Der bereinigte Datensatz repräsentiert nun genau die tatsächlichen Geschäftsprozesse und verbessert die Zuverlässigkeit von Prozesskennzahlen und Konformitätsanalysen. Leistungsberechnungen, Durchlaufzeiten und Engpassanalysen spiegeln reale betriebliche Herausforderungen wider, nicht künstliche Testszenarien.

Beispiel 2: Hochwertige Bestellungen extrahieren

Szenario: Im Beschaffungsprozess, der mehrere Kategorien umfasst, möchte das Management sich ausschließlich auf Hochwert-Bestellungen über 50.000 $ konzentrieren, um Genehmigungsabläufe zu optimieren und Einsparpotenziale aufzudecken.

Einstellungen:

  • Filterlisten-Konfiguration:
    • Filter 1: Total_Order_Value GRÖSSER ALS 50000
    • Filter 2: Order_Status NICHT GLEICH "Cancelled"
    • Filter 3: Order_Type IN ["Standard PO", "Contract PO", "Planned PO"]
    • Logik: Filter 1 UND Filter 2 UND Filter 3

Ergebnis: Erstellt einen fokussierten Datensatz, der nur enthält:

  • Bestellungen mit Gesamtwert über 50.000 $
  • Aktive Bestellungen (ausgenommen storniert)
  • Standard-Bestellarten (ohne Eil- oder Spot-Bestellungen)

Vor Filterung: 45.000 Gesamtbestellungen
Nach Filterung: 3.200 hochwertige Bestellungen, die 72 % der Gesamtausgaben repräsentieren
Ereignisse reduziert von 890.000 auf 95.000

Fazit: Der gefilterte Datensatz zeigt, dass hochwertige Bestellungen andere Genehmigungsmuster, längere Durchlaufzeiten und mehr Beteiligte haben. Diese fokussierte Ansicht ermöglicht gezielte Prozessoptimierungen bei den finanziell bedeutendsten Bestellungen.

Beispiel 3: Regionsspezifischen Datensatz erstellen

Szenario: Ein multinationales Unternehmen muss aufgrund von DSGVO-Anforderungen und regionalen Prozessunterschieden separate Prozessanalysen für Europa erstellen.

Einstellungen:

  • Filterlisten-Konfiguration:
    • Filter 1: Region GLEICH "Europe"
    • Filter 2: Country IN ["Germany", "France", "Italy", "Spain", "Netherlands", "Belgium"]
    • Filter 3: Process_Start_Date ZWISCHEN "2024-01-01" UND "2024-12-31"
    • Logik: (Filter 1 ODER Filter 2) UND Filter 3

Ergebnis: Extrahiert alle europäischen Fälle für das Kalenderjahr 2024:

  • Original globaler Datensatz: 500.000 Fälle aus 35 Ländern
  • Gefilterter europäischer Datensatz: 185.000 Fälle aus 6 Ländern
  • Ereignisse reduziert von 8,5 Mio. auf 3,1 Mio.
  • Alle nicht-europäischen Daten dauerhaft aus dem Arbeitssatz entfernt

Fazit: Der regionsspezifische Datensatz ermöglicht die Einhaltung lokaler Datenschutzvorschriften, zeigt europaspezifische Prozessmuster und stellt eine handhabbare Datensatzgröße für detaillierte regionale Analysen und Optimierungen bereit.

Beispiel 4: Fokus auf abgeschlossene Behandlungsfolgen im Gesundheitswesen

Szenario: Ein Krankenhaus möchte nur vollständig abgeschlossene Patientenbehandlungsfolgen analysieren, laufende Behandlungen und rein administrative Besuche ausschließen, um die Behandlungseffektivität und Ressourcennutzung genau zu messen.

Einstellungen:

  • Filterlisten-Konfiguration:
    • Filter 1: Episode_Status GLEICH "Completed"
    • Filter 2: Treatment_Type NICHT GLEICH "Administrative"
    • Filter 3: Has_Clinical_Outcome GLEICH "Yes"
    • Filter 4: Duration_Days ZWISCHEN 1 UND 365
    • Logik: Filter 1 UND Filter 2 UND Filter 3 UND Filter 4

Ergebnis: Gefilterter Datensatz enthält nur:

  • Abgeschlossene Behandlungsepisoden mit dokumentiertem Ergebnis
  • Klinische Behandlungen (ohne administrative Besuche)
  • Realistischer Dauerbereich (1-365 Tage)

Originaldatensatz: 120.000 Patientenepisoden
Gefilterter Datensatz: 78.000 abgeschlossene klinische Episoden
Entfernt: 42.000 unvollständige, administrative oder Ausreißer-Fälle

Fazit: Der bereinigte Datensatz liefert genaue Kennzahlen zu Behandlungsdauer, Ressourcennutzung und klinischen Pfaden ohne Störgeräusche durch unvollständige Daten, was verlässliche Qualitätskennzahlen und Prozessverbesserungen erlaubt.

Beispiel 5: Ausreißer für Standardprozessanalyse eliminieren

Szenario: Ein Fertigungsunternehmen möchte den Standardproduktionsprozess analysieren und dabei extreme Ausreißer entfernen, die auf Geräteausfälle oder außergewöhnliche Umstände zurückzuführen sind, um den typischen Anteil von 95 % der Fälle zu fokussieren.

Einstellungen:

  • Filterlisten-Konfiguration:
    • Filter 1: Cycle_Time_Hours ZWISCHEN 2 UND 48
    • Filter 2: Number_of_Rework_Loops WENIGER ALS 3
    • Filter 3: Production_Status NICHT IN ["Emergency", "Experimental", "Failed"]
    • Filter 4: Defect_Rate WENIGER ALS 0.05
    • Logik: Filter 1 UND Filter 2 UND Filter 3 UND Filter 4

Ergebnis: Entfernt Ausreißerfälle:

  • Fälle mit extremen Durchlaufzeiten (< 2 oder > 48 Stunden)
  • Übermäßige Nacharbeit (3+ Schleifen)
  • Nicht-standardmäßige Produktionsläufe
  • Hohe Ausschussraten (> 5 %)

Vorher: 25.000 Produktionsläufe mit hoher Varianz
Nachher: 23.750 Standard-Produktionsläufe
Entfernt: 1.250 Ausreißerfälle (5 % der Gesamtmenge)

Fazit: Der gefilterte Datensatz repräsentiert normale Betriebsbedingungen, ermöglicht genaue Baseline-Kennzahlen, realistische Verbesserungsziele und die Unterscheidung von Standardprozessabweichungen gegenüber außergewöhnlichen Ereignissen.

Ergebnis

Die Filter Process Log-Anreicherung erzeugt einen dauerhaft veränderten Datensatz mit folgenden Eigenschaften:

Modifiziertes Prozessprotokoll: Die Anreicherung liefert ein neues SuperLog-Objekt zurück, das nur die Fälle enthält, die Ihre Filterkriterien erfüllen. Alle gefilterten Fälle und deren zugehörigen Ereignisse werden dauerhaft aus dem Arbeitssatz entfernt. Dies ist innerhalb der aktuellen Analysesitzung nicht umkehrbar.

Reduktion der Fallzahl: Die Anzahl der Fälle in Ihrem Datensatz sinkt entsprechend der Filterkriterien. Sie können diese Reduktion in den Datensatzstatistiken überwachen, um sicherzustellen, dass die Filterung erwartungsgemäß wirksam war.

Auswirkung auf Ereignisanzahl: Wenn Fälle entfernt werden, werden auch alle Ereignisse dieser Fälle entfernt. Dies kann die Gesamtzahl der Ereignisse erheblich verringern, speziell bei Fällen mit vielen Ereignissen.

Erhaltene Datenstruktur: Alle bestehenden Attribute auf Fall- und Ereignisebene bleiben bei den verbleibenden Fällen erhalten. Die Anreicherung entfernt nur ganze Fälle; sie ändert nicht die Struktur oder den Inhalt der verbleibenden Fälle.

Leistungsverbesserungen: Die reduzierte Datensatzgröße führt zu schnellerer Ausführung aller nachfolgenden Anreicherungen, Filter und Berechnungen. Dies ist besonders bei komplexen Process Mining-Operationen spürbar.

Auswirkungen auf nachgelagerte Analysen: Alle Analysen, Visualisierungen und Exporte spiegeln den gefilterten Datensatz wider. Speichern Sie eine Kopie des Originaldatensatzes, wenn Sie später die vollständigen Daten benötigen.

Wichtige Hinweise

Permanente Operation: Im Gegensatz zu Visualisierungsfiltern, die Daten nur temporär ausblenden, entfernt diese Anreicherung Daten dauerhaft aus Ihrem Arbeitssatz. Bewahren Sie stets eine Sicherungskopie Ihrer Originaldaten vor der Anwendung dieser Anreicherung auf.

Reihenfolge der Operationen: Wenden Sie diese Anreicherung frühzeitig in Ihrem Analyse-Workflow an, wenn Sie wissen, dass bestimmte Daten irrelevant sind. Dies verbessert die Leistung aller nachfolgenden Operationen.

Filtervalidierung: Testen Sie Ihre Filter mit der Vorschaufunktion, bevor Sie die Anreicherung ausführen, um sicherzustellen, dass Sie die gewünschten Daten behalten.

Kaskadierende Effekte: Das Entfernen von Fällen kann Berechnungen beeinträchtigen, die auf dem vollständigen Datensatz basieren, etwa Perzentilberechnungen oder relative Leistungskennzahlen.


Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.