Daten aus inaktiven Perioden entfernen

Überblick

Der Filter Daten aus inaktiven Perioden entfernen kürzt automatisch den Beginn und das Ende Ihres Prozessprotokolls, indem er Perioden mit geringer Aktivität identifiziert und entfernt. Dieser intelligente Fallfilter auf Case-Ebene berechnet die tägliche Ereignishäufigkeit, bestimmt durchschnittliche Aktivitätsniveaus und entfernt Fälle, die sich in "Aufwärm-" oder "Abklingphasen" befinden, in denen das Ereignisaufkommen unter Ihren angegebenen Schwellenwerten liegt. Er ist besonders nützlich, um Start- und Abschaltphasen bei der Analyse von stabilen Prozessabläufen auszuschließen.

Häufige Anwendungsfälle

  • Entfernen von System-Aufwärmphasen am Anfang von Prozessprotokollen
  • Eliminieren von Abklingperioden am Ende der Datensammlung
  • Fokussierung der Analyse auf stabile Betriebsphasen ohne Ramp-up-Phasen
  • Bereinigung von Protokollen aus Pilotprogrammen vor der vollständigen Einführung
  • Entfernen von Perioden mit geringer Aktivität während Systemmigrationen oder Übergängen
  • Kürzen von Datensammlungszeiträumen, die keinen normalen Betrieb darstellen

Einstellungen

Start Factor: Ein Multiplikator, der auf die durchschnittliche Anzahl täglicher Ereignisse angewendet wird, um die Schwelle für den ersten einzubeziehenden Tag zu bestimmen. Tage werden einbezogen, sobald die tägliche Aktivität StartFactor mal dem Mittelwert übersteigt.

End Factor: Ein Multiplikator, der auf die durchschnittliche Anzahl täglicher Ereignisse angewendet wird, um die Schwelle für den letzten einzubeziehenden Tag zu bestimmen. Tage werden einbezogen, solange die tägliche Aktivität EndFactor mal dem Mittelwert übersteigt.

Einstellung Zweck Typische Werte Wirkung
Start Factor Steuert, wie aggressiv der Anfang gekürzt wird 0,1 - 0,5 Niedriger Wert = zurückhaltender, Höherer Wert = aggressiveres Kürzen
End Factor Steuert, wie aggressiv das Ende gekürzt wird 0,1 - 0,5 Niedriger Wert = zurückhaltender, Höherer Wert = aggressiveres Kürzen

Funktionsweise:

  1. Berechnet die Anzahl der Ereignisse pro Tag im gesamten Protokoll
  2. Bestimmt den Mittelwert (Durchschnitt) der täglichen Ereignisanzahl
  3. Findet den ersten Tag, an dem die Aktivität (Start Factor x Mittelwert) überschreitet
  4. Findet den letzten Tag, an dem die Aktivität (End Factor x Mittelwert) überschreitet
  5. Entfernt alle Fälle, die außerhalb dieses Datumsbereichs liegen

Beispiele

Beispiel 1: Entfernen der System-Startphase

Szenario: Ihr neues Auftragsverwaltungssystem wurde am 1. Januar eingeführt, aber nur wenige Pilotbenutzer waren in den ersten zwei Wochen aktiv, während das System validiert wurde. Sie möchten diese periodschwache Startphase entfernen und die Analyse auf den normalen Betrieb ab Mitte Januar fokussieren.

Einstellungen:

  • Start Factor: 0,3
  • End Factor: 0,1

Ergebnis:

Der Filter berechnet, dass Ihr durchschnittlicher Tagesereigniswert bei 500 Ereignissen/Tag liegt. Mit Start Factor = 0,3 sucht er den ersten Tag mit mindestens 150 Ereignissen (30 % des Mittelwerts). Tage Anfang Januar mit nur 20-80 Ereignissen werden ausgeschlossen. Die Analyse beginnt am 14. Januar, wenn die Aktivität 150+ Ereignisse erreichte. Das Ende wird mit End Factor = 0,1 nur minimal gekürzt und schließt nur die letzten Tage aus, wenn die Aktivität unter 50 Ereignisse/Tag fällt.

Erkenntnisse: Dadurch wird die Pilotphase aus der Analyse entfernt, sodass Metriken die tatsächliche operative Leistung und nicht die frühe Testphase widerspiegeln. Ihre Durchlaufzeiten, Variantenhäufigkeiten und Engpassanalysen repräsentieren jetzt echte stabile Betriebsabläufe nach der vollständigen Systemeinführung.

Beispiel 2: Bereinigung der Datensammlung zum Jahresende

Szenario: Ihre Datensammlung endete am 31. Dezember, doch die Aktivität sank natürlicherweise im späten Dezember, da Mitarbeiter Urlaub nahmen. Auch der Januar begann langsam, da der Betrieb hochgefahren wurde. Sie möchten nur die Kernbetriebsphase mit normaler Personalstärke analysieren.

Einstellungen:

  • Start Factor: 0,2
  • End Factor: 0,2

Ergebnis:

Mit ausgewogenen Start- und Endfaktoren schneidet der Filter beide Perioden mit niedriger Aktivität ab. Wenn Ihr durchschnittlicher Tageswert 800 Ereignisse betrug, werden Tage mit weniger als 160 Ereignissen an beiden Enden ausgeschlossen. Die Feiertagsverlangsamung Ende Dezember (vielleicht 50-100 Ereignisse/Tag) wird entfernt, ebenso wie der langsame Januar-Hochlauf, sodass nur voll besetzte Betriebszeiten für die Analyse verbleiben.

Erkenntnisse: Ihre Analyse spiegelt jetzt die normale Betriebskapazität wider, ohne saisonale Verzerrungen. Metriken wie durchschnittliche Falldauer und Ressourcenauslastung zeigen typische Leistungswerte und sind nicht durch Urlaubszeiten mit minimaler Besetzung verfälscht.

Beispiel 3: Analyse von ausgereiften Systembetrieben

Szenario: Sie analysieren ein System, das seit Jahren im Einsatz ist, möchten aber die letzten paar Tage ausschließen, da diese möglicherweise unvollständige Daten oder laufende Fälle enthalten. Sie möchten aggressives Kürzen am Anfang, aber sanftes am Ende.

Einstellungen:

  • Start Factor: 0,5
  • End Factor: 0,1

Ergebnis:

Mit Start Factor = 0,5 werden nur Tage ab dem Erreichen von mindestens 50 % der durchschnittlichen Aktivität am Anfang berücksichtigt, wodurch langsame Phasen aggressiv entfernt werden. Mit End Factor = 0,1 bleiben fast alle letzten Tage erhalten, solange sie mindestens 10 % der durchschnittlichen Aktivität erreichen. So erhalten Sie eine ausgereifte Betriebsperiode, ohne zu viele aktuelle Daten zu verlieren.

Erkenntnisse: Das aggressive Kürzen am Anfang stellt sicher, dass Sie eine voll ausgereifte Systemphase analysieren, während das zurückhaltende Kürzen am Ende aktuelle Daten für Trendanalysen bewahrt. Dieses Gleichgewicht ist ideal, wenn Sie jahrelange historische Daten besitzen und sich auf stabile aktuelle Abläufe konzentrieren möchten.

Beispiel 4: Konservatives Kürzen für umfassende Analyse

Szenario: Sie möchten so viele Daten wie möglich einbeziehen und nur die extrem inaktiven Perioden am Anfang und Ende Ihres Protokolls entfernen. Sie analysieren einen Prozess mit natürlicher Aktivitätsvariabilität und möchten keine gültigen Betriebsdaten verlieren.

Einstellungen:

  • Start Factor: 0,1
  • End Factor: 0,1

Ergebnis:

Mit beiden Faktoren bei 0,1 werden nur Tage mit weniger als 10 % der durchschnittlichen täglichen Ereignisse ausgeschlossen. Wenn der durchschnittliche Tageswert 1000 Ereignisse beträgt, werden nur Tage mit weniger als 100 Ereignissen gekürzt. Diese konservative Vorgehensweise entfernt nur die offensichtlichsten Aufwärm- und Abklingphasen und bewahrt alle normalen Betriebszeiten, auch bei niedrigerer Aktivität.

Erkenntnisse: Dieses minimale Kürzen stellt sicher, dass Sie keine wertvollen Daten aus natürlicherweise ruhigeren Perioden wie Wochenenden oder Feiertagen verlieren, die dennoch legitime Betriebszeiten sind. Verwenden Sie diese Einstellung, wenn Ihr Prozess hohe Variabilität aufweist oder Sie vollständige historische Abdeckung benötigen.

Ausgabe

Dieser Filter arbeitet auf Case-Ebene und verwendet eine datumsbasierte Filterung:

  • Berechnet automatisch optimale Start- und Enddaten basierend auf Aktivitätsgrenzen
  • Entfernt komplette Fälle, die außerhalb des berechneten Datumsbereichs liegen
  • Bewahrt alle Fälle innerhalb der aktiven Periode unverändert
  • Modifiziert keine Ereignisdaten, filtert nur Fälle anhand des Datums
  • Gibt Originaldaten zurück, wenn die Aktivitätsberechnung nicht möglich ist

Das resultierende Dataset konzentriert sich auf stabile Betriebsphasen, wobei inaktive Start- und Abschaltperioden ausgeklammert werden, die Ihre Process-Mining-Analyse verfälschen könnten.


Diese Dokumentation ist Teil der mindzie Studio Process-Mining-Plattform.