Small Ends Filter
Übersicht
Der Small Ends Filter schneidet automatisch Zeiträume mit geringer Aktivität vom Anfang und Ende Ihres Ereignisprotokolls ab. Dieser intelligente Filter auf Fall-Ebene erkennt „Anlauf“- und „Auslauf“-Phasen, in denen das Volumen der Ereignisse deutlich unter dem Durchschnitt liegt, und entfernt dann Fälle, die vollständig innerhalb dieser Zeiträume liegen. So wird sichergestellt, dass Ihre Analyse sich auf Phasen normaler Geschäftstätigkeit konzentriert und nicht durch Artefakte der Datenerfassung oder saisonale Tiefpunkte verzerrt wird.
Häufige Anwendungsfälle
- Entfernung von Daten aus Systemstartphasen, bevor sich die Prozesse stabilisierten
- Ausschluss von End-Extraktionsperioden, in denen Daten unvollständig sein können
- Herausfiltern von Feiertagszeiten mit verringerter Aktivität
- Beseitigung von Problemen mit der Datenqualität an Protokollgrenzen
- Konzentration der Analyse auf Phasen mit repräsentativem Prozessverhalten
- Säuberung von Ereignisprotokollen für genaue Durchsatz- und Leistungskennzahlen
Einstellungen
Start Factor: Ein Multiplikator (0,0 bis 1,0), der auf die durchschnittliche tägliche Ereignisanzahl angewendet wird. Tage am Anfang des Protokolls mit Ereigniszahlen unter (Start Factor × Durchschnittliche Ereignisse pro Tag) werden abgeschnitten. Ein niedriger Wert ist nachsichtiger (behält mehr Daten); ein höherer Wert ist aggressiver (entfernt mehr frühe Daten).
End Factor: Ein Multiplikator (0,0 bis 1,0), der auf die durchschnittliche tägliche Ereignisanzahl angewendet wird. Tage am Ende des Protokolls mit Ereigniszahlen unter (End Factor × Durchschnittliche Ereignisse pro Tag) werden abgeschnitten. Funktioniert wie der Start Factor, aber für das Ende des Protokolls.
Standardwerte: Beide Faktoren sind standardmäßig auf 0,1 (10 %) eingestellt, d. h. Tage mit weniger als 10 % der durchschnittlichen täglichen Aktivität werden als „klein“ betrachtet und abgeschnitten.
Beispiele
Beispiel 1: Standardbereinigung
Szenario: Ihr Ereignisprotokoll beginnt mit einer Systemimplementierungsphase, in der wenige Transaktionen stattgefunden haben, und endet mit unvollständigen Daten vom Extraktionsdatum. Sie möchten diese Phasen niedriger Aktivität automatisch abschneiden.
Einstellungen:
- Start Factor: 0.1
- End Factor: 0.1
Ergebnis:
Der Filter berechnet die durchschnittlichen Ereignisse pro Tag über das gesamte Protokoll (z. B. 500 Ereignisse/Tag). Tage mit weniger als 50 Ereignissen gelten als niedrigaktiv. Wenn die ersten 5 Tage jeweils 10, 25, 30, 45 und 80 Ereignisse haben, beginnt der Filter ab Tag 4. Ebenso werden niedrige Aktivitätstage am Ende geschnitten.
Einsichten: Dies behandelt automatisch Probleme an Datenrändern ohne manuelle Datumsauswahl und stellt sicher, dass die Analyse nur Zeiten mit repräsentativem Aktivitätsniveau abdeckt.
Beispiel 2: Aggressives Abschneiden am Anfang
Szenario: Ihre Prozessdaten enthalten eine lange Pilotphase vor dem vollständigen Rollout. Sie möchten frühe Daten aggressiv abschneiden und gleichzeitig die Daten am Ende des Protokolls erhalten.
Einstellungen:
- Start Factor: 0.3
- End Factor: 0.1
Ergebnis:
Tage am Anfang mit weniger als 30 % der durchschnittlichen täglichen Aktivität werden entfernt. Dadurch wird ein größerer Teil der Pilot- bzw. Anlaufperiode entfernt. Am Ende wird die Standardgrenze von 10 % verwendet, um jüngere Daten zu erhalten.
Einsichten: Asymmetrische Faktoren erlauben es, Situationen zu behandeln, in denen Anfang und Ende des Protokolls unterschiedliche Eigenschaften haben. Pilotphasen haben oft längere Anlaufzeiten als Auslaufphasen.
Beispiel 3: Minimales Abschneiden
Szenario: Sie möchten möglichst viele Daten behalten, aber offensichtliche Probleme an den Protokollgrenzen entfernen.
Einstellungen:
- Start Factor: 0.05
- End Factor: 0.05
Ergebnis:
Nur Tage mit weniger als 5 % der durchschnittlichen täglichen Aktivität werden abgeschnitten. Das erfasst nur die extremsten Phasen niedriger Aktivität, während der Großteil der Daten inklusive moderater saisonaler Schwankungen erhalten bleibt.
Einsichten: Verwenden Sie niedrige Faktoren, wenn Ihr Geschäft natürliche Aktivitätsschwankungen hat und Sie keine legitimen Ruhezeiten wie Wochenenden oder saisonale Tiefpunkte versehentlich entfernen möchten.
Beispiel 4: Entfernen saisonaler Grenzen
Szenario: Ihr Protokoll erstreckt sich über ein ganzes Jahr, enthält jedoch Dezember (Feiertagssaison) sowohl am Anfang als auch am Ende aufgrund des Extraktionszeitpunkts. Sie möchten sich auf Nicht-Feiertagszeiträume konzentrieren.
Einstellungen:
- Start Factor: 0.4
- End Factor: 0.4
Ergebnis:
Tage mit weniger als 40 % der durchschnittlichen Aktivität werden an beiden Enden abgeschnitten. Dies entfernt effektiv Feiertagszeiten, in denen die Aktivität deutlich unter das normale Niveau sank.
Einsichten: Höhere Faktoren helfen, saisonale Schwankungen auszuschließen, die die Analyse verzerren könnten. Seien Sie jedoch vorsichtig, nicht zu viele gültige Daten zu entfernen.
Beispiel 5: Neue Systemimplementierung
Szenario: Die Daten wurden aus einem neuen System extrahiert, das vor 3 Monaten live ging. Der erste Monat hatte sehr geringe Aktivität, da Nutzer geschult und migriert wurden.
Einstellungen:
- Start Factor: 0.5
- End Factor: 0.1
Ergebnis:
Der erste Teil des Protokolls (Implementierungs-/Schulungsphase mit < 50 % Aktivität) wird entfernt, während die aktuellen Daten mit nur minimalem Abschneiden am Ende erhalten bleiben. Dies fokussiert die Analyse auf die Zeit nach Stabilisierung des Systems.
Einsichten: Implementierungsphasen zeigen oft Muster, die nicht den normalen Betrieb widerspiegeln. Das Abschneiden stellt sicher, dass Ihre Prozesskennzahlen die tatsächliche operative Leistung widerspiegeln.
Funktionsweise
- Berechnung der täglichen Frequenzen: Der Filter zählt die Ereignisse für jeden Tag im Protokoll
- Berechnung der mittleren Aktivität: Ermittelt die durchschnittlichen Ereignisse pro Tag über den gesamten Zeitraum
- Ermittlung der Startgrenze: Durchsucht von Anfang an den ersten Tag, der den Schwellenwert (Start Factor × Mittelwert) überschreitet
- Ermittlung der Endgrenze: Durchsucht vom Ende her den letzten Tag, der den Schwellenwert (End Factor × Mittelwert) überschreitet
- Anwendung des Zeitbereichs: Filtert die Fälle, um nur diejenigen innerhalb der berechneten Datumsgrenzen zu behalten
Ausgabe
Dieser Filter arbeitet auf Fall-Ebene auf Grundlage zeitlicher Grenzen:
- Berechnet automatisch Aktivitätsschwellen basierend auf den durchschnittlichen Ereignissen pro Tag
- Identifiziert den ersten Tag normaler Aktivität am Beginn des Protokolls
- Identifiziert den letzten Tag normaler Aktivität am Ende des Protokolls
- Liefert Fälle zurück, die im berechneten normalen Aktivitätszeitraum enthalten sind
- Bewahrt alle Fall- und Ereignisattribute der eingeschlossenen Fälle
- Faktoren müssen zwischen 0 und 1 (exklusiv) liegen
Verwenden Sie den Small Ends Filter, um automatisch die Grenzen von Ereignisprotokollen zu bereinigen und sicherzustellen, dass Ihre Analyse normale Geschäftsabläufe und nicht Implementierungsphasen, Artefakte der Datenerfassung oder saisonale Anomalien widerspiegelt.
Diese Dokumentation ist Teil der mindzie Studio Prozess-Mining-Plattform.