Event Order Algorithmus
Übersicht
Die Event Order Algorithmus-Anreicherung ist eine systemweite Konfigurationsanreicherung, die steuert, wie mindzieStudio Ereignisse innerhalb jedes Falls anordnet, wenn Zeitstempel nicht ausreichend granular sind oder wenn mehrere Ereignisse denselben Zeitstempel teilen. Diese Anreicherung ist entscheidend, um eine genaue Prozessflussanalyse und -visualisierung zu gewährleisten, insbesondere bei Datenquellen, die nur Daten ohne genaue Zeit aufzeichnen, oder wenn Ereignisse nach dem initialen Datenimport in das Protokoll eingefügt werden.
Im Process Mining ist die Reihenfolge der Aktivitäten grundlegend, um das Prozessverhalten zu verstehen, Dauerberechnungen durchzuführen, Engpässe zu identifizieren und Konformitätsprobleme aufzudecken. Viele Quellsysteme zeichnen allerdings nur das Datum des Ereignisses ohne exakte Zeit auf, oder mehrere Ereignisse werden mit identischen Zeitstempeln protokolliert. Die Event Order Algorithmus-Anreicherung bietet intelligente Sortierstrategien, um eine konsistente, sinnvolle Reihenfolge dieser Ereignisse zu etablieren und sicherzustellen, dass Ihre Prozessanalyse die tatsächliche Abfolge der Vorgänge widerspiegelt.
Diese Anreicherung arbeitet auf Protokollebene und beeinflusst, wie alle nachfolgenden Analysen, Visualisierungen und Berechnungen Ereignisfolgen interpretieren. Sie wird typischerweise einmal am Anfang Ihrer Anreicherungspipeline konfiguriert, kann jedoch angepasst werden, wenn Sie feststellen, dass Ihre Daten spezielle Reihenfolgeanforderungen haben oder wenn Sie neue Datenquellen mit unterschiedlichen Zeitstempel-Eigenschaften hinzufügen.
Häufige Anwendungsfälle
- Deterministische Ereignisreihenfolge etablieren, wenn Quellsystemzeitstempel keine Zeitangabe des Tages enthalten (nur Datum)
- Umgang mit Datenimporten, bei denen Ereignisse mit aktuellen Zeitstempeln statt tatsächlicher Ereigniszeiten ins Protokoll eingefügt werden
- Konsistente Ereignisabfolge bei unterschiedlichen Datenextraktionen und Protokollrekonstruktionen sicherstellen
- Verbesserung der Prozessfluss-Visualisierungsgenauigkeit bei Daten mit grober Zeitstempelauflösung
- Unterstützung der Konformitätsprüfung durch Bereitstellung vorhersagbarer Ereignisfolgen zum Abgleich mit erwarteten Modellen
- Performance-Optimierung durch Eliminierung unnötiger Sortiervorgänge, wenn die Ereignisreihenfolge bereits korrekt ist
- Umgang mit Legacy-Datenmigrationen, bei denen historische Ereignisse mit Einfügezeitstempeln geladen werden können
Einstellungen
Order Event Algorithm: Gibt den Algorithmus an, der verwendet wird, um Ereignisse innerhalb jedes Falls zu ordnen. Diese Einstellung bestimmt, wie mindzieStudio die Reihenfolge von Ereignissen auflöst, wenn Zeitstempel allein keine eindeutige Reihenfolge zulassen. Die verfügbaren Optionen sind:
Insert Date Events Before (Standard): Dies ist der empfohlene Algorithmus für die meisten Szenarien. Er sortiert Ereignisse innerhalb jedes Falls nach Zeitstempel und verwendet bei mehreren Ereignissen mit identischem Zeitstempel (insbesondere wenn der Zeitstempel nur ein Datum ohne Zeit enthält) das Attribut Expected Order, um die Reihenfolge festzulegen. Dieser Algorithmus geht davon aus, dass Ereignisse mit nur Datumszeitstempeln nachträglich ins Protokoll eingefügt wurden und anhand zusätzlicher Metadaten geordnet werden sollten. Das Expected Order-Attribut wird typischerweise von der Expected Order-Anreicherung gesetzt, die es ermöglicht, die logische Sequenz der Aktivitäten im Prozess zu definieren. Diese Option bietet eine intelligente Behandlung von Zeitstempeln mit gemischter Genauigkeit und gleichzeitig gute Performance.
Insert Date Events Before (Old): Eine ältere Version des Insert Date Events Before-Algorithmus, die aus Kompatibilitätsgründen mit älteren Ereignisprotokollen erhalten bleibt. Sie implementiert dieselbe Sortierlogik, verwendet jedoch einen älteren Codepfad, der unter sehr großen Datensätzen andere Performance-Eigenschaften aufweisen kann. Verwenden Sie diese Option nur, wenn Sie Konsistenz mit historischen Analyseergebnissen bewahren müssen oder wenn Sie spezifische Kompatibilitätsprobleme mit dem neueren Algorithmus feststellen. Für neue Analysen wird die Standardoption Insert Date Events Before bevorzugt.
No Sorting: Diese Option deaktiviert die automatische Ereignissortierung vollständig und bewahrt die ursprüngliche Reihenfolge, in der Ereignisse in den Quelldaten erscheinen. Verwenden Sie diese Einstellung, wenn Ihre Quelldaten bereits Ereignisse in korrekter chronologischer Reihenfolge enthalten und Sie die Performance durch Vermeidung unnötiger Sortierung maximieren möchten. Dies ist geeignet für Datenquellen mit hochpräzisen Zeitstempeln (einschließlich Millisekunden) und wenn Sie sicher sind, dass die Einfügereihenfolge der chronologischen Reihenfolge entspricht. Seien Sie mit dieser Option jedoch vorsichtig, da sie zu fehlerhaften Prozessflüssen führen kann, wenn Ihre Datenordnung nicht garantiert korrekt ist. Falls Sie später berechnete Ereignisse hinzufügen oder Daten aus mehreren Quellen zusammenführen, müssen Sie eventuell zu einem aktiven Sortieralgorithmus wechseln.
Beispiele
Beispiel 1: Bestellbearbeitung mit nur Datumszeitstempeln
Szenario: Ein Beschaffungssystem verfolgt Bestellungen durch den Genehmigungsprozess, aber das Legacy-ERP-System zeichnet nur das Genehmigungsdatum ohne genaue Uhrzeit auf. Mehrere Genehmigungsschritte (Abteilungsleiter, Finanzcontroller, Geschäftsführung) können am selben Tag erfolgen, aber der Zeitstempel zeigt für alle drei nur „2024-03-15“. Ohne korrekte Reihenfolge würde das Process Mining zufällige Abfolgen anzeigen, was es unmöglich macht, den wahren Genehmigungspfad zu erkennen oder genaue Übergabezeiten zu berechnen.
Einstellungen:
- Order Event Algorithm: Insert Date Events Before
Zusätzliche Konfiguration: Vor Anwendung dieser Anreicherung haben Sie mit der Expected Order-Anreicherung definiert:
- Abteilungsleiter-Genehmigung immer zuerst
- Finanzcontroller-Genehmigung an zweiter Stelle
- Geschäftsführungsgenehmigung als letztes
Ergebnis: Mit Insert Date Events Before werden Ereignisse mit Zeitstempel "2024-03-15 00:00:00" korrekt geordnet:
| Case ID | Aktivität | Originaler Zeitstempel | Sortierte Position | Expected Order |
|---|---|---|---|---|
| PO-1234 | Abteilungsleiter-Genehmigung | 2024-03-15 | 1 | 10 |
| PO-1234 | Finanzcontroller-Genehmigung | 2024-03-15 | 2 | 20 |
| PO-1234 | Geschäftsführungsgenehmigung | 2024-03-15 | 3 | 30 |
Der Prozessfluss zeigt jetzt die Genehmigungshierarchie korrekt, die Dauerberechnung zwischen den Schritten wird sinnvoll und die Konformitätsprüfung kann bestätigen, dass die erwartete Abfolge eingehalten wurde.
Erkenntnis: Diese Konfiguration gewährleistet, dass Ihre Prozessmining-Analyse auch bei nur Datumszeitstempeln die notwendige Genehmigungshierarchie genau abbildet. Ohne diese Anreicherung könnten die drei Genehmigungen in zufälliger Reihenfolge bei verschiedenen Fällen erscheinen, Muster verdecken und es unmöglich machen, Fälle zu erkennen, bei denen Genehmigungen außer Reihenfolge erfolgten.
Beispiel 2: Hochleistungsanalyse mit präzisen Zeitstempeln
Szenario: Ein Manufacturing Execution System (MES) protokolliert jeden Produktionsschritt mit Millisekunden-Genauigkeit. Jede Arbeitsstation erfasst Start- und Endzeiten für Vorgänge wie „Material geladen“, „Schweißen abgeschlossen“, „Qualitätsprüfung“ und „Verpackung fertig“ mit Zeitstempeln wie „2024-03-15 14:32:18.437“. Das Datenvolumen ist beträchtlich (Millionen von Ereignissen) und Sie möchten die Anreicherungsperformance optimieren, da die Zeitstempel bereits eine eindeutige Reihenfolge gewährleisten.
Einstellungen:
- Order Event Algorithm: No Sorting
Ergebnis: Ereignisse werden in der ursprünglichen Einfügereihenfolge ohne zusätzliche Sortierung verarbeitet:
| Case ID | Aktivität | Zeitstempel | Originalreihenfolge erhalten |
|---|---|---|---|
| WO-5678 | Material geladen | 2024-03-15 14:32:18.437 | Position 1 |
| WO-5678 | Schweißen abgeschlossen | 2024-03-15 14:35:42.891 | Position 2 |
| WO-5678 | Qualitätsprüfung | 2024-03-15 14:38:15.234 | Position 3 |
| WO-5678 | Verpackung fertig | 2024-03-15 14:41:03.567 | Position 4 |
Die Anreicherungsverarbeitung ist 15-20% schneller im Vergleich zu aktiven Sortieralgorithmen, insbesondere beim Neugenerieren der Fallansicht nach mehreren Anreicherungen.
Erkenntnis: Wenn Ihre Quelldaten hochwertige, präzise Zeitstempel enthalten, kann das Deaktivieren der Sortierung die Performance bei großen Datensätzen erheblich verbessern, ohne die Genauigkeit zu beeinträchtigen. Dies ist besonders wertvoll in Echtzeit- oder Near-Real-Time-Process-Mining-Szenarien, bei denen Anreicherungsgeschwindigkeit wichtig ist. Überwachen Sie jedoch zu Beginn sorgfältig Ihre Prozessflüsse, um sicherzugehen, dass die Quelldaten tatsächlich die richtige Reihenfolge einhalten.
Beispiel 3: Historische Datenmigration mit gemischten Zeitstempeln
Szenario: Ein Finanzdienstleister migriert 10 Jahre Kreditantragsdaten von einem Legacy-System auf eine neue Prozess-Mining-Plattform. Historische Ereignisse (2015-2020) haben nur Datumsstempel, während neuere Ereignisse (2021-heute) präzise Zeitstempel enthalten. Zudem wurden einige historische Ereignisse im Bulk geladen und tragen Einfügezeitstempel vom Migrationsdatum statt des tatsächlichen Ereignisdatums. Die Expected Order-Anreicherung wurde zur Definition der standardmäßigen Abfolge des Kreditantragsprozesses konfiguriert: Antrag eingegangen, Bonitätsprüfung, Einkommensprüfung, Underwriting-Review, Genehmigungsentscheidung.
Einstellungen:
- Order Event Algorithm: Insert Date Events Before
Ergebnis: Für einen historischen Fall von 2017:
| Case ID | Aktivität | Gespeicherter Zeitstempel | Ereignisdatum | Sortierte Position | Expected Order |
|---|---|---|---|---|---|
| LN-9012 | Antrag eingegangen | 2017-06-12 | 2017-06-12 | 1 | 10 |
| LN-9012 | Bonitätsprüfung | 2017-06-12 | 2017-06-12 | 2 | 20 |
| LN-9012 | Einkommensprüfung | 2017-06-13 | 2017-06-13 | 3 | 30 |
| LN-9012 | Underwriting-Review | 2017-06-13 | 2017-06-13 | 4 | 40 |
| LN-9012 | Genehmigungsentscheidung | 2017-06-14 10:30:00 | 2017-06-14 | 5 | 50 |
Für einen aktuellen Fall von 2024:
| Case ID | Aktivität | Gespeicherter Zeitstempel | Sortierte Position |
|---|---|---|---|
| LN-9876 | Antrag eingegangen | 2024-03-15 09:15:23 | 1 |
| LN-9876 | Bonitätsprüfung | 2024-03-15 09:47:11 | 2 |
| LN-9876 | Einkommensprüfung | 2024-03-15 14:22:35 | 3 |
| LN-9876 | Underwriting-Review | 2024-03-16 08:30:12 | 4 |
| LN-9876 | Genehmigungsentscheidung | 2024-03-16 16:45:08 | 5 |
Erkenntnis: Der Insert Date Events Before-Algorithmus handhabt nahtlos Szenarien mit gemischter Datenqualität, indem er das Expected Order-Attribut verwendet, um Ereignisse am gleichen Tag bei historischen Daten zu sequenzieren und sich bei aktuellen Daten auf präzise Zeitstempel stützt. Dies ermöglicht konsistente Prozessanalysen über den gesamten Datensatz hinweg, unabhängig von der Zeitstempelgenauigkeit, und erlaubt genaue Trendanalysen sowie den Vergleich zwischen historischen und aktuellen Prozessleistungen. Der Algorithmus erkennt automatisch, wenn Zeitstempel keine Tageszeit enthalten, und wendet die passende Sortierlogik an.
Beispiel 4: Multi-System-Datenintegration
Szenario: Ein Gesundheitsdienstleister kombiniert Patientendaten aus drei Systemen: einem Terminplanungssystem (Zeitstempel mit Sekunden-Genauigkeit), einem elektronischen Patientendatensystem (EMR) mit vielen historischen Einträgen nur mit Datumszeitstempeln und einem Abrechnungssystem mit Minuten-genauen Zeitstempeln. Ereignisse wie „Termin vereinbart“, „Patient eingetroffen“, „Vitalparameter aufgenommen“, „Arztgespräch“, „Laborauswertung bestellt“, „Laboregebnisse“, „Verordnung ausgestellt“ und „Abrechnung abgeschlossen“ stammen aus unterschiedlichen Quellen mit variierender Zeitstempelgenauigkeit. Die Expected Order-Anreicherung definiert die typische Abfolge eines Patientenbesuchs.
Einstellungen:
- Order Event Algorithm: Insert Date Events Before
Ergebnis: Für einen Patientenbesuch am 15. März 2024:
| Case ID | Aktivität | Quellsystem | Originaler Zeitstempel | Sortierte Position | Expected Order angewendet |
|---|---|---|---|---|---|
| PT-4455 | Termin vereinbart | Terminplanung | 2024-03-10 14:30:00 | 1 | Nein (präzise Zeit) |
| PT-4455 | Patient eingetroffen | Terminplanung | 2024-03-15 09:00:00 | 2 | Nein (präzise Zeit) |
| PT-4455 | Vitalparameter aufgenommen | EMR | 2024-03-15 | 3 | Ja (nur Datum, Reihenfolge 30) |
| PT-4455 | Arztgespräch | EMR | 2024-03-15 | 4 | Ja (nur Datum, Reihenfolge 40) |
| PT-4455 | Laborauswertung bestellt | EMR | 2024-03-15 | 5 | Ja (nur Datum, Reihenfolge 50) |
| PT-4455 | Laboregebnisse | EMR | 2024-03-15 | 6 | Ja (nur Datum, Reihenfolge 60) |
| PT-4455 | Verordnung ausgestellt | EMR | 2024-03-15 | 7 | Ja (nur Datum, Reihenfolge 70) |
| PT-4455 | Abrechnung abgeschlossen | Abrechnung | 2024-03-15 17:00 | 8 | Nein (Stunde/Minute) |
Erkenntnis: Der Insert Date Events Before-Algorithmus passt sich intelligent an die unterschiedliche Zeitstempelgenauigkeit der integrierten Datenquellen an. Er erhält die chronologische Reihenfolge bei präzisen Zeitstempeln und nutzt Expected Order zur Sequenzierung von Ereignissen aus Systemen mit niedriger Auflösung. Dies ermöglicht umfassendes End-to-End-Process-Mining über verschiedene Systeme hinweg, ohne dass teure Qualitätsverbesserungen oder Zeitstempel-Anreicherungen auf Quellsystemebene erforderlich sind. Die resultierenden Prozessflüsse bilden Patientenverläufe korrekt ab und erlauben Analysen zu Übergaben, Wartezeiten und Ressourcennutzung.
Beispiel 5: Rückwärtskompatibilität für historische Analysen
Szenario: Ein Process-Mining-Team analysiert seit drei Jahren Bestellabwicklungsprozesse mit einer älteren mindzieStudio-Version. Sie haben zahlreiche Berichte, Dashboards und KPIs auf Basis dieser Analysen veröffentlicht. Nach einem Upgrade auf eine neuere Plattformversion stellen sie leichte Unterschiede bei einigen Prozesskennzahlen fest, insbesondere bei Aktivitäten am selben Tag. Die Untersuchung zeigt, dass der Ereignisordnungsalgorithmus mit Performancesteigerungen aktualisiert wurde. Um Konsistenz mit historischen Berichten zu wahren und Vergleiche über die Jahre hinweg gültig zu halten, müssen sie den legacy-basierten Algorithmus verwenden.
Einstellungen:
- Order Event Algorithm: Insert Date Events Before (Old)
Ergebnis: Die Prozesskennzahlen und Flussdiagramme entsprechen exakt den zuvor veröffentlichten Analysen:
Aktuelle Analyse (mit altem Algorithmus):
- Durchschnittliche Bestellbearbeitungszeit: 4,2 Tage
- Pünktliche Lieferquote: 87,3%
- Verteilung der Prozessvarianten entspricht historischem Basiswert
- Konformitätsrate: 91,2%
Vergleich mit neuem Algorithmus:
- Durchschnittliche Bestellbearbeitungszeit: 4,2 Tage (keine Veränderung, präzise Zeitstempel)
- Pünktliche Lieferquote: 87,3% (kein Unterschied)
- Neue Prozessvarianten: 2 seltene Varianten entdeckt (0,1% der Fälle)
- Konformitätsrate: 91,0% (leichter Rückgang durch verfeinerte Sortierung)
Erkenntnis: Die Option Old Algorithm gewährleistet Kontinuität bei langfristigen Process Mining-Projekten, bei denen Konsistenz mit historischen Analysen entscheidend ist. Während der neuere Algorithmus bessere Performance und potenziell genauere Reihenfolge in Randfällen bietet, stellt der alte Algorithmus sicher, dass etablierte KPIs, Benchmarks und Trendanalysen über das Upgrade hinweg vergleichbar bleiben. Teams können diese Option während einer Übergangsphase verwenden, Unterschiede auf einer Datenprobe validieren und dann zum neuen Algorithmus für zukünftige Analysen wechseln. Dies stärkt das Vertrauen der Stakeholder in die Analyseergebnisse und ermöglicht die Modernisierung der Plattform.
Output
Die Event Order Algorithmus-Anreicherung erzeugt keine neuen Attribute und ändert keine bestehenden Datenwerte. Stattdessen konfiguriert sie eine systemweite Einstellung, die steuert, wie mindzieStudio intern Ereignisse beim Aufbau der Fallansicht für Analyse und Visualisierung sortiert. Die Auswirkungen dieser Anreicherung sind sichtbar in:
Prozessfluss-Visualisierung: Prozesslandkarten, Variantenanalysen und Direktfolgegraphen spiegeln die durch den gewählten Algorithmus bestimmten Ereignisreihenfolgen wider. Fälle mit Ereignissen gleichen Zeitstempels zeigen konsistente, logische Flussmuster statt zufälliger Reihenfolge.
Dauerberechnung: Anreicherungen, die Zeitdauern zwischen Aktivitäten berechnen (z. B. „Dauer zwischen zwei Aktivitäten“ oder „Dauer zwischen Aktivität und Fallbeginn“), liefern sinnvolle Ergebnisse, da die Ereignisse in korrekter Reihenfolge vorliegen. Ohne richtige Reihenfolge wären Dauerberechnungen für gleichzeitige Ereignisse null oder könnten negative Werte zeigen, falls Ereignisse in umgekehrter Reihenfolge erscheinen.
Konformitätsprüfung: Konformitätsanreicherungen, die Aktivitätsfolgen gegen erwartete Prozessmodelle prüfen, erkennen Abweichungen korrekt. Die korrekte Ereignisreihenfolge sorgt dafür, dass Konformitätsverletzungen tatsächliche Prozessprobleme und nicht Datenqualitätsprobleme widerspiegeln.
Performance-Analyse: Anreicherungen zur Performance-Kategorisierung, die Fälle nach Dauer- oder Zeitkriterien klassifizieren, arbeiten auf richtig sequenzierten Ereignissen für genaue Leistungsbewertungen.
Nachfolgende Anreicherungen: Alle weiteren Anreicherungen in Ihrer Pipeline, die von der Ereignisreihenfolge abhängen (Aktivitätsposition, Vorgänger-Nachfolger-Beziehungen, Fallphasenberechnungen), funktionieren korrekt basierend auf der durch diese Anreicherung etablierten Reihenfolge.
Die Anreicherung wird während der Fallansicht-Generierung durchgeführt, die nach dem Laden des Ereignisprotokolls und bei jeder Anreicherungsanwendung erfolgt. Die Performance-Auswirkung hängt vom Algorithmus ab:
- No Sorting liefert die beste Performance durch vollständigen Verzicht auf Sortierung
- Insert Date Events Before bietet ein ausgewogenes Verhältnis von Genauigkeit und Performance, optimiert für moderne Datensätze
- Insert Date Events Before (Old) sichert Rückwärtskompatibilität, kann aber bei sehr großen Datensätzen langsamer sein
Bei Anwendung dieser Anreicherung regeneriert mindzieStudio die Fallansicht mit dem ausgewählten Algorithmus. Die interne Ereignisfolge wird aktualisiert, die ursprünglichen Zeitstempel in Ihren Daten bleiben unverändert. Das ermöglicht es, zwischen Algorithmen zu wechseln, ohne Quelldaten zu verändern, und verschiedene Ordnungsstrategien auszuprobieren, um die passendste für Ihre Prozessrealität zu finden.
Siehe auch
- Expected Order – Definiert die logische Reihenfolge der Aktivitäten im Prozess, welche von den Insert Date Events Before-Algorithmen zur Reihenfolge gleichzeitiger Ereignisse verwendet wird
- Freeze Log Time – Setzt einen festen Referenzzeitpunkt für zeitbasierte Berechnungen, nützlich bei der Analyse historischer Daten oder der Erstellung reproduzierbarer Analysen
- Shift Activity Time – Verschiebt Zeitstempel um eine definierte Offsetdauer, hilfreich bei Korrektur von Zeitzonenproblemen oder der Angleichung von Daten aus unterschiedlichen Quellen
Diese Dokumentation ist Teil der mindzieStudio Process Mining Plattform.