Duplikate Fälle im Log

Überblick

Die Erweiterung Duplikate Fälle im Log erstellt physische Kopien vorhandener Fälle innerhalb Ihres Ereignisprotokolls. Dies ist ein spezielles Tool nur für Administratoren, das für Testzwecke entwickelt wurde und Ihnen ermöglicht, Ihren Datensatz schnell durch das Duplizieren von Fällen mit modifizierten Fall-IDs zu erweitern. Jeder duplizierte Fall behält alle ursprünglichen Ereignisse und Attribute bei, erhält jedoch eine neue eindeutige Kennung, um ihn vom Quellfall zu unterscheiden.

Diese Erweiterung ist besonders nützlich, wenn Sie testen möchten, wie Ihre Process-Mining-Analyse, Filter oder Dashboards mit größeren Datensätzen funktionieren, oder wenn Sie synthetische Daten für Schulungs- und Demonstrationszwecke erstellen möchten.

Hinweis: Diese Erweiterung steht nur Administratoren zur Verfügung, da sie erhebliche Auswirkungen auf das Datenvolumen hat und für Test- und Entwicklungsszenarien gedacht ist, nicht für Produktionsanalysen.

Übliche Verwendungszwecke

  • Kleine Testdatensätze erweitern, um Datenvolumen in Produktionsgröße zu simulieren
  • Stresstest-Szenarien für die Leistungsbewertung von Dashboards und Rechnern erstellen
  • Duplizierte Daten generieren, um das Verhalten von Filtern bei größerer Fallanzahl zu testen
  • Demonstrationsdatensätze mit ausreichendem Umfang für Schulungszwecke vorbereiten
  • Systemleistung und Antwortzeiten bei erhöhter Datenlast testen
  • Validieren, dass Erweiterungen und Berechnungen große Datensätze korrekt verarbeiten

Einstellungen

Anzahl der Kopien: Legen Sie fest, wie viele Kopien von jedem Fall erstellt werden sollen. Beispielsweise führt der Wert 5 dazu, dass jeder Originalfall 5-mal dupliziert wird, was Ihre Gesamtfallanzahl effektiv um den Faktor 6 (Original + 5 Kopien) erhöht. Der Standardwert ist 1, was Ihren Datensatz verdoppelt.

Beispiel

Datensatz erweitert für Leistungstests

Szenario: Sie haben ein Prozessprotokoll mit 100 Fällen und müssen testen, wie Ihr Dashboard mit 1.000 Fällen vor dem Einsatz in der Produktion reagiert.

Einstellungen:

  • Anzahl der Kopien: 9

Vorher: | Case ID | Aktivität | Zeitstempel | |---------|-----------|-------------| | PO-001 | Bestellung anlegen | 2024-01-15 09:00 | | PO-001 | Bestellung freigeben | 2024-01-15 10:00 | | PO-002 | Bestellung anlegen | 2024-01-15 11:00 | | PO-002 | Bestellung freigeben | 2024-01-15 12:00 |

Nachher (zeigt Kopien für PO-001): | Case ID | Aktivität | Zeitstempel | |-----------|-----------|-------------| | PO-001 | Bestellung anlegen | 2024-01-15 09:00 | | PO-001 | Bestellung freigeben | 2024-01-15 10:00 | | PO-001_2 | Bestellung anlegen | 2024-01-15 09:00 | | PO-001_2 | Bestellung freigeben | 2024-01-15 10:00 | | PO-001_3 | Bestellung anlegen | 2024-01-15 09:00 | | ... | ... | ... | | PO-001_10 | Bestellung anlegen | 2024-01-15 09:00 | | PO-001_10 | Bestellung freigeben | 2024-01-15 10:00 |

Ergebnis: Ihr 100-Fälle-Datensatz enthält jetzt 1.000 Fälle, sodass Sie Leistungseigenschaften im größeren Maßstab testen können.

Erkenntnisse: Nach dem Duplizieren von Fällen können Sie Leistungsengpässe bei Rechnern identifizieren und feststellen, welche Visualisierungen vor dem Einsatz mit Produktionsdatenvolumen optimiert werden müssen.

Funktionsweise

  1. Falliteration: Die Erweiterung durchläuft alle vorhandenen Fälle in Ihrem Ereignisprotokoll.
  2. Fallduplizierung: Für jeden Originalfall werden die angegebene Anzahl von Kopien erstellt.
  3. ID-Erzeugung: Jeder Kopie wird eine eindeutige Fall-ID zugewiesen, indem "_n" an die Original-ID angehängt wird (wobei n die Kopiennummer ab 2 ist).
  4. Ereigniskopie: Alle Ereignisse des Originalfalls werden zum neuen Fall kopiert, wobei Zeitstempel und alle Ereignisattribute erhalten bleiben.
  5. Attributerhaltung: Alle fallbezogenen Attribute (außer berechneten Spalten) werden auf die neuen Fälle übertragen.
  6. Log-Abschluss: Das Ereignisprotokoll wird mit den erweiterten Fall- und Ereignistabellen abgeschlossen.

Ausgabe

Die Erweiterung verändert das Ereignisprotokoll durch:

  • Neue Fälle: Erstellt (NumberOfCopies * Originalfallanzahl) zusätzliche Fälle
  • Fall-IDs: Neue Fälle haben IDs im Format "OriginalCaseId_n", wobei n der Kopierindex (2, 3, 4 usw.) ist
  • Ereignisse: Jeder neue Fall enthält genaue Kopien aller Ereignisse des Originalfalls
  • Attribute: Alle Fall- und Ereignisattribute bleiben bei duplizierten Fällen und Ereignissen erhalten

Wichtige Hinweise:

  • Diese Erweiterung erstellt keine neuen Attribute
  • Die Originalfälle bleiben unverändert
  • Berechnete Spalten werden nicht kopiert (sie werden basierend auf den Daten neu berechnet)
  • Versteckte Spalten werden nicht auf neue Ereignisse übernommen

Beste Praktiken

  • Verwenden Sie diese Erweiterung nur in Entwicklungs- oder Testumgebungen
  • Achten Sie auf das Datenvolumen – das Duplizieren großer Datensätze kann die Verarbeitungszeit erheblich erhöhen
  • Entfernen Sie die Erweiterung oder speichern Sie nach dem Testen eine separate Kopie Ihres Notebooks
  • Berücksichtigen Sie die Auswirkungen auf berechnete Kennzahlen, die durch doppelte Datenmuster beeinflusst werden können

Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.