Doppelte Fälle
Übersicht
Der Duplicate Cases-Rechner identifiziert Fälle mit identischen Werten über ausgewählte Attribute hinweg. Dieses leistungsstarke Werkzeug zur Datenqualität hilft Ihnen, doppelte Einträge, Systemfehler und Probleme der Datenintegrität in Ihren Prozessdaten zu finden.
Häufige Anwendungsfälle
- Finden von Fällen, die mehr als einmal erfasst wurden
- Identifikation von Fällen, die aufgrund von Systemfehlern dupliziert wurden
- Erkennung potenzieller Doppelzahlungen
- Finden doppelter Aufträge oder Rechnungen
- Validierung der Datenintegrität bei Migrationen
Einstellungen
Column Names: Wählen Sie die Liste der Attribute aus, die zur Identifizierung doppelter Fälle verwendet werden. Fälle mit identischen Werten für alle ausgewählten Attribute werden als Duplikate markiert.
Max Rows: Geben Sie die maximale Anzahl an Zeilen an, die in der Ausgabe angezeigt werden sollen.
Beispiel
Identifikation potenziell doppelter Rechnungen
Szenario: Sie möchten Rechnungen identifizieren, die möglicherweise mehrfach mit demselben Lieferanten, Betrag und Datum erfasst wurden.
Einstellungen:
- Column Names: Vendor Name, Invoice Amount, Invoice Date
- Max Rows: 100
Ausgabe:
Der Rechner zeigt zwei Ansichtsmöglichkeiten an:
Duplicate Cases View (Standard):
- Zeigt eine Zeile pro eindeutiger Kombination der ausgewählten Attribute
- Die letzte Spalte zeigt die Anzahl der Fälle, die dieser Kombination entsprechen
- Einträge mit einer Anzahl größer als 1 sind potenzielle Duplikate
Expanded View (Auswahl über Dropdown oben rechts):
- Zeigt alle einzelnen Fälle gruppiert nach passenden Attributwerten
- Zeigt zusätzliche Attribute, die nicht in den Einstellungen spezifiziert sind
- Macht sichtbar, dass Fälle in derselben Gruppe sich in anderen Attributen unterscheiden können (z. B. unterschiedliche Invoice IDs bei gleichen Beträgen)
Erkenntnisse:
Die erweiterte Ansicht ist besonders nützlich, weil sie zeigt, dass Fälle, die basierend auf den ausgewählten Attributen als „Duplikate“ gruppiert wurden, tatsächlich legitime separate Fälle mit unterschiedlichen Werten in anderen Spalten sein können. Zum Beispiel:
- Derselbe Lieferant, Betrag und Datum können zwei verschiedene Rechnungen sein (prüfen Sie die Invoice ID)
- Legitime Doppeltzahlungen vs. Eingabefehler
- Systemgenerierte doppelte Datensätze vs. tatsächliche geschäftliche Duplikate
Dies hilft Ihnen, zwischen echten Duplikaten, die eine Korrektur erfordern, und ähnlichen Fällen, die berechtigterweise getrennt sind, zu unterscheiden.
Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.