Duplikate-Fälle-Filter
Übersicht
Der Duplikate-Fälle-Filter identifiziert und selektiert Fälle, die in mehreren angegebenen Spalten identische Werte aufweisen. Dieser fortgeschrittene Fallfilter auf Ebene von Einzelfällen hilft dabei, potenzielle doppelte Transaktionen, wiederholte Einreichungen oder Datenqualitätsprobleme zu erkennen, bei denen dieselbe Geschäftseinheit mehrfach in Ihren Prozessdaten erscheint.
Häufige Anwendungsfälle
- Identifikation doppelter Rechnungseinreichungen in der Kreditorenbuchhaltung
- Auffinden wiederholter Kundenbestellungen mit identischen Details
- Erkennung potenziellen Betrugs durch doppelte Transaktionsmuster
- Aufdeckung von Problemen bei der Datenmigration mit duplizierten Datensätzen
- Identifikation von Fällen, die hätten zusammengeführt werden sollen
- Analyse von Mustern bei wiederkehrenden Einreichungen oder Anfragen
Einstellungen
Spaltennamen: Wählen Sie 2 bis 5 Spalten zur duplikaterkennung aus. Fälle mit identischen Werten in ALLEN ausgewählten Spalten gelten als Duplikate. Es stehen nur Spalten mit vergleichbaren Datentypen zur Verfügung (String, Integer, DateTime usw.).
Funktionsweise:
- Gruppiert Fälle nach den Werten in allen ausgewählten Spalten
- Identifiziert Gruppen mit 2 oder mehr Fällen
- Gibt alle Fälle zurück, die zu einer Duplikatgruppe gehören
- Ergebnisse werden nach Gruppengröße sortiert (größte Duplikatgruppen zuerst)
Unterstützte Spaltentypen: String, Int32, Int64, Double, Single, DateTime, TimeSpan
Beispiele
Beispiel 1: Duplikaterkennung bei Rechnungen
Szenario: Sie möchten potenziell doppelte Rechnungen in Ihrem Kreditorenprozess finden, indem Sie nach Lieferant, Betrag und Rechnungsdatum abgleichen.
Einstellungen:
- Spaltennamen: ["Vendor", "Invoice Amount", "Invoice Date"]
Ergebnis:
Fälle, bei denen alle drei Werte übereinstimmen, werden gruppiert. Gruppe 1: 5 Rechnungen von "Acme Corp" über $10.000 vom 15.01.2024. Gruppe 2: 3 Rechnungen von "Beta LLC" über $5.500 vom 01.02.2024. Einzelrechnungen mit einzigartigen Kombinationen werden ausgeschlossen.
Erkenntnisse: Mehrere Rechnungen mit identischem Lieferanten, Betrag und Datum deuten häufig auf doppelte Einreichungen hin, die zu Doppelzahlungen führen können. Diese erfordern Untersuchung und gegebenenfalls Sperrung.
Beispiel 2: Duplikate bei Kundenbestellungen
Szenario: Ihr Auftragsmanagementprozess kann doppelte Bestellungen enthalten, wenn Kunden mehrfach einreichen. Sie möchten Bestellungen mit übereinstimmendem Kunden, Produkt und Menge finden.
Einstellungen:
- Spaltennamen: ["Customer ID", "Product Code", "Order Quantity"]
Ergebnis:
Bestellungen mit identischem Kunden, Produkt und Menge werden markiert. Dies erfasst Fälle, in denen ein Kunde versehentlich dieselbe Bestellung mehrfach innerhalb kurzer Zeit eingereicht hat.
Erkenntnisse: Doppelte Bestellungen erhöhen Fulfillment-Kosten, führen zu Lagerproblemen und verursachen Kundenzufriedenheitsprobleme, wenn unerwünschte Duplikate geliefert werden.
Beispiel 3: Analyse von Transaktionsmustern
Szenario: Sie untersuchen potenziellen Betrug, indem Sie nach Transaktionen mit übereinstimmendem Betrag, Quellkonto und Transaktionszeit suchen.
Einstellungen:
- Spaltennamen: ["Source Account", "Amount", "Transaction Hour"]
Ergebnis:
Transaktionen vom gleichen Konto, mit identischem Betrag, in derselben Stunde werden gruppiert. Dieses Muster könnte auf automatisierten Betrug oder Systemfehler hinweisen, die doppelte Transaktionen erzeugen.
Erkenntnisse: Legitime Transaktionen weisen selten identische Merkmale über mehrere Felder hinweg auf. Hohe Duplikatraten erfordern tiefergehende Untersuchungen spezifischer Konten oder Zeiträume.
Beispiel 4: Verifikation der Datenmigration
Szenario: Nach der Migration von Daten aus einem Altsystem möchten Sie sicherstellen, dass Datensätze während des Migrationsprozesses nicht dupliziert wurden.
Einstellungen:
- Spaltennamen: ["Legacy ID", "Creation Date"]
Ergebnis:
Datensätze mit derselben Legacy-ID und demselben Erstellungsdatum werden als potenzielle Migrationsduplikate markiert. Idealerweise sollte dies keine Ergebnisse liefern, wenn die Migration sauber verlief.
Erkenntnisse: Migrationsduplikate können Berichtsungenauigkeiten, Compliance-Probleme und betriebliche Verwirrung verursachen. Ihre Identifikation ermöglicht Datenbereinigung bevor sie Folgeprobleme verursachen.
Beispiel 5: Übereinstimmung mit mehreren Spalten
Szenario: Sie möchten Bestellungen finden, die potenziell doppelt sind, basierend auf umfassendem Abgleich: gleicher Lieferant, gleicher Betrag, gleiche Abteilung und gleiches Anfragedatum.
Einstellungen:
- Spaltennamen: ["Vendor Name", "PO Amount", "Department", "Requested Date"]
Ergebnis:
Bestellungen, die in allen vier Dimensionen übereinstimmen, werden identifiziert. Diese strenge Übereinstimmung reduziert Fehlalarme, trifft aber weiterhin echte Duplikate, die bei der Beschaffung durchgerutscht sind.
Erkenntnisse: Mehr Spalten machen den Abgleich strenger, aber präziser. Beginnen Sie mit weniger Spalten, wenn Sie Explorieren, und fügen Sie dann mehr hinzu, um Fehlalarme zu verringern.
Ausgabe
Dieser Filter arbeitet auf Fall-Ebene mit Multi-Spalten-Gruppierung:
- Gruppiert Fälle nach Werten aller angegebenen Spalten
- Gibt nur Fälle zurück, die in Gruppen mit 2 oder mehr Fällen auftauchen
- Ergebnisse nach Größe der Duplikatgruppen sortiert (größte zuerst)
- Erfordert 2-5 Spalten zur Duplikaterkennung
- Spalten müssen vergleichbare Datentypen enthalten
- Versteckte Spalten und Fall-ID-Spalten sind ausgeschlossen
- Erhält alle Fall- und Ereignisattribute der gefundenen Fälle
Verwenden Sie den Duplikate-Fälle-Filter, um potenzielle Datenqualitätsprobleme zu identifizieren, doppelte Einreichungen zu erkennen oder Fälle zu finden, die dieselbe Geschäfts-Transaktion mehrfach abbilden.
Diese Dokumentation ist Teil der mindzie Studio Prozess-Minings-Plattform.