Duplikate-Fälle-Filter

Übersicht

Der Duplikate-Fälle-Filter identifiziert und selektiert Fälle, die in mehreren angegebenen Spalten identische Werte aufweisen. Dieser fortgeschrittene Fallfilter auf Ebene von Einzelfällen hilft dabei, potenzielle doppelte Transaktionen, wiederholte Einreichungen oder Datenqualitätsprobleme zu erkennen, bei denen dieselbe Geschäftseinheit mehrfach in Ihren Prozessdaten erscheint.

Häufige Anwendungsfälle

Identifikation doppelter Rechnungseinreichungen in der Kreditorenbuchhaltung
Auffinden wiederholter Kundenbestellungen mit identischen Details
Erkennung potenziellen Betrugs durch doppelte Transaktionsmuster
Aufdeckung von Problemen bei der Datenmigration mit duplizierten Datensätzen
Identifikation von Fällen, die hätten zusammengeführt werden sollen
Analyse von Mustern bei wiederkehrenden Einreichungen oder Anfragen

Einstellungen

Spaltennamen: Wählen Sie 2 bis 5 Spalten zur duplikaterkennung aus. Fälle mit identischen Werten in ALLEN ausgewählten Spalten gelten als Duplikate. Es stehen nur Spalten mit vergleichbaren Datentypen zur Verfügung (String, Integer, DateTime usw.).

Funktionsweise:

Gruppiert Fälle nach den Werten in allen ausgewählten Spalten
Identifiziert Gruppen mit 2 oder mehr Fällen
Gibt alle Fälle zurück, die zu einer Duplikatgruppe gehören
Ergebnisse werden nach Gruppengröße sortiert (größte Duplikatgruppen zuerst)

Unterstützte Spaltentypen: String, Int32, Int64, Double, Single, DateTime, TimeSpan

Beispiele

Beispiel 1: Duplikaterkennung bei Rechnungen

Szenario: Sie möchten potenziell doppelte Rechnungen in Ihrem Kreditorenprozess finden, indem Sie nach Lieferant, Betrag und Rechnungsdatum abgleichen.

Einstellungen:

Spaltennamen: ["Vendor", "Invoice Amount", "Invoice Date"]

Ergebnis:

Fälle, bei denen alle drei Werte übereinstimmen, werden gruppiert. Gruppe 1: 5 Rechnungen von "Acme Corp" über $10.000 vom 15.01.2024. Gruppe 2: 3 Rechnungen von "Beta LLC" über $5.500 vom 01.02.2024. Einzelrechnungen mit einzigartigen Kombinationen werden ausgeschlossen.

Erkenntnisse: Mehrere Rechnungen mit identischem Lieferanten, Betrag und Datum deuten häufig auf doppelte Einreichungen hin, die zu Doppelzahlungen führen können. Diese erfordern Untersuchung und gegebenenfalls Sperrung.

Beispiel 2: Duplikate bei Kundenbestellungen

Szenario: Ihr Auftragsmanagementprozess kann doppelte Bestellungen enthalten, wenn Kunden mehrfach einreichen. Sie möchten Bestellungen mit übereinstimmendem Kunden, Produkt und Menge finden.

Einstellungen:

Spaltennamen: ["Customer ID", "Product Code", "Order Quantity"]

Ergebnis:

Bestellungen mit identischem Kunden, Produkt und Menge werden markiert. Dies erfasst Fälle, in denen ein Kunde versehentlich dieselbe Bestellung mehrfach innerhalb kurzer Zeit eingereicht hat.

Erkenntnisse: Doppelte Bestellungen erhöhen Fulfillment-Kosten, führen zu Lagerproblemen und verursachen Kundenzufriedenheitsprobleme, wenn unerwünschte Duplikate geliefert werden.

Beispiel 3: Analyse von Transaktionsmustern

Szenario: Sie untersuchen potenziellen Betrug, indem Sie nach Transaktionen mit übereinstimmendem Betrag, Quellkonto und Transaktionszeit suchen.

Einstellungen:

Spaltennamen: ["Source Account", "Amount", "Transaction Hour"]

Ergebnis:

Transaktionen vom gleichen Konto, mit identischem Betrag, in derselben Stunde werden gruppiert. Dieses Muster könnte auf automatisierten Betrug oder Systemfehler hinweisen, die doppelte Transaktionen erzeugen.

Erkenntnisse: Legitime Transaktionen weisen selten identische Merkmale über mehrere Felder hinweg auf. Hohe Duplikatraten erfordern tiefergehende Untersuchungen spezifischer Konten oder Zeiträume.

Beispiel 4: Verifikation der Datenmigration

Szenario: Nach der Migration von Daten aus einem Altsystem möchten Sie sicherstellen, dass Datensätze während des Migrationsprozesses nicht dupliziert wurden.

Einstellungen:

Spaltennamen: ["Legacy ID", "Creation Date"]

Ergebnis:

Datensätze mit derselben Legacy-ID und demselben Erstellungsdatum werden als potenzielle Migrationsduplikate markiert. Idealerweise sollte dies keine Ergebnisse liefern, wenn die Migration sauber verlief.

Erkenntnisse: Migrationsduplikate können Berichtsungenauigkeiten, Compliance-Probleme und betriebliche Verwirrung verursachen. Ihre Identifikation ermöglicht Datenbereinigung bevor sie Folgeprobleme verursachen.

Beispiel 5: Übereinstimmung mit mehreren Spalten

Szenario: Sie möchten Bestellungen finden, die potenziell doppelt sind, basierend auf umfassendem Abgleich: gleicher Lieferant, gleicher Betrag, gleiche Abteilung und gleiches Anfragedatum.

Einstellungen:

Spaltennamen: ["Vendor Name", "PO Amount", "Department", "Requested Date"]

Ergebnis:

Bestellungen, die in allen vier Dimensionen übereinstimmen, werden identifiziert. Diese strenge Übereinstimmung reduziert Fehlalarme, trifft aber weiterhin echte Duplikate, die bei der Beschaffung durchgerutscht sind.

Erkenntnisse: Mehr Spalten machen den Abgleich strenger, aber präziser. Beginnen Sie mit weniger Spalten, wenn Sie Explorieren, und fügen Sie dann mehr hinzu, um Fehlalarme zu verringern.

Ausgabe

Dieser Filter arbeitet auf Fall-Ebene mit Multi-Spalten-Gruppierung:

Gruppiert Fälle nach Werten aller angegebenen Spalten
Gibt nur Fälle zurück, die in Gruppen mit 2 oder mehr Fällen auftauchen
Ergebnisse nach Größe der Duplikatgruppen sortiert (größte zuerst)
Erfordert 2-5 Spalten zur Duplikaterkennung
Spalten müssen vergleichbare Datentypen enthalten
Versteckte Spalten und Fall-ID-Spalten sind ausgeschlossen
Erhält alle Fall- und Ereignisattribute der gefundenen Fälle

Verwenden Sie den Duplikate-Fälle-Filter, um potenzielle Datenqualitätsprobleme zu identifizieren, doppelte Einreichungen zu erkennen oder Fälle zu finden, die dieselbe Geschäfts-Transaktion mehrfach abbilden.

Diese Dokumentation ist Teil der mindzie Studio Prozess-Minings-Plattform.