Dubbele Zaken Filter

Overzicht

De Dubbele Zaken filter identificeert en selecteert zaken die identieke waarden delen over meerdere opgegeven kolommen. Deze geavanceerde filter op zaakniveau helpt bij het detecteren van potentiële dubbele transacties, herhaalde inzendingen of datakwaliteitsproblemen waarbij dezelfde zakelijke entiteit meerdere keren voorkomt in je procesdata.

Gebruikelijke Toepassingen

Dubbele factuurinzendingen identificeren in crediteurenbeheer
Herhaalde klantorders met identieke details vinden
Potentiële fraude opsporen door dubbele transactiepatronen
Problemen bij datamigratie met gerepliceerde records ontdekken
Zaken identificeren die samengevoegd hadden moeten worden
Patronen analyseren in terugkerende inzendingen of verzoeken

Instellingen

Kolomnamen: Selecteer 2 tot 5 kolommen voor dubbele detectie. Zaken met identieke waarden over ALLE geselecteerde kolommen worden als duplicaten beschouwd. Alleen kolommen met vergelijkbare datatypes zijn beschikbaar (String, Integer, DateTime, etc.).

Werking:

Groepeert zaken op de waarden in alle geselecteerde kolommen
Identificeert groepen met 2 of meer zaken
Returned alle zaken die tot een dubbele groep behoren
Resultaten worden gerangschikt op groepsgrootte (grootste dubbele groepen eerst)

Ondersteunde Kolomtypes: String, Int32, Int64, Double, Single, DateTime, TimeSpan

Voorbeelden

Voorbeeld 1: Detectie van Dubbele Facturen

Scenario: Je wilt potentiële dubbele facturen vinden in je crediteurenproces door te matchen op leverancier, bedrag en factuurdatum.

Instellingen:

Kolomnamen: ["Vendor", "Invoice Amount", "Invoice Date"]

Resultaat:

Zaken waarbij alle drie de waarden overeenkomen worden gegroepeerd. Groep 1: 5 facturen van "Acme Corp" voor $10.000 gedateerd 2024-01-15. Groep 2: 3 facturen van "Beta LLC" voor $5.500 gedateerd 2024-02-01. Enkele facturen met unieke combinaties worden uitgesloten.

Inzichten: Meerdere facturen met identieke leverancier, bedrag en datum duiden vaak op dubbele inzendingen die kunnen leiden tot dubbele betalingen. Deze moeten worden onderzocht en mogelijk geblokkeerd.

Voorbeeld 2: Dubbele Klantorders

Scenario: Je orderbeheerproces kan dubbele orders bevatten wanneer klanten meerdere keren inzenden. Je wilt orders vinden met overeenkomende klant, product en hoeveelheid.

Instellingen:

Kolomnamen: ["Customer ID", "Product Code", "Order Quantity"]

Resultaat:

Orders met identieke klant, product en hoeveelheid worden gemarkeerd. Dit vangt scenario’s waarin een klant per ongeluk dezelfde order meerdere keren binnen korte tijd heeft ingediend.

Inzichten: Dubbele orders verhogen de vervullingskosten, veroorzaken voorraadproblemen en leiden tot klantontevredenheid wanneer zij ongewenste duplicaten ontvangen.

Voorbeeld 3: Analyse van Transactiepatronen

Scenario: Je onderzoekt mogelijke fraude door te zoeken naar transacties met overeenkomende bedragen, bronrekeningen en transactietijden.

Instellingen:

Kolomnamen: ["Source Account", "Amount", "Transaction Hour"]

Resultaat:

Transacties van dezelfde rekening, met hetzelfde bedrag, binnen hetzelfde uur worden gegroepeerd. Dit patroon kan wijzen op geautomatiseerde fraude of systeemfouten die dubbele transacties veroorzaken.

Inzichten: Legitieme transacties hebben zelden identieke kenmerken over meerdere velden. Hoge duplicaatpercentages rechtvaardigen diepgaand onderzoek naar specifieke rekeningen of tijdsperioden.

Voorbeeld 4: Verificatie van Datamigratie

Scenario: Na migratie van data uit een legacy systeem wil je controleren dat records niet zijn gedupliceerd tijdens het migratieproces.

Instellingen:

Kolomnamen: ["Legacy ID", "Creation Date"]

Resultaat:

Records met dezelfde legacy-ID en creatiedatum worden gemarkeerd als potentiële migratieduplicaten. Idealiter geeft dit geen resultaten als de migratie schoon is verlopen.

Inzichten: Migratieduplicaten kunnen rapportagefouten, complianceproblemen en operationele verwarring veroorzaken. Het identificeren ervan maakt opschoning mogelijk voordat downstream problemen ontstaan.

Voorbeeld 5: Matching op Meerdere Kolommen

Scenario: Je wilt inkooporders vinden die mogelijk duplicaten zijn gebaseerd op uitgebreide matching: dezelfde leverancier, hetzelfde bedrag, dezelfde afdeling en dezelfde gevraagde datum.

Instellingen:

Kolomnamen: ["Vendor Name", "PO Amount", "Department", "Requested Date"]

Resultaat:

Inkooporders die op alle vier dimensies overeenkomen worden geïdentificeerd. Deze strikte matching vermindert false positives terwijl echte duplicaten die door inkoopcontroles zijn geglipt worden opgespoord.

Inzichten: Meer kolommen gebruiken maakt matching strikter maar ook nauwkeuriger. Begin met minder kolommen als je verkent, voeg daarna meer toe om false positives te verminderen.

Output

Deze filter werkt op zaakniveau via multi-kolom groepsvorming:

Groepeert zaken op waarden over alle opgegeven kolommen
Returned alleen zaken die in groepen van 2 of meer voorkomen
Resultaten worden gesorteerd op duplicaatgroep grootte (grootste eerst)
Vereist 2-5 kolommen voor dubbele detectie
Kolommen moeten vergelijkbare datatypes bevatten
Verborgen kolommen en zaak-ID kolommen zijn uitgesloten
Alle zaak- en gebeurtenisattributen blijven behouden voor gematchte zaken

Gebruik de Dubbele Zaken filter om potentiële datakwaliteitsproblemen te identificeren, dubbele inzendingen te detecteren of zaken te vinden die mogelijk dezelfde zakelijke transactie meerdere keren vertegenwoordigen.

Deze documentatie maakt deel uit van het mindzie Studio proces mining platform.