Dubbele Zaken Filter
Overzicht
De Dubbele Zaken filter identificeert en selecteert zaken die identieke waarden delen over meerdere opgegeven kolommen. Deze geavanceerde filter op zaakniveau helpt bij het detecteren van potentiële dubbele transacties, herhaalde inzendingen of datakwaliteitsproblemen waarbij dezelfde zakelijke entiteit meerdere keren voorkomt in je procesdata.
Gebruikelijke Toepassingen
- Dubbele factuurinzendingen identificeren in crediteurenbeheer
- Herhaalde klantorders met identieke details vinden
- Potentiële fraude opsporen door dubbele transactiepatronen
- Problemen bij datamigratie met gerepliceerde records ontdekken
- Zaken identificeren die samengevoegd hadden moeten worden
- Patronen analyseren in terugkerende inzendingen of verzoeken
Instellingen
Kolomnamen: Selecteer 2 tot 5 kolommen voor dubbele detectie. Zaken met identieke waarden over ALLE geselecteerde kolommen worden als duplicaten beschouwd. Alleen kolommen met vergelijkbare datatypes zijn beschikbaar (String, Integer, DateTime, etc.).
Werking:
- Groepeert zaken op de waarden in alle geselecteerde kolommen
- Identificeert groepen met 2 of meer zaken
- Returned alle zaken die tot een dubbele groep behoren
- Resultaten worden gerangschikt op groepsgrootte (grootste dubbele groepen eerst)
Ondersteunde Kolomtypes: String, Int32, Int64, Double, Single, DateTime, TimeSpan
Voorbeelden
Voorbeeld 1: Detectie van Dubbele Facturen
Scenario: Je wilt potentiële dubbele facturen vinden in je crediteurenproces door te matchen op leverancier, bedrag en factuurdatum.
Instellingen:
- Kolomnamen: ["Vendor", "Invoice Amount", "Invoice Date"]
Resultaat:
Zaken waarbij alle drie de waarden overeenkomen worden gegroepeerd. Groep 1: 5 facturen van "Acme Corp" voor $10.000 gedateerd 2024-01-15. Groep 2: 3 facturen van "Beta LLC" voor $5.500 gedateerd 2024-02-01. Enkele facturen met unieke combinaties worden uitgesloten.
Inzichten: Meerdere facturen met identieke leverancier, bedrag en datum duiden vaak op dubbele inzendingen die kunnen leiden tot dubbele betalingen. Deze moeten worden onderzocht en mogelijk geblokkeerd.
Voorbeeld 2: Dubbele Klantorders
Scenario: Je orderbeheerproces kan dubbele orders bevatten wanneer klanten meerdere keren inzenden. Je wilt orders vinden met overeenkomende klant, product en hoeveelheid.
Instellingen:
- Kolomnamen: ["Customer ID", "Product Code", "Order Quantity"]
Resultaat:
Orders met identieke klant, product en hoeveelheid worden gemarkeerd. Dit vangt scenario’s waarin een klant per ongeluk dezelfde order meerdere keren binnen korte tijd heeft ingediend.
Inzichten: Dubbele orders verhogen de vervullingskosten, veroorzaken voorraadproblemen en leiden tot klantontevredenheid wanneer zij ongewenste duplicaten ontvangen.
Voorbeeld 3: Analyse van Transactiepatronen
Scenario: Je onderzoekt mogelijke fraude door te zoeken naar transacties met overeenkomende bedragen, bronrekeningen en transactietijden.
Instellingen:
- Kolomnamen: ["Source Account", "Amount", "Transaction Hour"]
Resultaat:
Transacties van dezelfde rekening, met hetzelfde bedrag, binnen hetzelfde uur worden gegroepeerd. Dit patroon kan wijzen op geautomatiseerde fraude of systeemfouten die dubbele transacties veroorzaken.
Inzichten: Legitieme transacties hebben zelden identieke kenmerken over meerdere velden. Hoge duplicaatpercentages rechtvaardigen diepgaand onderzoek naar specifieke rekeningen of tijdsperioden.
Voorbeeld 4: Verificatie van Datamigratie
Scenario: Na migratie van data uit een legacy systeem wil je controleren dat records niet zijn gedupliceerd tijdens het migratieproces.
Instellingen:
- Kolomnamen: ["Legacy ID", "Creation Date"]
Resultaat:
Records met dezelfde legacy-ID en creatiedatum worden gemarkeerd als potentiële migratieduplicaten. Idealiter geeft dit geen resultaten als de migratie schoon is verlopen.
Inzichten: Migratieduplicaten kunnen rapportagefouten, complianceproblemen en operationele verwarring veroorzaken. Het identificeren ervan maakt opschoning mogelijk voordat downstream problemen ontstaan.
Voorbeeld 5: Matching op Meerdere Kolommen
Scenario: Je wilt inkooporders vinden die mogelijk duplicaten zijn gebaseerd op uitgebreide matching: dezelfde leverancier, hetzelfde bedrag, dezelfde afdeling en dezelfde gevraagde datum.
Instellingen:
- Kolomnamen: ["Vendor Name", "PO Amount", "Department", "Requested Date"]
Resultaat:
Inkooporders die op alle vier dimensies overeenkomen worden geïdentificeerd. Deze strikte matching vermindert false positives terwijl echte duplicaten die door inkoopcontroles zijn geglipt worden opgespoord.
Inzichten: Meer kolommen gebruiken maakt matching strikter maar ook nauwkeuriger. Begin met minder kolommen als je verkent, voeg daarna meer toe om false positives te verminderen.
Output
Deze filter werkt op zaakniveau via multi-kolom groepsvorming:
- Groepeert zaken op waarden over alle opgegeven kolommen
- Returned alleen zaken die in groepen van 2 of meer voorkomen
- Resultaten worden gesorteerd op duplicaatgroep grootte (grootste eerst)
- Vereist 2-5 kolommen voor dubbele detectie
- Kolommen moeten vergelijkbare datatypes bevatten
- Verborgen kolommen en zaak-ID kolommen zijn uitgesloten
- Alle zaak- en gebeurtenisattributen blijven behouden voor gematchte zaken
Gebruik de Dubbele Zaken filter om potentiële datakwaliteitsproblemen te identificeren, dubbele inzendingen te detecteren of zaken te vinden die mogelijk dezelfde zakelijke transactie meerdere keren vertegenwoordigen.
Deze documentatie maakt deel uit van het mindzie Studio proces mining platform.