Dubbele Cases

Overzicht

De Duplicate Cases calculator identificeert cases met identieke waarden over geselecteerde attributen. Deze krachtige tool voor datakwaliteit helpt je om dubbele invoeren, systeemfouten en problemen met dataintegriteit in je procesdata te vinden.

Veelvoorkomende toepassingen

  • Vind cases die meer dan één keer zijn ingevoerd
  • Identificeer cases die door systeemfouten worden gedupliceerd
  • Detecteer mogelijke scenario's van dubbele betalingen
  • Vind dubbele bestellingen of facturen
  • Valideer de integriteit van datamigraties

Instellingen

Column Names: Selecteer de lijst met attributen die gebruikt zullen worden om dubbele cases te identificeren. Cases met identieke waarden voor alle geselecteerde attributen worden als duplicaten gemarkeerd.

Max Rows: Specificeer het maximale aantal regels dat in de uitvoer getoond wordt.

Voorbeeld

Potentieel dubbele facturen identificeren

Scenario: Je wilt facturen identificeren die mogelijk meerdere keren zijn ingevoerd met dezelfde leverancier, hetzelfde bedrag en dezelfde datum.

Instellingen:

  • Column Names: Vendor Name, Invoice Amount, Invoice Date
  • Max Rows: 100

Uitvoer:

De calculator toont twee weergave-opties:

  1. Duplicate Cases View (standaard):

    • Toont één regel per unieke combinatie van de geselecteerde attributen
    • De laatste kolom toont het aantal cases dat overeenkomt met die combinatie
    • Items met een telling groter dan 1 zijn potentiële duplicaten
  2. Expanded View (selecteer via dropdown rechtsboven):

    • Toont alle individuele cases gegroepeerd op overeenkomende attribuutwaarden
    • Toont extra attributen die niet in de instellingen zijn opgegeven
    • Laat zien dat cases in dezelfde groep kunnen verschillen in andere attributen (bijvoorbeeld verschillende Invoice IDs ondanks overeenkomende bedragen)

Inzichten:

De uitgebreide weergave is bijzonder nuttig omdat het laat zien dat cases die als "duplicaten" gegroepeerd zijn op basis van de geselecteerde attributen, eigenlijk legitieme aparte cases kunnen zijn met verschillende waarden in andere kolommen. Bijvoorbeeld:

  • Zelfde leverancier, bedrag en datum kunnen twee verschillende facturen zijn (controleer Invoice ID)
  • Legitieme dubbele betalingen versus fouten bij data-invoer
  • Systematisch gegenereerde dubbele records versus daadwerkelijke zakelijke duplicaten

Dit helpt je om het onderscheid te maken tussen echte duplicaten die correctie nodig hebben en vergelijkbare cases die legitiem gescheiden zijn.


Deze documentatie maakt deel uit van het mindzieStudio process mining platform.