Filtre des Cas Duplicates

Vue d'ensemble

Le filtre des cas duplicates identifie et sélectionne les cas qui partagent des valeurs identiques sur plusieurs colonnes spécifiées. Ce filtre avancé au niveau du cas aide à détecter les transactions potentielles en double, les soumissions répétées ou les problèmes de qualité des données où la même entité commerciale apparaît plusieurs fois dans vos données de processus.

Utilisations courantes

  • Identifier les soumissions de factures en double dans les comptes fournisseurs
  • Trouver les commandes clients répétées avec des détails identiques
  • Détecter les fraudes potentielles via des schémas de transactions en double
  • Découvrir des problèmes de migration de données avec des enregistrements dupliqués
  • Identifier les cas qui auraient dû être consolidés
  • Analyser les motifs dans les soumissions ou demandes récurrentes

Paramètres

Noms des colonnes : Sélectionnez de 2 à 5 colonnes à utiliser pour la détection des doublons. Les cas avec des valeurs identiques dans TOUTES les colonnes sélectionnées sont considérés comme des duplicatas. Seules les colonnes avec des types de données comparables sont disponibles (Chaîne, Entier, DateHeure, etc.).

Fonctionnement :

  1. Regroupe les cas par les valeurs dans toutes les colonnes sélectionnées
  2. Identifie les groupes contenant 2 cas ou plus
  3. Retourne tous les cas appartenant à un groupe de duplicatas
  4. Les résultats sont ordonnés par taille de groupe (les plus grands groupes en premier)

Types de colonnes supportés : Chaîne, Int32, Int64, Double, Single, DateTime, TimeSpan

Exemples

Exemple 1 : Détection de Factures Duplicates

Scénario : Vous souhaitez trouver des factures potentiellement en double dans votre processus de comptes fournisseurs en comparant le fournisseur, le montant et la date de facture.

Paramètres :

  • Noms des colonnes : ["Vendor", "Invoice Amount", "Invoice Date"]

Résultat :

Les cas où les trois valeurs correspondent sont regroupés ensemble. Groupe 1 : 5 factures de "Acme Corp" pour 10 000 \(datées du 2024-01-15. Groupe 2 : 3 factures de "Beta LLC" pour 5 500\) datées du 2024-02-01. Les factures uniques avec des combinaisons uniques sont exclues.

Informations : Plusieurs factures avec fournisseur, montant et date identiques indiquent souvent des soumissions en double qui peuvent entraîner des paiements en double. Ces cas nécessitent une enquête et éventuellement un blocage.

Exemple 2 : Doublons dans les Commandes Clients

Scénario : Votre processus de gestion des commandes peut contenir des commandes en double lorsque les clients soumettent plusieurs fois. Vous souhaitez trouver des commandes avec client, produit et quantité correspondants.

Paramètres :

  • Noms des colonnes : ["Customer ID", "Product Code", "Order Quantity"]

Résultat :

Les commandes avec client, produit et quantité identiques sont signalées. Cela capture les scénarios où un client a accidentellement soumis la même commande plusieurs fois dans un court laps de temps.

Informations : Les commandes en double augmentent les coûts de traitement, créent des problèmes d’inventaire, et conduisent à une insatisfaction client lorsqu’elles reçoivent des doublons non désirés.

Exemple 3 : Analyse de Schémas de Transactions

Scénario : Vous enquêtez sur une fraude potentielle en recherchant des transactions avec des montants, comptes sources, et heures de transaction correspondants.

Paramètres :

  • Noms des colonnes : ["Source Account", "Amount", "Transaction Hour"]

Résultat :

Les transactions du même compte, avec le même montant, pendant la même heure sont regroupées. Ce schéma pourrait indiquer une fraude automatisée ou des erreurs système créant des transactions en double.

Informations : Les transactions légitimes ont rarement des caractéristiques identiques sur plusieurs champs. Des taux élevés de duplicatas justifient une enquête approfondie sur certains comptes ou périodes.

Exemple 4 : Vérification de Migration de Données

Scénario : Après la migration de données depuis un système hérité, vous souhaitez vérifier que les enregistrements n'ont pas été dupliqués durant la migration.

Paramètres :

  • Noms des colonnes : ["Legacy ID", "Creation Date"]

Résultat :

Les enregistrements avec le même identifiant hérité et la même date de création sont signalés comme duplicatas potentiels de migration. Idéalement, cela ne devrait retourner aucun résultat si la migration était propre.

Informations : Les duplicatas de migration peuvent causer des inexactitudes dans les rapports, des problèmes de conformité et de la confusion opérationnelle. Les identifier permet de nettoyer les données avant qu'ils causent des problèmes en aval.

Exemple 5 : Correspondance sur Plusieurs Colonnes

Scénario : Vous souhaitez trouver les commandes d'achat qui pourraient être des duplicatas basées sur une correspondance complète : même fournisseur, même montant, même département et même date demandée.

Paramètres :

  • Noms des colonnes : ["Vendor Name", "PO Amount", "Department", "Requested Date"]

Résultat :

Les commandes d'achat correspondant sur les quatre dimensions sont identifiées. Cette correspondance stricte réduit les faux positifs tout en capturant les vrais duplicatas qui ont échappé aux contrôles d'approvisionnement.

Informations : Utiliser plus de colonnes rend la correspondance plus stricte mais plus précise. Commencez avec moins de colonnes si vous explorez, puis ajoutez-en pour réduire les faux positifs.

Sortie

Ce filtre opère au niveau du cas en utilisant un groupement multi-colonnes :

  • Regroupe les cas par les valeurs dans toutes les colonnes spécifiées
  • Retourne uniquement les cas apparaissant dans des groupes de 2 ou plus
  • Résultats ordonnés par taille du groupe de duplicatas (du plus grand au plus petit)
  • Nécessite 2 à 5 colonnes pour la détection des duplicatas
  • Les colonnes doivent contenir des types de données comparables
  • Les colonnes cachées et colonnes d’identifiant de cas sont exclues
  • Préserve tous les attributs de cas et d'événement pour les cas appariés

Utilisez le filtre des cas duplicates pour identifier les problèmes potentiels de qualité des données, détecter les soumissions en double ou trouver des cas qui pourraient représenter la même transaction commerciale saisie plusieurs fois.


Cette documentation fait partie de la plateforme d’analyse de processus mindzie Studio.