Anonymiser
Aperçu
L’enrichissement Anonymiser offre une protection complète de la confidentialité des données en remplaçant systématiquement les valeurs sensibles des attributs texte par des espaces réservés anonymisés tout en préservant la valeur analytique de vos données de processus. Cet opérateur de protection des données critique garantit la conformité aux réglementations sur la confidentialité telles que le RGPD, HIPAA, et d’autres normes de protection des données en remplaçant les informations personnelles identifiables (PII), les données commerciales confidentielles et autres valeurs textuelles sensibles par des identifiants anonymes cohérents. L’enrichissement maintient les relations et les motifs de données essentiels à l’analyse des processus tout en supprimant le contenu sensible réel, ce qui permet de partager en toute sécurité des ensembles de données avec des tiers, de les utiliser lors de démonstrations, ou de les stocker dans des environnements moins sécurisés.
L’enrichissement Anonymiser fonctionne en regroupant ensemble les valeurs d’attributs identiques et en remplaçant chaque valeur unique par un identifiant anonyme standardisé au format "AttributeName 0001", "AttributeName 0002", etc. Cette approche garantit que toutes les instances d’une même valeur d’origine reçoivent le même identifiant anonyme, préservant la cohérence des données et permettant une analyse significative des processus sans exposer d’informations sensibles. L’enrichissement peut opérer automatiquement sur tous les attributs texte ou cibler des attributs spécifiques selon vos exigences de confidentialité, offrant ainsi un contrôle flexible sur les données à anonymiser tout en laissant intacts les attributs non sensibles pour référence.
Usages courants
- Protéger les informations personnelles identifiables (PII) telles que les noms de clients, identifiants d’employés, adresses email et numéros de sécurité sociale
- Anonymiser les données financières incluant les numéros de compte, informations de carte de crédit et références de transaction avant partage avec des tiers
- Préparer des ensembles de données pour des consultants externes ou des fournisseurs tout en maintenant la confidentialité des données
- Créer des ensembles de démonstration à partir des données de production sans exposer des informations commerciales sensibles
- Assurer la conformité au RGPD en anonymisant les données personnelles dans les projets d’analyse des processus
- Protéger les informations des patients dans l’analyse des processus de santé tout en maintenant les relations de cas
- Anonymiser les noms de fournisseurs et vendeurs dans l’analyse des processus d’approvisionnement pour la confidentialité compétitive
Paramètres
Noms des attributs (optionnel) : Sélectionnez des attributs texte spécifiques à anonymiser. Si laissé vide, l’enrichissement anonymise automatiquement tous les attributs texte des tables de cas et d’événements, à l’exception des attributs système comme le Case ID et les noms d’activité. Cette approche sélective vous permet d’anonymiser uniquement les attributs sensibles tout en préservant les données de référence non sensibles. Le menu déroulant affiche tous les attributs texte disponibles dans votre ensemble de données. Vous pouvez sélectionner plusieurs attributs en cliquant sur chacun à anonymiser. Seuls les attributs de type chaîne/texte sont disponibles à la sélection, car les attributs numériques et date ne contiennent typiquement pas d’informations personnelles identifiables et sont essentiels à l’analyse de processus.
Exemples
Exemple 1 : Processus de service client conforme au RGPD
Scénario : Une société de télécommunications doit partager ses données du processus de service client avec un cabinet de conseil externe pour une analyse d’optimisation du processus, mais doit protéger les informations personnelles des clients pour se conformer au RGPD.
Paramètres :
- Noms des attributs : Customer_Name, Phone_Number, Email_Address, Account_Number, Address, Credit_Card_Last4
Résultat : L’enrichissement remplace les données sensibles des clients par des identifiants anonymes :
- Customer_Name : "John Smith" devient "Customer_Name 0001"
- Customer_Name : "Jane Doe" devient "Customer_Name 0002"
- Phone_Number : "+1-555-0123" devient "Phone_Number 0001"
- Email_Address : "john.smith@example.com" devient "Email_Address 0001"
- Account_Number : "ACC-789456123" devient "Account_Number 0001"
Toutes les instances de "John Smith" à travers différents cas sont remplacées de manière cohérente par "Customer_Name 0001", maintenant les relations de données pour l’analyse.
Perspectives : Le cabinet de conseil peut analyser les modèles de service client, identifier les goulets d’étranglement, et recommander des améliorations sans jamais accéder aux informations personnelles réelles des clients, assurant une conformité totale au RGPD tout en permettant des insights pertinents sur les processus.
Exemple 2 : Analyse du parcours patient en santé
Scénario : Un hôpital doit analyser les parcours de soins des patients entre départements mais doit protéger les informations de santé des patients (PHI) pour respecter HIPAA avant que les données soient utilisées à des fins de recherche.
Paramètres :
- Noms des attributs : Patient_Name, Medical_Record_Number, SSN, Insurance_ID, Physician_Name, Diagnosis_Description, Medication_Names
Résultat : Les informations médicales sensibles sont systématiquement anonymisées :
- Patient_Name : "Robert Johnson" devient "Patient_Name 0001"
- Medical_Record_Number : "MRN-2024-45678" devient "Medical_Record_Number 0001"
- SSN : "123-45-6789" devient "SSN 0001"
- Physician_Name : "Dr. Sarah Williams" devient "Physician_Name 0001"
- Diagnosis_Description : "Type 2 Diabetes" devient "Diagnosis_Description 0001"
Le même diagnostic apparaissant dans plusieurs cas conserve le même identifiant anonyme, permettant l’analyse des motifs.
Perspectives : Les chercheurs peuvent étudier les modèles de traitement, analyser les flux de patients entre départements, et identifier les opportunités d’optimisation des soins tout en maintenant une confidentialité complète des patients et la conformité HIPAA.
Exemple 3 : Anonymisation du processus d’audit financier
Scénario : Un cabinet comptable doit démontrer sa méthodologie d’audit à des clients potentiels en utilisant de vraies données d’audit, mais doit protéger les informations financières sensibles et les noms d’entreprise.
Paramètres :
- Noms des attributs : Company_Name, Account_Number, Bank_Name, Auditor_Name, Contact_Person, Tax_ID
Résultat : Les identifiants financiers et commerciaux sont remplacés par des codes anonymes :
- Company_Name : "Acme Corporation" devient "Company_Name 0001"
- Account_Number : "4532-1234-5678-9012" devient "Account_Number 0001"
- Bank_Name : "First National Bank" devient "Bank_Name 0001"
- Auditor_Name : "Michael Chen" devient "Auditor_Name 0001"
Toutes les références à "Acme Corporation" à travers différentes étapes d’audit reçoivent le même identifiant "Company_Name 0001".
Perspectives : Le cabinet peut présenter l’efficacité de son processus d’audit, démontrer les procédures de vérification de conformité, et mettre en valeur sa méthodologie sans révéler d’informations confidentielles client.
Exemple 4 : Partage des données de la chaîne d’approvisionnement
Scénario : Une entreprise manufacturière souhaite partager les données de son processus de chaîne d’approvisionnement avec un fournisseur d’optimisation logistique mais doit protéger les relations avec les fournisseurs et les informations tarifaires contre des concurrents potentiels.
Paramètres :
- Noms des attributs : Supplier_Name, Supplier_Contact, PO_Number, Part_Number, Supplier_Location
Résultat : Les informations sur les fournisseurs et les composants sont anonymisées tout en préservant les relations :
- Supplier_Name : "TechParts Asia Ltd" devient "Supplier_Name 0001"
- Supplier_Contact : "Lisa Wang" devient "Supplier_Contact 0001"
- PO_Number : "PO-2024-789456" devient "PO_Number 0001"
- Part_Number : "CPU-X7-2024-ADV" devient "Part_Number 0001"
Le même fournisseur apparaissant dans plusieurs bons de commande conserve une anonymisation cohérente.
Perspectives : Le fournisseur logistique peut analyser les motifs de la chaîne d’approvisionnement, identifier les goulets d’étranglement de livraison, et optimiser les itinéraires sans accéder aux informations concurrentielles sur les fournisseurs ni les détails de tarification.
Exemple 5 : Processus d’évaluation des performances des employés
Scénario : Un cabinet de conseil RH aide à optimiser un processus d’évaluation des performances et nécessite l’accès aux données de processus sans voir les noms réels des employés, identifiants ou informations salariales.
Paramètres :
- Noms des attributs : (Laisser vide pour anonymiser automatiquement tous les attributs texte)
Résultat : Tous les attributs texte sont automatiquement anonymisés :
- Employee_Name : "Jennifer Brown" devient "Employee_Name 0001"
- Manager_Name : "David Lee" devient "Manager_Name 0001"
- Department : "Sales West" devient "Department 0001"
- Job_Title : "Senior Account Manager" devient "Job_Title 0001"
- Review_Comments : "Exceeds expectations" devient "Review_Comments 0001"
- Employee_ID : "EMP-45678" devient "Employee_ID 0001"
Les attributs numériques comme Review_Score et Years_of_Service restent inchangés pour l’analyse.
Perspectives : Le cabinet de conseil peut analyser les durées des cycles de révision, identifier les inefficacités de processus, et recommander des améliorations tout en maintenant une confidentialité complète des employés.
Résultat
L’enrichissement Anonymiser modifie sur place les valeurs existantes des attributs texte, remplaçant le contenu sensible par des identifiants anonymes tout en préservant la structure des attributs et les types de données. L’anonymisation suit un modèle cohérent qui maintient les relations de données essentielles à l’analyse en fouille de processus.
Format d’anonymisation : Chaque valeur unique d’un attribut est remplacée par le motif "[AttributeName] [nombre à 4 chiffres]", où le nombre est attribué séquentiellement à partir de 0001. Par exemple, la première valeur unique de l’attribut "Customer_Name" devient "Customer_Name 0001", la deuxième valeur unique devient "Customer_Name 0002", et ainsi de suite.
Garantie de cohérence : L’enrichissement assure que toutes les instances d’une même valeur d’origine reçoivent le même identifiant anonyme dans tous les cas et événements. Cette préservation de la cohérence est cruciale pour maintenir les relations de données et permettre une analyse significative du processus. Si "John Smith" apparaît dans 100 cas différents, les 100 instances seront remplacées par le même identifiant "Customer_Name 0001".
Portée de l’anonymisation : Lorsque aucun attribut spécifique n’est sélectionné, l’enrichissement anonymise automatiquement tous les attributs texte (string) dans les tables de cas et d’événements, avec les exceptions suivantes :
- Les attributs Case ID sont préservés pour maintenir l’identité des cas
- Les noms d’activité sont préservés pour maintenir la visibilité du flux de processus
- Les attributs calculés sont ignorés car ils ne contiennent pas de données sensibles source
- Les attributs cachés sont ignorés
- Les attributs non textuels (nombres, dates, booléens) restent inchangés
Irréversibilité : Le processus d’anonymisation est irréversible dans mindzieStudio. Une fois appliqué, les valeurs d’origine ne peuvent pas être récupérées à partir de l’ensemble de données anonymisé. Conservez toujours une sauvegarde de vos données originales avant d’appliquer l’anonymisation si vous devez préserver les valeurs originales à d’autres fins.
Considérations de performance : L’enrichissement regroupe toutes les valeurs uniques pour chaque attribut avant d’appliquer l’anonymisation, garantissant un traitement efficace même pour de grands ensembles de données. L’approche de numérotation séquentielle maintient un format prévisible et lisible tout en assurant l’unicité.
Intégration avec d’autres fonctionnalités : Les attributs anonymisés conservent leur type de données original et peuvent être utilisés dans toutes les fonctionnalités de mindzieStudio, y compris les filtres, les cartes de processus et autres enrichissements. Les identifiants anonymes peuvent être utilisés dans les opérations de regroupement, la vérification de conformité, et l’analyse de performance comme les valeurs originales. Le remplacement cohérent garantit que les motifs de processus, fréquences et relations demeurent analysables après anonymisation.
Voir aussi
- Cacher un attribut - Masquer complètement les attributs sensibles sans modifier les données
- Cacher les attributs vides - Supprimer les attributs sans valeurs de l’ensemble de données
- Grouper les valeurs d’attribut - Combiner des valeurs d’attribut similaires en catégories
- Catégoriser les valeurs d’attribut - Créer des catégories significatives à partir de plages d’attributs
- Couper le texte - Nettoyer les attributs texte en supprimant les espaces en début/fin
- Début du texte - Extraire la portion initiale des attributs texte
- Fin du texte - Extraire la portion finale des attributs texte
Cette documentation fait partie de la plateforme de fouille de processus mindzie Studio.