Anonimiseren

Overzicht

De Anonymize verrijking biedt uitgebreide bescherming van de gegevensprivacy door systematisch gevoelige tekstattribuutwaarden te vervangen door geanonimiseerde tijdelijke aanduidingen, terwijl de analytische waarde van uw procesdata behouden blijft. Deze cruciale databeschermingsoperator zorgt voor naleving van privacyregelgeving zoals GDPR, HIPAA en andere databeveiligingsnormen door persoonlijk identificeerbare informatie (PII), vertrouwelijke bedrijfsgegevens en andere gevoelige tekstwaarden te vervangen door consistente anonieme identificaties. De verrijking behoudt dataverbanden en patronen die essentieel zijn voor procesanalyse, terwijl de daadwerkelijke gevoelige inhoud wordt verwijderd, waardoor het veilig is om datasets te delen met externe partijen, te gebruiken in demonstraties of op minder beveiligde omgevingen op te slaan.

De Anonymize verrijking werkt door identieke attribuutwaarden te groeperen en elke unieke waarde te vervangen door een gestandaardiseerde anonieme identificatie in het formaat "AttributeName 0001", "AttributeName 0002", enzovoort. Deze aanpak zorgt ervoor dat alle gevallen van dezelfde oorspronkelijke waarde dezelfde anonieme identificatie krijgen, waardoor dataconsistentie behouden blijft en zinvolle procesanalyse mogelijk is zonder gevoelige informatie bloot te geven. De verrijking kan automatisch op alle tekstattributen werken of specifieke attributen targeten op basis van uw privacyvereisten, waardoor u flexibele controle heeft over welke data wordt geanonimiseerd en welke niet-gevoelige attributen intact blijven ter referentie.

Veelvoorkomende toepassingen

  • Bescherm persoonlijk identificeerbare informatie (PII) zoals klantnamen, medewerkers-ID’s, e-mailadressen en burgerservicenummers
  • Anonimiseer financiële gegevens zoals rekeningnummers, creditcardinformatie en transactiereferenties voor het delen met derden
  • Bereid datasets voor externe consultants of leveranciers voor, terwijl de vertrouwelijkheid van gegevens behouden blijft
  • Maak demonstratiedatasets van productiedata zonder gevoelige bedrijfsinformatie bloot te geven
  • Zorg voor GDPR-naleving door persoonsgegevens te anonimiseren in process mining projecten
  • Bescherm patiëntgegevens binnen gezondheidszorgprocesanalyse terwijl casusrelaties behouden blijven
  • Anonimiseer leveranciers- en verkopersnamen in inkoopprocesanalyse voor concurrentiegevoelige vertrouwelijkheid

Instellingen

Attribuutnamen (optioneel): Selecteer specifieke tekstattributen om te anonimiseren. Als deze leeg blijven, anonimiseert de verrijking automatisch alle tekstattributen in zowel casus- als gebeurtenistabellen, met uitzondering van systeemattributen zoals Case ID en Activiteitsnamen. Deze selectieve aanpak stelt u in staat om alleen gevoelige attributen te anonimiseren terwijl niet-gevoelige referentiegegevens behouden blijven. Het dropdownmenu toont alle beschikbare tekstattributen uit uw dataset. U kunt meerdere attributen selecteren door op elk attribuut te klikken dat u wilt anonimiseren. Alleen string/tekst type attributen zijn beschikbaar, omdat numerieke en datum attributen doorgaans geen persoonlijk identificeerbare informatie bevatten en essentieel zijn voor procesanalyse.

Voorbeelden

Voorbeeld 1: GDPR-conform klantenserviceproces

Scenario: Een telecommunicatiebedrijf moet hun klantenserviceprocesdata delen met een extern adviesbureau voor procesoptimalisatie, maar moet klantpersoonsgegevens beschermen om te voldoen aan GDPR-regelgeving.

Instellingen:

  • Attribuutnamen: Customer_Name, Phone_Number, Email_Address, Account_Number, Address, Credit_Card_Last4

Uitvoer: De verrijking vervangt gevoelige klantgegevens door anonieme identificaties:

  • Customer_Name: "John Smith" wordt "Customer_Name 0001"
  • Customer_Name: "Jane Doe" wordt "Customer_Name 0002"
  • Phone_Number: "+1-555-0123" wordt "Phone_Number 0001"
  • Email_Address: "john.smith@example.com" wordt "Email_Address 0001"
  • Account_Number: "ACC-789456123" wordt "Account_Number 0001"

Alle gevallen van "John Smith" in verschillende casussen worden consequent vervangen door "Customer_Name 0001", wat dataverbanden voor analyse behoudt.

Inzichten: Het adviesbureau kan klantenservicepatronen analyseren, knelpunten identificeren en verbeteringen aanbevelen zonder ooit toegang te hebben tot echte klantgegevens, wat volledige GDPR-naleving garandeert en zinvolle procesinzichten mogelijk maakt.

Voorbeeld 2: Analyse van het patiënttraject in de gezondheidszorg

Scenario: Een ziekenhuis moet patiëntbehandeltrajecten across afdelingen analyseren, maar moet patiëntengegevens (PHI) beschermen om aan HIPAA-normen te voldoen voordat de data voor onderzoek wordt gebruikt.

Instellingen:

  • Attribuutnamen: Patient_Name, Medical_Record_Number, SSN, Insurance_ID, Physician_Name, Diagnosis_Description, Medication_Names

Uitvoer: Gevoelige medische informatie wordt systematisch geanonimiseerd:

  • Patient_Name: "Robert Johnson" wordt "Patient_Name 0001"
  • Medical_Record_Number: "MRN-2024-45678" wordt "Medical_Record_Number 0001"
  • SSN: "123-45-6789" wordt "SSN 0001"
  • Physician_Name: "Dr. Sarah Williams" wordt "Physician_Name 0001"
  • Diagnosis_Description: "Type 2 Diabetes" wordt "Diagnosis_Description 0001"

Dezelfde diagnose die in meerdere casussen voorkomt, krijgt dezelfde anonieme identificatie, waardoor patroonanalyse mogelijk blijft.

Inzichten: Onderzoekers kunnen behandelingspatronen bestuderen, patiëntstromen tussen afdelingen analyseren en zorgoptimalisatiemogelijkheden identificeren, terwijl ze volledige patiëntprivacy en HIPAA-naleving handhaven.

Voorbeeld 3: Anonimisering van financieel auditproces

Scenario: Een accountantskantoor wil hun auditprocesmethode demonstreren aan potentiële klanten met echte auditdata, maar moet gevoelige financiële rekeninginformatie en bedrijfsnamen beschermen.

Instellingen:

  • Attribuutnamen: Company_Name, Account_Number, Bank_Name, Auditor_Name, Contact_Person, Tax_ID

Uitvoer: Financiële en zakelijke identificaties worden vervangen door anonieme codes:

  • Company_Name: "Acme Corporation" wordt "Company_Name 0001"
  • Account_Number: "4532-1234-5678-9012" wordt "Account_Number 0001"
  • Bank_Name: "First National Bank" wordt "Bank_Name 0001"
  • Auditor_Name: "Michael Chen" wordt "Auditor_Name 0001"

Alle verwijzingen naar "Acme Corporation" tijdens verschillende auditstappen krijgen dezelfde identificatie "Company_Name 0001".

Inzichten: Het kantoor kan hun auditproces efficiëntie tonen, compliance controles demonstreren en hun methodologie benadrukken zonder vertrouwelijke klantinformatie prijs te geven.

Voorbeeld 4: Delen van supply chain data

Scenario: Een productiebedrijf wil supply chain procesdata delen met een leverancier van logistieke optimalisatie, maar moet leveranciersrelaties en prijsoverzichten beschermen tegen potentiële concurrenten.

Instellingen:

  • Attribuutnamen: Supplier_Name, Supplier_Contact, PO_Number, Part_Number, Supplier_Location

Uitvoer: Leveranciers- en componentinformatie wordt geanonimiseerd terwijl relaties behouden blijven:

  • Supplier_Name: "TechParts Asia Ltd" wordt "Supplier_Name 0001"
  • Supplier_Contact: "Lisa Wang" wordt "Supplier_Contact 0001"
  • PO_Number: "PO-2024-789456" wordt "PO_Number 0001"
  • Part_Number: "CPU-X7-2024-ADV" wordt "Part_Number 0001"

Dezelfde leverancier in meerdere inkooporders behoudt consistente anonimisering.

Inzichten: De logistieke leverancier kan supply chain patronen analyseren, leveringsknelpunten identificeren en routing optimaliseren zonder toegang te krijgen tot concurrerende leveranciersinformatie of prijsdetails.

Voorbeeld 5: Proces voor beoordeling van medewerkerprestatie

Scenario: Een HR-adviesbureau helpt bij het optimaliseren van een beoordelingsproces en heeft toegang nodig tot procesdata zonder daadwerkelijke medewerker namen, ID’s of salarisinformatie te zien.

Instellingen:

  • Attribuutnamen: (Leeg laten om automatisch alle tekstattributen te anonimiseren)

Uitvoer: Alle tekstattributen worden automatisch geanonimiseerd:

  • Employee_Name: "Jennifer Brown" wordt "Employee_Name 0001"
  • Manager_Name: "David Lee" wordt "Manager_Name 0001"
  • Department: "Sales West" wordt "Department 0001"
  • Job_Title: "Senior Account Manager" wordt "Job_Title 0001"
  • Review_Comments: "Exceeds expectations" wordt "Review_Comments 0001"
  • Employee_ID: "EMP-45678" wordt "Employee_ID 0001"

Numerieke attributen zoals Review_Score en Years_of_Service blijven ongewijzigd voor analyse.

Inzichten: Het adviesbureau kan beoordelingscyclustijden analyseren, procesinefficiënties identificeren en verbeteringen aanbevelen terwijl volledige medewerkervertrouwelijkheid en privacy behouden blijven.

Uitvoer

De Anonymize verrijking wijzigt bestaande tekstattribuutwaarden direct, waarbij gevoelige inhoud wordt vervangen door anonieme identificaties terwijl de attribuutstructuur en datatypes behouden blijven. De anonimisering volgt een consistent patroon dat cruciale dataverbanden behoudt voor process mining analyse.

Anonimisering Formaat: Elke unieke waarde binnen een attribuut wordt vervangen door het patroon "[AttributeName] [4-cijferig nummer]", waarbij het nummer sequentieel wordt toegekend, te beginnen bij 0001. Bijvoorbeeld, de eerste unieke waarde in het attribuut "Customer_Name" wordt "Customer_Name 0001", de tweede unieke waarde wordt "Customer_Name 0002", enzovoort.

Consistentiegarantie: De verrijking zorgt ervoor dat alle gevallen van dezelfde oorspronkelijke waarde dezelfde anonieme identificatie krijgen in alle casussen en gebeurtenissen. Deze consistentiebehoud is cruciaal voor het behouden van dataverbanden en het mogelijk maken van zinvolle procesanalyse. Als "John Smith" in 100 verschillende casussen voorkomt, worden al deze 100 gevallen vervangen door dezelfde identificatie "Customer_Name 0001".

Reikwijdte van anonimisering: Als er geen specifieke attributen worden geselecteerd, anonimiseert de verrijking automatisch alle tekst (string) attributen in zowel de casustabel als de gebeurtenistabel, met de volgende uitzonderingen:

  • Case ID-attributen blijven behouden om casusidentiteit te waarborgen
  • Activiteitsnamen blijven behouden om zichtbaarheid van processtromen te waarborgen
  • Berekende attributen worden overgeslagen, omdat ze geen brongevoelige data bevatten
  • Verborgen attributen worden overgeslagen
  • Niet-tekst attributen (numeriek, datum, boolean) blijven ongewijzigd

Onomkeerbaarheid: Het anonimiseringsproces is onomkeerbaar binnen mindzieStudio. Eens toegepast, kunnen oorspronkelijke waarden niet meer worden hersteld uit de geanonimiseerde dataset. Bewaar altijd een back-up van uw originele data voordat u anonimisering toepast als u de oorspronkelijke waarden voor andere doeleinden wilt behouden.

Prestaties: De verrijking groepeert alle unieke waarden per attribuut voordat anonimisering wordt toegepast, wat zorgt voor efficiënte verwerking ook bij grote datasets. De sequentiële nummering zorgt voor een voorspelbaar en leesbaar formaat terwijl uniciteit behouden blijft.

Integratie met andere functies: Geanonimiseerde attributen behouden hun oorspronkelijke datatype en kunnen in alle mindzieStudio functies worden gebruikt, inclusief filters, proceskaarten en andere verrijkingen. De anonieme identificaties kunnen worden gebruikt in groepsoperaties, conformiteitscontroles en prestatieanalyses, net als de oorspronkelijke waarden. De consistente vervanging waarborgt dat procespatronen, frequenties en relaties na anonimisering nog steeds analyseerbaar zijn.

Zie ook

  • Attribuut Verbergen - Verberg gevoelige attributen volledig uit zicht zonder data te wijzigen
  • Lege Attributen Verbergen - Verwijder attributen zonder waarden uit de dataset
  • Attribuutwaarden Groeperen - Combineer gelijkaardige attribuutwaarden in categorieën
  • Attribuutwaarden Categoriseren - Maak betekenisvolle categorieën van attribuutbereiken
  • Tekst Knippen - Ruim tekstattributen op door leidende/en/of afsluitende spaties te verwijderen
  • Tekst Begin - Extraheer het begin van tekstattributen
  • Tekst Einde - Extraheer het einde van tekstattributen

Deze documentatie maakt deel uit van het mindzie Studio process mining platform.