Anonymisieren

Übersicht

Die Anonymize-Anreicherung bietet umfassenden Datenschutz, indem sie systematisch sensible Textattributwerte durch anonymisierte Platzhalter ersetzt und gleichzeitig den analytischen Wert Ihrer Prozessdaten bewahrt. Dieser kritische Datenschutzoperator stellt die Einhaltung von Datenschutzbestimmungen wie der DSGVO, HIPAA und anderen Datenschutzstandards sicher, indem personenbezogene Daten (PII), vertrauliche Geschäftsdaten und andere sensible Textwerte durch konsistente anonyme Identifikatoren ersetzt werden. Die Anreicherung erhält Datenbeziehungen und Muster, die für die Prozessanalyse wesentlich sind, während der eigentliche sensible Inhalt entfernt wird, sodass Datensätze sicher mit externen Parteien geteilt, in Demonstrationen verwendet oder in weniger sicheren Umgebungen gespeichert werden können.

Die Anonymize-Anreicherung funktioniert, indem sie identische Attributwerte gruppiert und jeden eindeutigen Wert durch einen standardisierten anonymen Identifikator im Format „AttributeName 0001“, „AttributeName 0002“ usw. ersetzt. Dieser Ansatz stellt sicher, dass alle Instanzen desselben ursprünglichen Werts denselben anonymen Identifikator erhalten, wodurch die Datenkonsistenz bewahrt und eine sinnvolle Prozessanalyse ermöglicht wird, ohne sensible Informationen preiszugeben. Die Anreicherung kann automatisch auf alle Textattribute angewendet oder gezielt auf bestimmte Attribute basierend auf Ihren Datenschutzanforderungen ausgerichtet werden. So haben Sie flexible Kontrolle darüber, welche Daten anonymisiert werden, während nicht sensible Attribute als Referenz erhalten bleiben.

Häufige Anwendungsfälle

Schutz personenbezogener Daten (PII) wie Kundennamen, Mitarbeiter-IDs, E-Mail-Adressen und Sozialversicherungsnummern
Anonymisierung von Finanzdaten wie Kontonummern, Kreditkarteninformationen und Transaktionsreferenzen vor der Weitergabe an Dritte
Vorbereitung von Datensätzen für externe Berater oder Dienstleister bei Wahrung der Datenvertraulichkeit
Erstellung von Demonstrationsdatensätzen aus Produktionsdaten ohne Offenlegung sensibler Geschäftsinformationen
Sicherstellung der DSGVO-Konformität durch Anonymisieren personenbezogener Daten in Process Mining-Projekten
Schutz von Patientendaten in der Gesundheitsprozessanalyse bei gleichzeitigem Erhalt der Fallzusammenhänge
Anonymisierung von Lieferanten- und Vendorennamen in der Beschaffungsprozessanalyse zum Schutz der Wettbewerbskonfidentialität

Einstellungen

Attributnamen (optional): Wählen Sie bestimmte Textattribute aus, die anonymisiert werden sollen. Wenn dieses Feld leer bleibt, anonymisiert die Anreicherung automatisch alle Textattribute in sowohl Fall- als auch Ereignistabellen, mit Ausnahme von Systemattributen wie Case ID und Aktivitätsnamen. Dieser selektive Ansatz erlaubt es Ihnen, nur sensible Attribute zu anonymisieren, während nicht sensible Referenzdaten erhalten bleiben. Das Dropdown zeigt alle verfügbaren Textattribute aus Ihrem Datensatz an. Sie können mehrere Attribute auswählen, indem Sie auf jedes gewünschte Attribut klicken. Nur String/Text-Attribute sind auswählbar, da numerische und Datumsattribute in der Regel keine personenbezogenen Daten enthalten und essenziell für die Prozessanalyse sind.

Beispiele

Beispiel 1: DSGVO-konformer Kundenserviceprozess

Szenario: Ein Telekommunikationsunternehmen muss seine Kundendienstprozessdaten mit einem externen Beratungsunternehmen zur Prozessoptimierung teilen, dabei aber Kundendaten zum Schutz der DSGVO vorschriften anonymisieren.

Einstellungen:

Attributnamen: Customer_Name, Phone_Number, Email_Address, Account_Number, Address, Credit_Card_Last4

Ausgabe: Die Anreicherung ersetzt sensible Kundendaten durch anonyme Identifikatoren:

Customer_Name: „John Smith“ wird zu „Customer_Name 0001“
Customer_Name: „Jane Doe“ wird zu „Customer_Name 0002“
Phone_Number: „+1-555-0123“ wird zu „Phone_Number 0001“
Email_Address: „john.smith@example.com“ wird zu „Email_Address 0001“
Account_Number: „ACC-789456123“ wird zu „Account_Number 0001“

Alle Vorkommen von „John Smith“ in unterschiedlichen Fällen werden konsistent durch „Customer_Name 0001“ ersetzt, wodurch Datenbeziehungen für die Analyse erhalten bleiben.

Erkenntnisse: Das Beratungsunternehmen kann Kundendienstmuster analysieren, Engpässe identifizieren und Verbesserungen empfehlen, ohne jemals auf tatsächliche Kundendaten zuzugreifen, was vollständige DSGVO-Konformität bei gleichzeitiger sinnvoller Prozessanalyse sicherstellt.

Beispiel 2: Analyse des Patient:innenverlaufs im Gesundheitswesen

Szenario: Ein Krankenhaus möchte Behandlungspfade von Patient:innen über Abteilungen hinweg analysieren, muss vor Forschungszwecken jedoch Patientendaten gemäß HIPAA-Richtlinien schützen.

Einstellungen:

Attributnamen: Patient_Name, Medical_Record_Number, SSN, Insurance_ID, Physician_Name, Diagnosis_Description, Medication_Names

Ausgabe: Sensible medizinische Informationen werden systematisch anonymisiert:

Patient_Name: „Robert Johnson“ wird zu „Patient_Name 0001“
Medical_Record_Number: „MRN-2024-45678“ wird zu „Medical_Record_Number 0001“
SSN: „123-45-6789“ wird zu „SSN 0001“
Physician_Name: „Dr. Sarah Williams“ wird zu „Physician_Name 0001“
Diagnosis_Description: „Typ-2-Diabetes“ wird zu „Diagnosis_Description 0001“

Die gleiche Diagnose, die in mehreren Fällen erscheint, erhält denselben anonymen Identifikator, was die Musteranalyse ermöglicht.

Erkenntnisse: Forschende können Behandlungsmuster untersuchen, den Patient:innenfluss zwischen Abteilungen analysieren und Optimierungspotenziale bei der Versorgung erkennen, während die vollständige Patient:innen-Privatsphäre und HIPAA-Konformität gewahrt bleiben.

Beispiel 3: Anonymisierung von Finanzprüfungsprozessen

Szenario: Eine Wirtschaftsprüfungsgesellschaft möchte ihre Prüfungsprozessmethodik potenziellen Kund:innen anhand realer Auditdaten demonstrieren, muss dabei aber sensible Finanzdaten und Firmennamen schützen.

Einstellungen:

Attributnamen: Company_Name, Account_Number, Bank_Name, Auditor_Name, Contact_Person, Tax_ID

Ausgabe: Finanz- und Geschäftsdaten werden durch anonyme Codes ersetzt:

Company_Name: „Acme Corporation“ wird zu „Company_Name 0001“
Account_Number: „4532-1234-5678-9012“ wird zu „Account_Number 0001“
Bank_Name: „First National Bank“ wird zu „Bank_Name 0001“
Auditor_Name: „Michael Chen“ wird zu „Auditor_Name 0001“

Alle Verweise auf „Acme Corporation“ in verschiedenen Prüfungsphasen erhalten dieselbe Identifikationsnummer „Company_Name 0001“.

Erkenntnisse: Die Gesellschaft kann ihre Effizienz bei Prüfungsprozessen demonstrieren, Compliance-Prüfverfahren aufzeigen und ihre Methodik hervorheben, ohne vertrauliche Kundendaten preiszugeben.

Beispiel 4: Datenaustausch in der Lieferkette

Szenario: Ein Fertigungsunternehmen möchte Lieferkettenprozessdaten mit einem Logistikoptimierungsanbieter teilen, muss jedoch Lieferantenbeziehungen und Preisinformationen vor potentiellen Wettbewerbern schützen.

Einstellungen:

Attributnamen: Supplier_Name, Supplier_Contact, PO_Number, Part_Number, Supplier_Location

Ausgabe: Lieferanten- und Bauteilinforamtionen werden anonymisiert, während Beziehungen erhalten bleiben:

Supplier_Name: „TechParts Asia Ltd“ wird zu „Supplier_Name 0001“
Supplier_Contact: „Lisa Wang“ wird zu „Supplier_Contact 0001“
PO_Number: „PO-2024-789456“ wird zu „PO_Number 0001“
Part_Number: „CPU-X7-2024-ADV“ wird zu „Part_Number 0001“

Der gleiche Lieferant, der in mehreren Bestellungen auftaucht, behält eine konsistente Anonymisierung.

Erkenntnisse: Der Logistikanbieter kann Lieferkettenmuster analysieren, Lieferengpässe identifizieren und Routen optimieren, ohne Zugriff auf wettbewerbsrelevante Lieferantendaten oder Preisangaben zu erhalten.

Beispiel 5: Prozess der Mitarbeiter:innenleistungsbewertungen

Szenario: Eine HR-Beratung unterstützt die Optimierung eines Leistungsbewertungsprozesses und benötigt dazu Zugriff auf Prozessdaten, darf jedoch keine echten Mitarbeiter:innen-Namen, IDs oder Gehaltsinformationen sehen.

Einstellungen:

Attributnamen: (Leer lassen, um automatisch alle Textattribute zu anonymisieren)

Ausgabe: Alle Textattribute werden automatisch anonymisiert:

Employee_Name: „Jennifer Brown“ wird zu „Employee_Name 0001“
Manager_Name: „David Lee“ wird zu „Manager_Name 0001“
Department: „Sales West“ wird zu „Department 0001“
Job_Title: „Senior Account Manager“ wird zu „Job_Title 0001“
Review_Comments: „Erwartungen übertroffen“ wird zu „Review_Comments 0001“
Employee_ID: „EMP-45678“ wird zu „Employee_ID 0001“

Numerische Attribute wie Review_Score und Years_of_Service bleiben für die Analyse unverändert.

Erkenntnisse: Das Beratungsteam kann Bewertungsdurchlaufzeiten analysieren, Prozessineffizienzen identifizieren und Verbesserungen empfehlen, während die vollständige Vertraulichkeit und Privatsphäre der Mitarbeiter:innen gewahrt bleiben.

Ausgabe

Die Anonymize-Anreicherung ändert bestehende Textattributwerte direkt, indem sie sensible Inhalte durch anonyme Identifikatoren ersetzt und gleichzeitig Struktur und Datentypen der Attribute bewahrt. Die Anonymisierung folgt einem konsistenten Muster, das die für Process Mining-Analysen wesentlichen Datenbeziehungen erhält.

Anonymisierungsformat: Jeder eindeutige Wert innerhalb eines Attributs wird nach dem Muster „[AttributeName] [4-stellige Zahl]“ ersetzt, wobei die Zahl fortlaufend ab 0001 vergeben wird. Zum Beispiel wird der erste einzigartige Wert im Attribut „Customer_Name“ zu „Customer_Name 0001“, der zweite zu „Customer_Name 0002“ und so weiter.

Konsistenz-Garantie: Die Anreicherung stellt sicher, dass alle Vorkommen desselben ursprünglichen Werts in allen Fällen und Ereignissen denselben anonymen Identifikator erhalten. Diese Konsistenz ist entscheidend zum Erhalt von Datenbeziehungen und für eine sinnvolle Prozessanalyse. Wenn „John Smith“ in 100 verschiedenen Fällen auftaucht, werden alle 100 Instanzen durch „Customer_Name 0001“ ersetzt.

Anonymisierungsumfang: Werden keine spezifischen Attribute ausgewählt, anonymisiert die Anreicherung automatisch alle Text- (String-)Attribute in der Fall- und Ereignistabelle, mit folgenden Ausnahmen:

Attributwerte der Case ID bleiben erhalten, um die Fallidentität zu bewahren
Aktivitätsnamen bleiben erhalten, um die Prozessablauf-Sichtbarkeit zu erhalten
Berechnete Attribute werden übersprungen, da sie keine sensiblen Quellwerte enthalten
Versteckte Attribute werden übersprungen
Nicht-Text-Attribute (Zahlen, Datumswerte, Booleans) bleiben unverändert

Unumkehrbarkeit: Der Anonymisierungsprozess ist innerhalb mindzieStudio irreversibel. Nach Anwendung können die Originalwerte nicht aus dem anonymisierten Datensatz wiederhergestellt werden. Bewahren Sie stets eine Sicherung Ihrer Originaldaten auf, falls Sie die Originalwerte für andere Zwecke benötigen.

Performance-Hinweise: Die Anreicherung gruppiert alle eindeutigen Werte je Attribut, bevor die Anonymisierung erfolgt, was eine effiziente Verarbeitung auch großer Datensätze gewährleistet. Das fortlaufende Nummerierungsschema sorgt für ein vorhersehbares und lesbares Format bei gleichzeitig eindeutiger Zuordnung.

Integration mit anderen Funktionen: Anonymisierte Attribute behalten ihren ursprünglichen Datentyp und können in allen mindzieStudio-Funktionen verwendet werden, einschließlich Filtern, Prozesskarten und weiteren Anreicherungen. Die anonymen Identifikatoren können in Group-by-Operationen, Konformitätsprüfungen und Leistungsanalysen genau wie die Originalwerte verwendet werden. Der konsistente Ersatz stellt sicher, dass Prozessmuster, Häufigkeiten und Beziehungen auch nach der Anonymisierung analysierbar bleiben.

Siehe auch

Attribute ausblenden – Blendet sensible Attribute vollständig aus, ohne die Daten zu verändern
Leere Attribute ausblenden – Entfernt Attribute ohne Werte aus dem Datensatz
Attributwerte gruppieren – Fasst ähnliche Attributwerte in Kategorien zusammen
Attributwerte kategorisieren – Erstellt bedeutungsvolle Kategorien aus Attributbereichen
Text kürzen – Bereinigt Textattribute durch Entfernen führender und abschließender Leerzeichen
Textanfang – Extrahiert den Anfangsteil von Textattributen
Textende – Extrahiert den Endteil von Textattributen

Diese Dokumentation ist Teil der mindzie Studio Process Mining-Plattform.