Verständnis der Dual-Dataset-Architektur von mindzie

Übersicht

Wenn Sie Daten in mindzie Studio hochladen, erstellt die Plattform automatisch zwei separate Datensätze, die zusammenarbeiten, um Ihre Process Mining-Analyse zu ermöglichen. Das Verständnis der Unterschiede zwischen diesen Datensätzen und wann welcher verwendet werden sollte, ist grundlegend für eine effektive Arbeit mit mindzie Studio.

Diese Anleitung erklärt die Dual-Dataset-Architektur, wie die mindzie-Datenpipeline Ihre Daten transformiert und was automatisch passiert, wenn Sie Daten zum ersten Mal importieren.

Die beiden Datensätze

Originaldatensatz

Der Originaldatensatz ist das rohe Ereignisprotokoll, das Sie zunächst in mindzie Studio hochladen. Dieser Datensatz enthält Ihre Prozessdaten genau so, wie sie bereitgestellt wurden, unabhängig davon, ob sie per CSV-Datei hochgeladen oder über mindzie Data Designer aus Quellsystemen eingelesen wurden.

Eigenschaften:

  • Enthält die Rohdaten in ihrer ursprünglichen Form
  • Beinhaltet nur die importierten Spalten und Attribute (Case ID, Aktivität, Zeitstempel, Ressource und weitere Attribute)
  • Bleibt während Ihrer Analyse unverändert
  • Bildet die Grundlage für alle weiteren Datenverarbeitungen

Wann der Originaldatensatz verwendet wird:

  • Wenn Sie die Quelldaten verifizieren müssen
  • Für Datenqualitätsprüfungen und Validierungen
  • Um zu verstehen, was ursprünglich bereitgestellt wurde, bevor Transformationen erfolgen

Angereicherter Datensatz

Der Angereicherte Datensatz wird automatisch von mindzie Studio nach Ausführung der Datenpipeline erstellt. Dies ist die erweiterte Version Ihrer Daten, die alle berechneten Attribute, Performance-Kennzahlen, Konformitätskennzeichen und weitere Anreicherungen enthält, die durch die Log-Enrichment-Engine hinzugefügt wurden.

Eigenschaften:

  • Wird automatisch beim Datenimport erstellt
  • Beinhaltet alle Originalattribute plus neue berechnete Attribute
  • Wird aktualisiert, wann immer Sie Anreicherungsberechnungen durchführen
  • Steuert alle Analysen, Untersuchungen und Dashboards

Wann der angereicherte Datensatz verwendet wird:

  • Für alle Analyse- und Untersuchungsarbeiten (dies ist der primäre Datensatz für die Analyse)
  • Beim Erstellen von Dashboards und KPIs
  • Bei der Arbeit mit Leistungskennzahlen, Konformitätsregeln oder benutzerdefinierten Anreicherungen
  • Für die tägliche Process Mining-Arbeit

Datasets View Die Datensatzansicht zeigt sowohl den Originaldatensatz als auch den angereicherten Datensatz

Wie die Datenpipeline funktioniert

Wenn Sie Daten in mindzie Studio hochladen, passiert automatisch Folgendes:

Schritt 1: Datenimport und Validierung

Ihre CSV-Datei oder Daten aus mindzie Data Designer werden in mindzie Studio geladen. Das System:

  • Validiert das Datenformat und die Struktur
  • Ordnet Schlüsselspalten zu (Case ID, Aktivität, Zeitstempel, Ressource)
  • Weist Spaltentypen und Datentypen zu
  • Erstellt den Originaldatensatz

Schritt 2: Automatische Pipeline-Ausführung

Sobald Sie nach dem Hochladen der Daten auf „Speichern“ klicken, führt mindzie Studio automatisch aus:

  • Die Datenpipeline
  • Erstellt den angereicherten Datensatz
  • Fügt grundlegende Attribute hinzu, die Ihre Analysefähigkeiten erweitern

Schritt 3: Standard-Analyseerstellung

Um Ihnen einen schnellen Einstieg zu ermöglichen, generiert mindzie Studio automatisch hilfreiche Standardanalysen, darunter:

  • Prozessübersicht
  • Lange Falldauern
  • Dauern zwischen wichtigen Prozessschritten
  • Weitere zentrale Einblicke

Diese vorgefertigten Analysen helfen Ihnen, Ihren Prozess sofort zu erkunden, ohne alles von Grund auf neu erstellen zu müssen.

Default Analysis Automatisch erstellte Standarduntersuchung nach Datenimport

Default Dashboard Standardanalyse mit 10.000 Fällen und 121.000 Ereignissen mit wichtigen Prozesseinblicken

Verständnis der Datensatzgröße: Das Beispiel

Im Demo-Datensatz zur Bankkunden-Onboarding enthält:

  • 10.000 Fälle – Jeder Fall repräsentiert eine Kunden-Onboarding-Reise
  • 121.000 Ereignisse – Die Gesamtzahl der Prozessschritte über alle Fälle hinweg

Das bedeutet, dass jeder Kunden-Onboarding-Fall im Durchschnitt ungefähr 12 Aktivitäten oder Prozessschritte umfasst. Diese Art von Informationen wird sofort sichtbar, sobald Ihre Daten in mindzie Studio geladen sind.

Die Rolle der Log-Enrichment

Die Stärke der Dual-Dataset-Architektur wird deutlich, wenn Sie die Log-Enrichment-Engine nutzen. Hier differenziert sich der angereicherte Datensatz wirklich vom Originaldatensatz.

Was Log-Enrichment bewirkt

Log-Enrichment ermöglicht es Ihnen, Ihre Daten zu erweitern mit:

Leistungskennzahlen:

  • Dauerberechnungen zwischen Aktivitätspaaren
  • Falldauer von Anfang bis Ende
  • Performance-Einteilung (schnell, normal, langsam)
  • Benutzerdefinierte SLA-Compliance-Verfolgung

Konformitätsregeln:

  • Kennzeichen für unerwünschte Aktivitäten
  • Fehlende Pflichtschritte
  • Falsche Aktivitätsreihenfolge
  • Wiederholte Aktivitäten und Nacharbeitsschleifen

Benutzerdefinierte Attribute:

  • Aktivitätsbasierte Kostenrechnung
  • KI-Vorhersagen
  • Benutzerdefinierte Kategorisierungen
  • Mathematische Transformationen
  • Zeitbasierte Berechnungen

Wie Anreicherungen den Datensatz aktualisieren

Jedes Mal, wenn Sie neue Anreicherungen erstellen und berechnen:

  1. Wird die Datenpipeline ausgeführt
  2. Neue Attribute werden dem angereicherten Datensatz hinzugefügt
  3. Diese neuen Attribute stehen für Filter und Berechnungen zur Verfügung
  4. Ihre Analyse wird mit jeder Anreicherung leistungsfähiger

Enriched Attributes Datenübersicht zeigt sowohl Originalattribute als auch angereicherte Attribute mit Symbolen, die systemgenerierte Erweiterungen anzeigen

Automatisch von mindzie hinzugefügte Attribute

Auch ohne manuelle Anreicherungen fügt mindzie Studio automatisch mehrere nützliche Attribute zu Ihrem angereicherten Datensatz hinzu, darunter:

  • Tageszeit – Wann Aktivitäten stattgefunden haben
  • Fallbeginn – Wann jeder Fall gestartet wurde
  • Fallende – Wann jeder Fall beendet wurde
  • Falldauer – Gesamtzeit von Anfang bis Ende
  • Erste Ressource – Wer den Fall initiiert hat
  • Aktivitätsfrequenz – Wie oft Aktivitäten vorkommen
  • Und viele mehr...

Diese automatischen Anreicherungen bieten Ihnen sofortige analytische Möglichkeiten ohne zusätzliche Konfiguration.

Den richtigen Datensatz für die Analyse auswählen

Beim Erstellen von Untersuchungen und Analyse-Notebooks in mindzie Studio müssen Sie auswählen, welchen Datensatz Sie analysieren möchten.

Beste Praxis: Wählen Sie stets den angereicherten Datensatz für Ihre Untersuchungen und Analysen. Dieser Datensatz enthält alle erweiterten Attribute und berechneten Kennzahlen, die Ihre Analyse aussagekräftig und leistungsfähig machen.

Der Originaldatensatz sollte primär verwendet werden für:

  • Referenz- und Validierungszwecke
  • Datenqualitätsprüfungen
  • Verständnis der Struktur der Quelldaten

Der kontinuierliche Verbesserungszyklus

Die Dual-Dataset-Architektur unterstützt einen iterativen Workflow:

  1. Hochladen – Importieren Sie Ihre Daten, um den Originaldatensatz zu erstellen
  2. Anreichern – Fügen Sie Leistungskennzahlen, Konformitätsregeln und benutzerdefinierte Attribute hinzu
  3. Berechnen – Führen Sie die Pipeline aus, um den angereicherten Datensatz zu aktualisieren
  4. Analysieren – Erstellen Sie Untersuchungen und Analysen mit den angereicherten Attributen
  5. Wiederholen – Fügen Sie je nach Bedarf weitere Anreicherungen hinzu, um Ihre Erkenntnisse zu vertiefen

Jeder Zyklus macht Ihren angereicherten Datensatz wertvoller und Ihre Analyse anspruchsvoller.

Wichtigste Erkenntnisse

  • Zwei Datensätze werden erstellt: Original (Rohdaten) und Angereichert (erweiterte Daten)
  • Automatische Erstellung: Der angereicherte Datensatz wird automatisch beim Hochladen der Daten erstellt
  • Verwenden Sie den angereicherten Datensatz: Dies ist Ihr primärer Datensatz für alle Analysen und Untersuchungen
  • Pipeline-Ausführung: Die Datenpipeline transformiert Original in Angereichert
  • Kontinuierliche Verbesserung: Jede Anreicherungsberechnung fügt neue Attribute zum angereicherten Datensatz hinzu
  • Standardanalyse: mindzie Studio stellt automatisch hilfreiche Startanalysen bereit
  • Iterativer Prozess: Sie können fortfahren, Anreicherungen hinzuzufügen, um Ihre Analyse leistungsfähiger zu machen

Nächste Schritte

Da Sie jetzt die Dual-Dataset-Architektur verstehen, sind Sie bereit für:

  • Das Erkunden der Log-Enrichment-Engine, um Leistungskennzahlen hinzuzufügen
  • Das Erstellen von Konformitätsregeln zur Identifikation von Prozesskonformitätsproblemen
  • Das Erstellen benutzerdefinierter Anreicherungen für spezifische Geschäftsanforderungen
  • Das Erstellen von Untersuchungen und Analysen mit den angereicherten Attributen
  • Das Veröffentlichen von Erkenntnissen in Dashboards für Endbenutzer

Die Dual-Dataset-Architektur ist die Grundlage, die alle leistungsstarken Analysefunktionen von mindzie Studio ermöglicht. Durch die Trennung der Originaldaten von den erweiterten Daten behalten Sie die Datenintegrität bei und gewinnen unbegrenzte Flexibilität, Ihre Prozesse zu transformieren und zu analysieren.