Metadaten

Übersicht

Der Metadaten-Rechner zeigt umfassende technische Informationen darüber an, wie Ihr Datensatz erstellt, extrahiert und konfiguriert wurde. Dieser rechner benötigt keine Konfiguration und liefert wesentliche Metadaten einschließlich Versionsdetails, ETL-Konfiguration, Zeitzoneneinstellungen und Zuordnungen zu Kerndatenspalten.

Im Gegensatz zu Rechnern, die Prozessdaten analysieren, offenbart Metadaten die technische Grundlage Ihres Datensatzes – wann er extrahiert wurde, welche Versionen der ETL-Pipeline verwendet wurden, wie Zeitstempel interpretiert werden und welche Spaltennamen auf zentrale Prozess-Mining-Konzepte wie Fall-ID und Aktivität abgebildet sind.

Häufige Anwendungsfälle

Überprüfen der Datenaktualität durch Prüfung des Extraktionszeitpunkts und der Stunden seit der letzten Aktualisierung
Fehlersuche bei Zeitzonenproblemen durch Überprüfung der Zeitzonenkonfiguration und lokale Zeiteinstellungen
Dokumentation der Datenherkunft für Compliance- und Prüfungsanforderungen
Validierung der ETL-Konfiguration durch Bestätigung der Transformer-Version und Einstellungen
Unterstützung technischer Fehlersuche durch Identifizierung zentraler Spaltennamen für benutzerdefinierte Skripte
Verfolgung der Versionierung des Datensatzes über mehrere Umgebungen (Entwicklung, Test, Produktion)

Einstellungen

Für diesen Rechner ist keine Konfiguration erforderlich. Er ruft automatisch alle Metadaten aus Ihrem Datensatz ab und zeigt sie in einer übersichtlichen Tabelle an.

Die verfügbaren Standardfelder sind:

Title: Optionaler benutzerdefinierter Titel für die Ausgabe (Standard ist "Metadata")

Description: Optionale Beschreibung zur Bereitstellung von Kontext zu dieser Metadatenansicht

Beispiele

Beispiel 1: Überprüfung der Datenaktualität für Entscheidungsfindung

Szenario: Ihr Finanzteam bereitet sich auf eine monatliche Geschäftsbesprechung vor und muss bestätigen, dass die analysierten Kreditorendaten aktuell sind. Veraltete Daten könnten zu falschen Schlussfolgerungen über die Zahlungsleistung führen.

Einstellungen:

Title: "Data Currency Check"
Description: "AP Process - Monthly Review"

Ausgabe:

Der Rechner zeigt eine zweispaltige Tabelle mit allen Metadaten des Datensatzes. Wichtige Kennzahlen zur Datenaktualität umfassen:

Letzte erfolgreiche Datenextraktion: 2025-10-19 6:00:00 AM
Stunden seit letzter Extraktion: 2.5
Extraction Version: 3.2.1
Aktuelle Zeit: 2025-10-19 8:30:00 AM
TimeZoneName: Eastern Standard Time
ProcessDisplayName: Accounts Payable Process

Einblicke: Die Daten wurden erst vor 2,5 Stunden um 6:00 Uhr morgens extrahiert, was bestätigt, dass sie die abgeschlossenen Arbeiten von gestern widerspiegeln. Das Team kann die Analyse mit dem Wissen durchführen, dass es aktuelle Daten verwendet. Wäre die Anzeige bei "Stunden seit letzter Extraktion" mehrere Tage gewesen, müssten sie vor der Besprechung eine Datenaktualisierung anfordern.

Beispiel 2: Fehlersuche bei Zeitzonendifferenzen

Szenario: Nutzer berichten, dass Prozesszeitstempel nicht mit den Zeiten im Quell-ERP-System übereinstimmen. Einige Fälle scheinen um 4:00 Uhr morgens zu beginnen, obwohl das Geschäft erst um 8:00 Uhr öffnet. Sie vermuten ein Problem mit der Zeitzonenkonfiguration.

Einstellungen:

Title: "Timezone Configuration Review"
Description: "Investigating timestamp interpretation issues"

Ausgabe:

Der Metadaten-Rechner zeigt die Zeitzonenkonfiguration an:

TimeZoneName: UTC
IsLocalTime: False
Aktuelle Zeit: 2025-10-19 12:30:00 PM
Start Time: StartTime
End Time: EndTime
UseDateOnlySorting: False

Einblicke: Der Datensatz ist so konfiguriert, dass UTC-Zeit statt lokaler Zeit verwendet wird (IsLocalTime: False), was die vierstündige Differenz erklärt. Das Geschäft operiert in Eastern Time (UTC-4), sodass 4:00 Uhr im Datensatz tatsächlich 8:00 Uhr Ortszeit entspricht. Das Team muss entweder den ETL neu konfigurieren, um Eastern Time zu verwenden, oder die Nutzer darüber aufklären, dass alle Zeiten in UTC angezeigt werden. Dies verhindert Fehlinterpretationen von Prozesszeiten und Leistungskennzahlen.

Beispiel 3: Dokumentation der Datenherkunft für Audit-Compliance

Szenario: Das interne Audit-Team Ihres Unternehmens benötigt eine Dokumentation der Datenquellen, Extraktionsmethoden und Versionierung aller Prozess-Mining-Analysen, die bei Compliance-Berichten verwendet werden. Sie müssen die Nachvollziehbarkeit und Zuverlässigkeit Ihrer Rechnungsverarbeitungsanalyse überprüfen.

Einstellungen:

Title: "Data Lineage - Q4 2025 Compliance Report"
Description: "Invoice Processing Analysis Metadata"

Ausgabe:

Die Metadaten-Tabelle enthält umfassende Informationen zur Herkunft:

ProcessDisplayName: Invoice Processing
TransformerFilename: InvoiceProcessing_SAP_Config.json
TransformerVersion: 2.1.0
Extraction Version: 1.8.3
EngineAttributeVersion: 8.0.2
ProcessAttributeVersion: 3.4.1
Letzte erfolgreiche Datenextraktion: 2025-10-15 11:45:00 PM
Etl Notes: Vollständige Extraktion aus SAP ECC Produktion
Beschreibung: Rechnungsverarbeitung Q4 2025 für Compliance-Bericht
BaseCurrency: USD

Einblicke: Das Audit-Team kann jetzt genau nachverfolgen, wie die Daten erzeugt wurden: am 15. Oktober aus SAP ECC Produktion unter Verwendung der Transformer-Konfigurationsversion 2.1.0 und der Extraktionspipeline-Version 1.8.3. Die dokumentierten Versionen erlauben die Verifikation, dass genehmigte, validierte ETL-Prozesse verwendet wurden. Die "Etl Notes" bestätigen, dass die Datenquelle das Produktionssystem und kein Testsystem war. Diese lückenlose Herkunftsdokumentation erfüllt die Prüfanforderungen für Datenherkunft.

Beispiel 4: Unterstützung der Entwicklung benutzerdefinierter Python-Skripte

Szenario: Ein Datenanalyst entwickelt ein benutzerdefiniertes Python-Skript, um bestimmte Fallattribute für weitere Analysen in R zu exportieren. Er muss die genauen Spaltennamen im Datensatz kennen, um korrekte Abfragen zu schreiben.

Einstellungen:

Title: "Column Mapping Reference"
Description: "Core column names for custom scripts"

Ausgabe:

Der Metadaten-Rechner zeigt die Zuordnung der Kerndatenspalten:

CaseId: PurchaseOrderNumber
Activity: ProcessStep
Start Time: EventTimestamp
End Time: EventTimestamp
Resource: PerformedBy
ExpectedOrder: StepSequence

Einblicke: Der Analyst erkennt, dass dieser Datensatz benutzerdefinierte Spaltennamen verwendet statt der Standardnamen. Die Fall-ID ist in "PurchaseOrderNumber" gespeichert (nicht "CaseId"), Aktivitäten sind in "ProcessStep" (nicht "Activity"), und Ressourcen sind in "PerformedBy" (nicht "Resource"). Mit diesen genauen Namen kann der Analyst präzise SQL-Abfragen und Python-Skripte schreiben, die auf die richtigen Felder verweisen. Ohne diese Information würde das Skript mit Spaltennichtgefunden-Fehlern scheitern.

Beispiel 5: Versionskompatibilitätsprüfung über Umgebungen hinweg

Szenario: Ihre Organisation unterhält drei Prozess-Mining-Umgebungen: Entwicklung, Test und Produktion. Vor dem Rollout eines neuen Dashboards in die Produktion müssen Sie prüfen, ob alle Umgebungen kompatible Versionen der Datenextraktionspipeline verwenden, um konsistentes Verhalten sicherzustellen.

Einstellungen:

Title: "Version Compatibility - Production Environment"
Description: "Pre-deployment verification"

Ausgabe:

Metadaten der Produktionsumgebung zeigen:

Derived Attribute Version: 2.3.1
Extraction Version: 1.9.0
ProcessAttributeVersion: 3.5.0
EngineAttributeVersion: 8.1.0
TransformerVersion: 2.2.0

Im Vergleich zur Testumgebung (aus einem separaten Metadaten-Rechner):

Derived Attribute Version: 2.3.1 (ÜBEREINSTIMMUNG)
Extraction Version: 1.9.0 (ÜBEREINSTIMMUNG)
ProcessAttributeVersion: 3.4.1 (NICHT ÜBEREINSTIMMEND – Produktion neuer)
EngineAttributeVersion: 8.1.0 (ÜBEREINSTIMMUNG)
TransformerVersion: 2.2.0 (ÜBEREINSTIMMUNG)

Einblicke: Die Umgebungen sind größtenteils kompatibel, mit vier von fünf exakt übereinstimmenden Versionen. Die Produktion hat jedoch eine neuere ProcessAttributeVersion (3.5.0 vs. 3.4.1), was darauf hinweist, dass in der Produktion zusätzliche oder geänderte prozessspezifische Attribute vorhanden sind. Vor dem Deployment des Dashboards von Test nach Produktion muss das Team prüfen, ob es sich auf Attribute stützt, die in Test existieren, aber in Produktion geändert wurden. Diese proaktive Prüfung verhindert Ausfallzeiten und gewährleistet konsistente Analysen über Umgebungen hinweg.

Beispiel 6: Überwachung der Gesundheit der automatisierten ETL-Pipeline

Szenario: Ihr Data-Engineering-Team führt jeden Abend einen ETL-Job aus, der die Prozess-Mining-Daten bis 6:00 Uhr morgens aktualisieren soll. Das Betriebsteam benötigt eine Möglichkeit, schnell zu überprüfen, ob die Pipeline erfolgreich gelaufen ist, ohne Logdateien prüfen zu müssen.

Einstellungen:

Title: "ETL Pipeline Status"
Description: "Nightly extraction monitoring - Order-to-Cash"

Ausgabe:

Der Metadaten-Rechner zeigt:

Letzte erfolgreiche Datenextraktion: 2025-10-18 5:45:00 AM
Stunden seit letzter Extraktion: 26.5
Extraction Version: 1.9.0
Etl Notes: Inkrementelle Extraktion erfolgreich abgeschlossen
Aktuelle Zeit: 2025-10-19 8:15:00 AM

Einblicke: Die Anzeige "Stunden seit letzter Extraktion" von 26,5 Stunden zeigt, dass die letzte erfolgreiche Extraktion gestern Morgen stattfand, nicht heute Morgen. Der nächtliche Job ist fehlgeschlagen. Das Betriebsteam untersucht sofort und findet eine Datenbank-Verbindungsunterbrechung, die die Extraktion am Vorabend verhinderte. Durch diese frühzeitige Erkennung können sie die Extraktion erneut starten, bevor Geschäftsanwender bemerken, dass sie mit veralteten Daten arbeiten. Ohne diese Überwachung könnten Nutzer operative Entscheidungen auf Basis veralteter Informationen treffen.

Ausgabe

Der Metadaten-Rechner erzeugt eine einzige Tabelle mit zwei Spalten, die alle verfügbaren Metadaten des Datensatzes anzeigen.

Tabellenstruktur:

Name: Der Name jeder Metadaten-Eigenschaft oder Konfigurationseinstellung

Value: Der zugehörige Wert für diese Eigenschaft

Informationskategorien

Die Metadaten sind in mehrere logische Gruppen gegliedert:

Versionsinformationen:

Derived Attribute Version: Version des Schemas der abgeleiteten Attribute
Extraction Version: Versionskennung aus der ETL-Extraktion
ProcessAttributeVersion: Versionsnummer des prozessspezifischen Attributschemas
EngineAttributeVersion: Versionsnummer des Engine-Attributschemas
TransformerVersion: Version des verwendeten Daten-Transformers

Prozesskonfiguration:

ProcessName: Interner Prozessbezeichner
ProcessDisplayName: Menschlich lesbarer Prozessname
BaseCurrency: Währung für monetäre Berechnungen

Zeiteinstellungen:

TimeZoneName: Konfigurierte Zeitzone des Datensatzes
IsLocalTime: Ob Zeitstempel in Ortszeit (statt UTC) vorliegen
Aktuelle Zeit: Aktuelle Zeit basierend auf Zeitzoneneinstellungen
UseDateOnlySorting: Ob Ereignisse nur nach Datum (ohne Uhrzeit) sortiert werden

Kerndatenspalten-Zuordnung:

CaseId: Name der Fallbezeichnerspalte
Activity: Name der Aktivitätsspalte
Start Time: Name der Startzeit-Spalte
End Time: Name der Endzeit-Spalte
Resource: Name der Ressourcenspalte
ExpectedOrder: Name der erwarteten Reihenfolge-Spalte

ETL-Konfiguration:

TransformerFilename: Name der Transformer-/Konfigurationsdatei
Order Event Algorithm: Algorithmus für Ereignisreihenfolge
Letzte erfolgreiche Datenextraktion: Zeitstempel des letzten erfolgreichen ETL-Laufs
Stunden seit letzter Extraktion: Berechnetes Alter der Daten
Etl Notes: Anmerkungen zum ETL-Prozess
Notes: Allgemeine Datensatz-Notizen
Beschreibung: Beschreibung des Datensatzes

Verständnis der Ausgabe

Datenaktualität: Prüfen Sie "Stunden seit letzter Extraktion", um zu erkennen, ob Ihre Daten aktuell sind. Werte über 24-48 Stunden können auf Probleme in der ETL-Pipeline hinweisen, die untersucht werden sollten.

Zeitzoneninterpretation: Die Kombination aus "TimeZoneName" und "IsLocalTime" bestimmt, wie Zeitstempel angezeigt werden. Wenn IsLocalTime auf False steht, werden alle Zeiten unabhängig von der Einstellung in UTC angezeigt.

Versionsverfolgung: Alle Versionsfelder (Extraction Version, TransformerVersion usw.) helfen, zu verfolgen, welche ETL-Pipeline und Schema-Versionen die Daten erzeugt haben. Dies ist entscheidend für die Fehlersuche bei Umgebungswechseln.

Spaltennamen: Die Zuordnungen für Kerndatenspalten zeigen die tatsächlichen Spaltennamen in Ihrem Datensatz an, die von den Standardnamen abweichen können, wenn eine benutzerdefinierte Zuordnung bei der Datenextraktion konfiguriert wurde.

Nullwerte: Einige Eigenschaften können leere Werte oder "Unknown" anzeigen, wenn diese Informationen bei der Extraktion nicht verfügbar oder noch nicht konfiguriert waren.

Diese Dokumentation ist Bestandteil der mindzie Studio Prozess-Mining-Plattform.