Metadaten

Übersicht

Der Metadaten-Rechner zeigt umfassende technische Informationen darüber an, wie Ihr Datensatz erstellt, extrahiert und konfiguriert wurde. Dieser rechner benötigt keine Konfiguration und liefert wesentliche Metadaten einschließlich Versionsdetails, ETL-Konfiguration, Zeitzoneneinstellungen und Zuordnungen zu Kerndatenspalten.

Im Gegensatz zu Rechnern, die Prozessdaten analysieren, offenbart Metadaten die technische Grundlage Ihres Datensatzes – wann er extrahiert wurde, welche Versionen der ETL-Pipeline verwendet wurden, wie Zeitstempel interpretiert werden und welche Spaltennamen auf zentrale Prozess-Mining-Konzepte wie Fall-ID und Aktivität abgebildet sind.

Häufige Anwendungsfälle

  • Überprüfen der Datenaktualität durch Prüfung des Extraktionszeitpunkts und der Stunden seit der letzten Aktualisierung
  • Fehlersuche bei Zeitzonenproblemen durch Überprüfung der Zeitzonenkonfiguration und lokale Zeiteinstellungen
  • Dokumentation der Datenherkunft für Compliance- und Prüfungsanforderungen
  • Validierung der ETL-Konfiguration durch Bestätigung der Transformer-Version und Einstellungen
  • Unterstützung technischer Fehlersuche durch Identifizierung zentraler Spaltennamen für benutzerdefinierte Skripte
  • Verfolgung der Versionierung des Datensatzes über mehrere Umgebungen (Entwicklung, Test, Produktion)

Einstellungen

Für diesen Rechner ist keine Konfiguration erforderlich. Er ruft automatisch alle Metadaten aus Ihrem Datensatz ab und zeigt sie in einer übersichtlichen Tabelle an.

Die verfügbaren Standardfelder sind:

Title: Optionaler benutzerdefinierter Titel für die Ausgabe (Standard ist "Metadata")

Description: Optionale Beschreibung zur Bereitstellung von Kontext zu dieser Metadatenansicht

Beispiele

Beispiel 1: Überprüfung der Datenaktualität für Entscheidungsfindung

Szenario: Ihr Finanzteam bereitet sich auf eine monatliche Geschäftsbesprechung vor und muss bestätigen, dass die analysierten Kreditorendaten aktuell sind. Veraltete Daten könnten zu falschen Schlussfolgerungen über die Zahlungsleistung führen.

Einstellungen:

  • Title: "Data Currency Check"
  • Description: "AP Process - Monthly Review"

Ausgabe:

Der Rechner zeigt eine zweispaltige Tabelle mit allen Metadaten des Datensatzes. Wichtige Kennzahlen zur Datenaktualität umfassen:

  • Letzte erfolgreiche Datenextraktion: 2025-10-19 6:00:00 AM
  • Stunden seit letzter Extraktion: 2.5
  • Extraction Version: 3.2.1
  • Aktuelle Zeit: 2025-10-19 8:30:00 AM
  • TimeZoneName: Eastern Standard Time
  • ProcessDisplayName: Accounts Payable Process

Einblicke: Die Daten wurden erst vor 2,5 Stunden um 6:00 Uhr morgens extrahiert, was bestätigt, dass sie die abgeschlossenen Arbeiten von gestern widerspiegeln. Das Team kann die Analyse mit dem Wissen durchführen, dass es aktuelle Daten verwendet. Wäre die Anzeige bei "Stunden seit letzter Extraktion" mehrere Tage gewesen, müssten sie vor der Besprechung eine Datenaktualisierung anfordern.

Beispiel 2: Fehlersuche bei Zeitzonendifferenzen

Szenario: Nutzer berichten, dass Prozesszeitstempel nicht mit den Zeiten im Quell-ERP-System übereinstimmen. Einige Fälle scheinen um 4:00 Uhr morgens zu beginnen, obwohl das Geschäft erst um 8:00 Uhr öffnet. Sie vermuten ein Problem mit der Zeitzonenkonfiguration.

Einstellungen:

  • Title: "Timezone Configuration Review"
  • Description: "Investigating timestamp interpretation issues"

Ausgabe:

Der Metadaten-Rechner zeigt die Zeitzonenkonfiguration an:

  • TimeZoneName: UTC
  • IsLocalTime: False
  • Aktuelle Zeit: 2025-10-19 12:30:00 PM
  • Start Time: StartTime
  • End Time: EndTime
  • UseDateOnlySorting: False

Einblicke: Der Datensatz ist so konfiguriert, dass UTC-Zeit statt lokaler Zeit verwendet wird (IsLocalTime: False), was die vierstündige Differenz erklärt. Das Geschäft operiert in Eastern Time (UTC-4), sodass 4:00 Uhr im Datensatz tatsächlich 8:00 Uhr Ortszeit entspricht. Das Team muss entweder den ETL neu konfigurieren, um Eastern Time zu verwenden, oder die Nutzer darüber aufklären, dass alle Zeiten in UTC angezeigt werden. Dies verhindert Fehlinterpretationen von Prozesszeiten und Leistungskennzahlen.

Beispiel 3: Dokumentation der Datenherkunft für Audit-Compliance

Szenario: Das interne Audit-Team Ihres Unternehmens benötigt eine Dokumentation der Datenquellen, Extraktionsmethoden und Versionierung aller Prozess-Mining-Analysen, die bei Compliance-Berichten verwendet werden. Sie müssen die Nachvollziehbarkeit und Zuverlässigkeit Ihrer Rechnungsverarbeitungsanalyse überprüfen.

Einstellungen:

  • Title: "Data Lineage - Q4 2025 Compliance Report"
  • Description: "Invoice Processing Analysis Metadata"

Ausgabe:

Die Metadaten-Tabelle enthält umfassende Informationen zur Herkunft:

  • ProcessDisplayName: Invoice Processing
  • TransformerFilename: InvoiceProcessing_SAP_Config.json
  • TransformerVersion: 2.1.0
  • Extraction Version: 1.8.3
  • EngineAttributeVersion: 8.0.2
  • ProcessAttributeVersion: 3.4.1
  • Letzte erfolgreiche Datenextraktion: 2025-10-15 11:45:00 PM
  • Etl Notes: Vollständige Extraktion aus SAP ECC Produktion
  • Beschreibung: Rechnungsverarbeitung Q4 2025 für Compliance-Bericht
  • BaseCurrency: USD

Einblicke: Das Audit-Team kann jetzt genau nachverfolgen, wie die Daten erzeugt wurden: am 15. Oktober aus SAP ECC Produktion unter Verwendung der Transformer-Konfigurationsversion 2.1.0 und der Extraktionspipeline-Version 1.8.3. Die dokumentierten Versionen erlauben die Verifikation, dass genehmigte, validierte ETL-Prozesse verwendet wurden. Die "Etl Notes" bestätigen, dass die Datenquelle das Produktionssystem und kein Testsystem war. Diese lückenlose Herkunftsdokumentation erfüllt die Prüfanforderungen für Datenherkunft.

Beispiel 4: Unterstützung der Entwicklung benutzerdefinierter Python-Skripte

Szenario: Ein Datenanalyst entwickelt ein benutzerdefiniertes Python-Skript, um bestimmte Fallattribute für weitere Analysen in R zu exportieren. Er muss die genauen Spaltennamen im Datensatz kennen, um korrekte Abfragen zu schreiben.

Einstellungen:

  • Title: "Column Mapping Reference"
  • Description: "Core column names for custom scripts"

Ausgabe:

Der Metadaten-Rechner zeigt die Zuordnung der Kerndatenspalten:

  • CaseId: PurchaseOrderNumber
  • Activity: ProcessStep
  • Start Time: EventTimestamp
  • End Time: EventTimestamp
  • Resource: PerformedBy
  • ExpectedOrder: StepSequence

Einblicke: Der Analyst erkennt, dass dieser Datensatz benutzerdefinierte Spaltennamen verwendet statt der Standardnamen. Die Fall-ID ist in "PurchaseOrderNumber" gespeichert (nicht "CaseId"), Aktivitäten sind in "ProcessStep" (nicht "Activity"), und Ressourcen sind in "PerformedBy" (nicht "Resource"). Mit diesen genauen Namen kann der Analyst präzise SQL-Abfragen und Python-Skripte schreiben, die auf die richtigen Felder verweisen. Ohne diese Information würde das Skript mit Spaltennichtgefunden-Fehlern scheitern.

Beispiel 5: Versionskompatibilitätsprüfung über Umgebungen hinweg

Szenario: Ihre Organisation unterhält drei Prozess-Mining-Umgebungen: Entwicklung, Test und Produktion. Vor dem Rollout eines neuen Dashboards in die Produktion müssen Sie prüfen, ob alle Umgebungen kompatible Versionen der Datenextraktionspipeline verwenden, um konsistentes Verhalten sicherzustellen.

Einstellungen:

  • Title: "Version Compatibility - Production Environment"
  • Description: "Pre-deployment verification"

Ausgabe:

Metadaten der Produktionsumgebung zeigen:

  • Derived Attribute Version: 2.3.1
  • Extraction Version: 1.9.0
  • ProcessAttributeVersion: 3.5.0
  • EngineAttributeVersion: 8.1.0
  • TransformerVersion: 2.2.0

Im Vergleich zur Testumgebung (aus einem separaten Metadaten-Rechner):

  • Derived Attribute Version: 2.3.1 (ÜBEREINSTIMMUNG)
  • Extraction Version: 1.9.0 (ÜBEREINSTIMMUNG)
  • ProcessAttributeVersion: 3.4.1 (NICHT ÜBEREINSTIMMEND – Produktion neuer)
  • EngineAttributeVersion: 8.1.0 (ÜBEREINSTIMMUNG)
  • TransformerVersion: 2.2.0 (ÜBEREINSTIMMUNG)

Einblicke: Die Umgebungen sind größtenteils kompatibel, mit vier von fünf exakt übereinstimmenden Versionen. Die Produktion hat jedoch eine neuere ProcessAttributeVersion (3.5.0 vs. 3.4.1), was darauf hinweist, dass in der Produktion zusätzliche oder geänderte prozessspezifische Attribute vorhanden sind. Vor dem Deployment des Dashboards von Test nach Produktion muss das Team prüfen, ob es sich auf Attribute stützt, die in Test existieren, aber in Produktion geändert wurden. Diese proaktive Prüfung verhindert Ausfallzeiten und gewährleistet konsistente Analysen über Umgebungen hinweg.

Beispiel 6: Überwachung der Gesundheit der automatisierten ETL-Pipeline

Szenario: Ihr Data-Engineering-Team führt jeden Abend einen ETL-Job aus, der die Prozess-Mining-Daten bis 6:00 Uhr morgens aktualisieren soll. Das Betriebsteam benötigt eine Möglichkeit, schnell zu überprüfen, ob die Pipeline erfolgreich gelaufen ist, ohne Logdateien prüfen zu müssen.

Einstellungen:

  • Title: "ETL Pipeline Status"
  • Description: "Nightly extraction monitoring - Order-to-Cash"

Ausgabe:

Der Metadaten-Rechner zeigt:

  • Letzte erfolgreiche Datenextraktion: 2025-10-18 5:45:00 AM
  • Stunden seit letzter Extraktion: 26.5
  • Extraction Version: 1.9.0
  • Etl Notes: Inkrementelle Extraktion erfolgreich abgeschlossen
  • Aktuelle Zeit: 2025-10-19 8:15:00 AM

Einblicke: Die Anzeige "Stunden seit letzter Extraktion" von 26,5 Stunden zeigt, dass die letzte erfolgreiche Extraktion gestern Morgen stattfand, nicht heute Morgen. Der nächtliche Job ist fehlgeschlagen. Das Betriebsteam untersucht sofort und findet eine Datenbank-Verbindungsunterbrechung, die die Extraktion am Vorabend verhinderte. Durch diese frühzeitige Erkennung können sie die Extraktion erneut starten, bevor Geschäftsanwender bemerken, dass sie mit veralteten Daten arbeiten. Ohne diese Überwachung könnten Nutzer operative Entscheidungen auf Basis veralteter Informationen treffen.

Ausgabe

Der Metadaten-Rechner erzeugt eine einzige Tabelle mit zwei Spalten, die alle verfügbaren Metadaten des Datensatzes anzeigen.

Tabellenstruktur:

Name: Der Name jeder Metadaten-Eigenschaft oder Konfigurationseinstellung

Value: Der zugehörige Wert für diese Eigenschaft

Informationskategorien

Die Metadaten sind in mehrere logische Gruppen gegliedert:

Versionsinformationen:

  • Derived Attribute Version: Version des Schemas der abgeleiteten Attribute
  • Extraction Version: Versionskennung aus der ETL-Extraktion
  • ProcessAttributeVersion: Versionsnummer des prozessspezifischen Attributschemas
  • EngineAttributeVersion: Versionsnummer des Engine-Attributschemas
  • TransformerVersion: Version des verwendeten Daten-Transformers

Prozesskonfiguration:

  • ProcessName: Interner Prozessbezeichner
  • ProcessDisplayName: Menschlich lesbarer Prozessname
  • BaseCurrency: Währung für monetäre Berechnungen

Zeiteinstellungen:

  • TimeZoneName: Konfigurierte Zeitzone des Datensatzes
  • IsLocalTime: Ob Zeitstempel in Ortszeit (statt UTC) vorliegen
  • Aktuelle Zeit: Aktuelle Zeit basierend auf Zeitzoneneinstellungen
  • UseDateOnlySorting: Ob Ereignisse nur nach Datum (ohne Uhrzeit) sortiert werden

Kerndatenspalten-Zuordnung:

  • CaseId: Name der Fallbezeichnerspalte
  • Activity: Name der Aktivitätsspalte
  • Start Time: Name der Startzeit-Spalte
  • End Time: Name der Endzeit-Spalte
  • Resource: Name der Ressourcenspalte
  • ExpectedOrder: Name der erwarteten Reihenfolge-Spalte

ETL-Konfiguration:

  • TransformerFilename: Name der Transformer-/Konfigurationsdatei
  • Order Event Algorithm: Algorithmus für Ereignisreihenfolge
  • Letzte erfolgreiche Datenextraktion: Zeitstempel des letzten erfolgreichen ETL-Laufs
  • Stunden seit letzter Extraktion: Berechnetes Alter der Daten
  • Etl Notes: Anmerkungen zum ETL-Prozess
  • Notes: Allgemeine Datensatz-Notizen
  • Beschreibung: Beschreibung des Datensatzes

Verständnis der Ausgabe

Datenaktualität: Prüfen Sie "Stunden seit letzter Extraktion", um zu erkennen, ob Ihre Daten aktuell sind. Werte über 24-48 Stunden können auf Probleme in der ETL-Pipeline hinweisen, die untersucht werden sollten.

Zeitzoneninterpretation: Die Kombination aus "TimeZoneName" und "IsLocalTime" bestimmt, wie Zeitstempel angezeigt werden. Wenn IsLocalTime auf False steht, werden alle Zeiten unabhängig von der Einstellung in UTC angezeigt.

Versionsverfolgung: Alle Versionsfelder (Extraction Version, TransformerVersion usw.) helfen, zu verfolgen, welche ETL-Pipeline und Schema-Versionen die Daten erzeugt haben. Dies ist entscheidend für die Fehlersuche bei Umgebungswechseln.

Spaltennamen: Die Zuordnungen für Kerndatenspalten zeigen die tatsächlichen Spaltennamen in Ihrem Datensatz an, die von den Standardnamen abweichen können, wenn eine benutzerdefinierte Zuordnung bei der Datenextraktion konfiguriert wurde.

Nullwerte: Einige Eigenschaften können leere Werte oder "Unknown" anzeigen, wenn diese Informationen bei der Extraktion nicht verfügbar oder noch nicht konfiguriert waren.


Diese Dokumentation ist Bestandteil der mindzie Studio Prozess-Mining-Plattform.