Metadata

Overzicht

De Metadata-calculator toont uitgebreide technische informatie over hoe uw dataset is gegenereerd, geëxtraheerd en geconfigureerd. Deze zero-configuratie calculator levert essentiële metadata, inclusief versiegegevens, ETL-configuratie, tijdzone-instellingen en kernkolommen mappings.

In tegenstelling tot calculators die procesgegevens analyseren, onthult Metadata de technische basis van uw dataset - wanneer deze is geëxtraheerd, welke versies van de ETL-pijplijn zijn gebruikt, hoe tijdstempels worden geïnterpreteerd en welke kolomnamen worden gekoppeld aan kernbegrippen uit process mining zoals case ID en activiteit.

Veelvoorkomende toepassingen

  • Controleer de actualiteit van gegevens door de extractietijdstempel en het aantal uur sinds de laatste update te bekijken
  • Los problemen met tijdzones op door de tijdzoneconfiguratie en instellingen voor lokale tijd te controleren
  • Documenteer de gegevensherkomst voor naleving en auditvereisten
  • Valideer ETL-configuratie door transformer versie en instellingen te bevestigen
  • Ondersteun technische probleemoplossing door kernkolomnamen voor aangepaste scripts te identificeren
  • Volg dataset versiebeheer over verschillende omgevingen (ontwikkeling, test, productie)

Instellingen

Deze calculator vereist geen configuratie. Hij haalt automatisch alle metadata uit uw dataset op en toont deze in een overzichtelijke tabel.

De enige standaardvelden die beschikbaar zijn:

Titel: Optionele aangepaste titel voor de output (standaard "Metadata")

Beschrijving: Optionele beschrijving om context te bieden bij deze metadata-weergave

Voorbeelden

Voorbeeld 1: Controle van gegevensactualiteit voor besluitvorming

Scenario: Uw financiële team bereidt zich voor op een maandelijkse business review meeting en moet bevestigen dat ze de meest actuele openstaande factuurgegevens analyseren. Verouderde gegevens kunnen leiden tot verkeerde conclusies over betalingsprestaties.

Instellingen:

  • Titel: "Controle gegevensactualiteit"
  • Beschrijving: "AP Proces - Maandelijkse review"

Output:

De calculator toont een tabel met twee kolommen met alle dataset metadata. Belangrijke metrics voor gegevensactualiteit zijn:

  • Laatste succesvolle data-extractie: 2025-10-19 6:00:00 AM
  • Uren sinds laatste extractie: 2,5
  • Extraction Version: 3.2.1
  • Huidige tijd: 2025-10-19 8:30:00 AM
  • TimeZoneName: Eastern Standard Time
  • ProcessDisplayName: Accounts Payable Process

Inzichten: De data is slechts 2,5 uur geleden geëxtraheerd om 6:00 uur vanochtend, wat bevestigt dat het de taken van gisteren weerspiegelt. Het team kan met vertrouwen doorgaan met de analyse in de wetenschap dat ze actuele gegevens hebben. Als "Uren sinds laatste extractie" meerdere dagen hadden getoond, zouden ze een data-refresh moeten aanvragen vóór de vergadering.

Voorbeeld 2: Probleemoplossing van tijdzoneverschillen

Scenario: Gebruikers melden dat proces tijdstempels niet overeenkomen met de tijden in het bronsysteem ERP. Sommige cases lijken te starten om 4:00 uur terwijl het bedrijf pas om 8:00 uur opent. U vermoedt een tijdzoneconfiguratieprobleem.

Instellingen:

  • Titel: "Herziening tijdzoneconfiguratie"
  • Beschrijving: "Onderzoek naar interpretatie van tijdstempels"

Output:

De Metadata-calculator toont de tijdzoneconfiguratie:

  • TimeZoneName: UTC
  • IsLocalTime: False
  • Huidige tijd: 2025-10-19 12:30:00 PM
  • Start Time: StartTime
  • End Time: EndTime
  • UseDateOnlySorting: False

Inzichten: De dataset is geconfigureerd om UTC-tijd te gebruiken, niet lokale tijd (IsLocalTime: False), wat het 4-uur verschil verklaart. Het bedrijf werkt in Eastern Time (UTC-4), dus wat als 4:00 uur 's nachts verschijnt, is in werkelijkheid 8:00 uur lokale tijd. Het team moet de ETL herconfigureren om Eastern Time te gebruiken of gebruikers informeren dat alle tijden in UTC worden weergegeven. Dit voorkomt misverstanden over proces- en prestatie-timing.

Voorbeeld 3: Documentatie van gegevensherkomst voor auditnaleving

Scenario: Het interne auditteam van uw bedrijf vereist documentatie van gegevensbronnen, extractiemethoden en versiebeheer voor alle process mining-analyses gebruikt in compliance-rapportage. Ze moeten de traceerbaarheid en betrouwbaarheid van uw factuurverwerkingsanalyse verifiëren.

Instellingen:

  • Titel: "Dataherkomst - Q4 2025 Compliance Rapport"
  • Beschrijving: "Metadata factuurverwerking analyse"

Output:

De Metadata-tabel biedt uitgebreide herkomstinformatie:

  • ProcessDisplayName: Invoice Processing
  • TransformerFilename: InvoiceProcessing_SAP_Config.json
  • TransformerVersion: 2.1.0
  • Extraction Version: 1.8.3
  • EngineAttributeVersion: 8.0.2
  • ProcessAttributeVersion: 3.4.1
  • Laatste succesvolle data-extractie: 2025-10-15 11:45:00 PM
  • Etl Notes: Volledige extractie uit SAP ECC productie
  • Beschrijving: Q4 2025 factuurverwerking voor compliance rapportage
  • BaseCurrency: USD

Inzichten: Het auditteam kan nu precies traceren hoe de data is gegenereerd: geëxtraheerd uit SAP ECC productie op 15 oktober met transformer configuratieversie 2.1.0 en extractiepijplijn versie 1.8.3. De gedocumenteerde versies maken het mogelijk te verifiëren dat goedgekeurde, gevalideerde ETL-processen zijn gebruikt. De "Etl Notes" bevestigen dat de datastroom uit de productieomgeving komt, niet uit een testsysteem. Deze volledige herkomst voldoet aan auditvereisten voor dataprovincie.

Voorbeeld 4: Ondersteuning van ontwikkeling van aangepaste Python-scripts

Scenario: Een data-analist ontwikkelt een aangepast Python-script om specifieke case-kenmerken te exporteren voor verdere analyse in R. Ze moeten de exacte kolomnamen in de dataset weten om correcte queries te schrijven.

Instellingen:

  • Titel: "Kolom-mapping referentie"
  • Beschrijving: "Kernkolomnamen voor aangepaste scripts"

Output:

De Metadata-calculator toont de kernkolommappings:

  • CaseId: PurchaseOrderNumber
  • Activity: ProcessStep
  • Start Time: EventTimestamp
  • End Time: EventTimestamp
  • Resource: PerformedBy
  • ExpectedOrder: StepSequence

Inzichten: De analist ontdekt dat deze dataset aangepaste kolomnamen gebruikt in plaats van standaardwaarden. De case-identificatie staat in "PurchaseOrderNumber" (niet "CaseId"), activiteiten zijn in "ProcessStep" (niet "Activity") en resources in "PerformedBy" (niet "Resource"). Met deze exacte kolomnamen kan de analist nauwkeurige SQL-queries en Python-scripts schrijven die verwijzen naar de juiste velden. Zonder deze informatie zou het script falen met foutmeldingen dat kolommen niet gevonden worden.

Voorbeeld 5: Controle van versiecompatibiliteit over omgevingen heen

Scenario: Uw organisatie onderhoudt drie process mining-omgevingen: ontwikkeling, test en productie. Voor het promoten van een nieuw dashboard naar productie moet u bevestigen dat alle omgevingen compatibele versies van de data-extractiepijplijn gebruiken om consistent gedrag te waarborgen.

Instellingen:

  • Titel: "Versiecompatibiliteit - Productieomgeving"
  • Beschrijving: "Pre-deployment verificatie"

Output:

Metadata van productieomgeving toont:

  • Derived Attribute Version: 2.3.1
  • Extraction Version: 1.9.0
  • ProcessAttributeVersion: 3.5.0
  • EngineAttributeVersion: 8.1.0
  • TransformerVersion: 2.2.0

Vergeleken met testomgeving (uit een aparte Metadata-calculator):

  • Derived Attribute Version: 2.3.1 (OVEREENKOMST)
  • Extraction Version: 1.9.0 (OVEREENKOMST)
  • ProcessAttributeVersion: 3.4.1 (AFWIJKING - productie nieuwer)
  • EngineAttributeVersion: 8.1.0 (OVEREENKOMST)
  • TransformerVersion: 2.2.0 (OVEREENKOMST)

Inzichten: De omgevingen zijn grotendeels compatibel, met vier van de vijf versies exact overeenkomend. Productie heeft echter een nieuwere ProcessAttributeVersion (3.5.0 vs 3.4.1), wat suggereert dat productie aanvullende of gewijzigde proces-specifieke attributen heeft. Voordat het dashboard van test naar productie wordt uitgerold, moet het team verifiëren of het afhankelijk is van attributen die in test bestaan maar mogelijk anders zijn in productie. Deze proactieve controle voorkomt uitrolfouten en zorgt voor consistente analyses over omgevingen.

Voorbeeld 6: Monitoring van de gezondheid van de geautomatiseerde ETL-pijplijn

Scenario: Uw data-engineeringteam runt een nightly ETL-taak die process mining-gegevens elke ochtend om 6:00 uur zou moeten verversen. Het operationele team heeft een snelle methode nodig om te bevestigen dat de pijplijn succesvol is uitgevoerd zonder logbestanden te hoeven checken.

Instellingen:

  • Titel: "Status ETL-pijplijn"
  • Beschrijving: "Monitoring nachtelijke extractie - Order-to-Cash"

Output:

De Metadata-calculator toont:

  • Laatste succesvolle data-extractie: 2025-10-18 5:45:00 AM
  • Uren sinds laatste extractie: 26,5
  • Extraction Version: 1.9.0
  • Etl Notes: Incrementele extractie succesvol afgerond
  • Huidige tijd: 2025-10-19 8:15:00 AM

Inzichten: "Uren sinds laatste extractie" toont 26,5 uur wat betekent dat de laatste succesvolle extractie gisteren ochtend was, niet vanochtend. De nachtelijke taak is mislukt. Het operationele team onderzoekt meteen en ontdekt een database connectie time-out die extractie van afgelopen nacht heeft verhinderd. Door deze vroege ontdekking kan de extractie opnieuw worden uitgevoerd voordat eindgebruikers dagoude data zien. Zonder deze monitoring zouden gebruikers operationele beslissingen kunnen nemen op basis van verouderde informatie zonder het te beseffen.

Output

De Metadata-calculator genereert een enkele tabel met twee kolommen die alle beschikbare dataset metadata tonen.

Tabelstructuur:

Naam: De naam van elke metadata-eigenschap of configuratie-instelling

Waarde: De bijbehorende waarde voor die eigenschap

Informatiecategorieën

De metadata is georganiseerd in verschillende logische groepen:

Versie-informatie:

  • Derived Attribute Version: Versie van het schema voor afgeleide attributen
  • Extraction Version: Versie-identificatie van ETL-extractie
  • ProcessAttributeVersion: Proces-specifieke attribuutschema versie
  • EngineAttributeVersion: Engine attribuutschema versie
  • TransformerVersion: Versie van de gebruikte data transformer

Procesconfiguratie:

  • ProcessName: Interne procesidentificatie
  • ProcessDisplayName: Menselijk leesbare procesnaam
  • BaseCurrency: Valuta gebruikt voor financiële berekeningen

Tijdconfiguratie:

  • TimeZoneName: Geconfigureerde tijdzone voor de dataset
  • IsLocalTime: Of tijdstempels in lokale tijd zijn (vs UTC)
  • Huidige tijd: Huidige tijd op basis van tijdzone-instellingen
  • UseDateOnlySorting: Of gebeurtenissen alleen op datum worden gesorteerd (zonder tijd)

Kernkolom Mapping:

  • CaseId: Naam van de case-identificatorkolom
  • Activity: Naam van de activiteitskolom
  • Start Time: Naam van de starttijdkolom
  • End Time: Naam van de eindtijdkolom
  • Resource: Naam van de resourcekolom
  • ExpectedOrder: Naam van de verwachting-volgorde kolom

ETL-configuratie:

  • TransformerFilename: Naam van het transformer/configuratiebestand
  • Order Event Algorithm: Algoritme gebruikt voor event ordering
  • Laatste succesvolle data-extractie: Tijdstempel van laatste succesvolle ETL-run
  • Uren sinds laatste extractie: Berekende leeftijd van de data
  • Etl Notes: Aantekeningen van het ETL-proces
  • Notities: Algemene datasetnotities
  • Beschrijving: Datasetbeschrijving

Begrip van de output

Data actualiteit: Controleer "Uren sinds laatste extractie" om te bepalen of uw data actueel is. Waarden boven 24-48 uur kunnen ETL-pijplijnproblemen aanduiden die nader onderzoek vereisen.

Tijdzone interpretatie: De combinatie van "TimeZoneName" en "IsLocalTime" bepaalt hoe tijdstempels worden weergegeven. Als IsLocalTime False is, worden alle tijden in UTC getoond ongeacht de TimeZoneName instelling.

Versietracking: Alle versievelden (Extraction Version, TransformerVersion, etc.) helpen te volgen welke ETL-pijplijn en schema versies de data hebben gegenereerd. Dit is cruciaal voor probleemoplossing over omgevingdeployments heen.

Kolomnamen: De kernkolommappings tonen de feitelijke kolomnamen die in uw dataset worden gebruikt, welke kunnen verschillen van standaardwaarden als tijdens extractie een aangepaste mapping is geconfigureerd.

Nullwaarden: Sommige eigenschappen kunnen lege waarden of "Unknown" tonen indien die informatie niet beschikbaar was tijdens extractie of nog niet geconfigureerd is.


Deze documentatie maakt deel uit van het mindzieStudio process mining platform.