Dataset Informatie

Overzicht

De Dataset Informatie calculator biedt een uitgebreide statistische samenvatting van uw gehele procesdataset. Hij toont belangrijke meetwaarden zoals tijdsbereiken, aantal cases en events, activiteitstatistieken en informatie over datastructuur in één overzichtelijk en gemakkelijk leesbaar overzicht.

Deze calculator vereist geen configuratie en is ideaal om snel inzicht te krijgen in de omvang en kenmerken van uw procesgegevens.

Veelvoorkomende Gebruikstoepassingen

  • Begrijpen van de omvang van een nieuwe dataset voordat u begint met analyse
  • Valideren dat gegevensextractie het verwachte volume en tijdsbereik heeft vastgelegd
  • Vergelijken van datasets door hun statistische profielen naast elkaar te bekijken
  • Monitoren van procesvolumetrends door case- en eventaantallen in de tijd te volgen
  • Verifiëren van datakwaliteit door case duur-bereiken en eventdistributies te controleren
  • Genereren van dataset-metadata voor rapporten en presentaties

Instellingen

Er zijn geen specifieke instellingen voor deze calculator behalve de standaard velden voor titel en beschrijving. De calculator analyseert automatisch de gehele dataset en toont alle beschikbare meetwaarden.

Voorbeelden

Voorbeeld 1: Initiële Procesontdekking

Scenario: U heeft net een nieuwe purchase-to-pay dataset geïmporteerd en wilt de kenmerken begrijpen voordat u met analyse begint.

Instellingen:

  • Titel: "Purchase-to-Pay Dataset Overzicht"
  • Beschrijving: "Q4 2024 inkoopgegevens"

Uitvoer:

De calculator toont een uitgebreide tabel met de volgende meetwaarden:

  • Start Dataset Tijd: 2024-10-01 00:00:00
  • Eind Dataset Tijd: 2024-12-31 23:59:59
  • Dataset Tijdsduur: 92 dagen
  • Min Case Tijd: 2 uur
  • Max Case Tijd: 45 dagen
  • Gemiddelde Case Tijd: 8.5 dagen
  • Mediaan Case Tijd: 6.2 dagen
  • Totaal Aantal Cases: 1.847
  • Totaal Aantal Activiteiten: 14.776
  • Gemiddeld aantal activiteiten per case: 8.0
  • Activiteiten: 23 unieke activiteiten
  • Case Kolommen: 15 attributen
  • Activiteit Kolommen: 12 attributen

Inzichten: Deze dataset beslaat een volledig kwartaal met bijna 1.900 inkooporders. De gemiddelde case duur van 8,5 dagen is redelijk voor een inkoopproces, hoewel sommige cases tot 45 dagen duren, wat wijst op mogelijke vertragingen die nader onderzocht moeten worden. Met gemiddeld 8 activiteiten per case verdeeld over 23 unieke activiteiten toont het proces een matige complexiteit met enige variatie in uitvoeringstrajecten.

Voorbeeld 2: Vergelijken van Gefilterde versus Ongefilterde Data

Scenario: U wilt begrijpen hoe het toepassen van een tijdfilter de kenmerken van uw dataset beïnvloedt.

Instellingen:

  • Maak twee Dataset Informatie calculators aan:
    • "Volledig Dataset Overzicht" (geen filters)
    • "Overzicht Laatste 30 Dagen" (met tijdsperiode filter)

Uitvoer:

Volledige Dataset:

  • Totaal Aantal Cases: 1.847
  • Dataset Tijdsduur: 92 dagen
  • Gemiddelde Case Tijd: 8.5 dagen

Laatste 30 Dagen:

  • Totaal Aantal Cases: 623
  • Dataset Tijdsduur: 30 dagen
  • Gemiddelde Case Tijd: 9.2 dagen

Inzichten: De gefilterde weergave toont dat ongeveer een derde van de cases binnen de meest recente maand valt. Interessant is dat de gemiddelde case duur steeg van 8,5 naar 9,2 dagen in de recente periode, wat suggereert dat de procesprestatie mogelijk verslechtert en nader onderzoek vereist.

Voorbeeld 3: Validatie van Datakwaliteit

Scenario: Na het voltooien van een data-extractie moet u verifiëren dat alle verwachte data correct is vastgelegd.

Instellingen:

  • Titel: "Datakwaliteit Controle"
  • Beschrijving: "Validatie van extractie januari 2025"

Uitvoer:

  • Start Dataset Tijd: 2025-01-01 00:00:00
  • Eind Dataset Tijd: 2025-01-31 23:59:59
  • Totaal Aantal Cases: 412
  • Totaal Aantal Activiteiten: 3.296
  • Activiteiten: 18 unieke activiteiten

Inzichten: De dataset beslaat correct de gehele maand januari 2025 zoals verwacht. Het caseaantal van 412 komt overeen met het verwachte maandelijkse volume. Alle 18 standaardactiviteiten zijn aanwezig in de data, wat bevestigt dat de extractie alle activiteitssoorten heeft vastgelegd. Het gemiddelde van 8 activiteiten per case is consistent met historische patronen.

Voorbeeld 4: Documentatie van Prestatiebasislijn

Scenario: U moet baseline metrics documenteren voor uw proces voordat u verbeterinitiatieven doorvoert.

Instellingen:

  • Titel: "Pre-Verbetering Baseline Metrics"
  • Beschrijving: "Factuurverwerking baseline - januari 2025"

Uitvoer:

  • Totaal Aantal Cases: 2.156
  • Gemiddelde Case Tijd: 12.3 dagen
  • Mediaan Case Tijd: 9.5 dagen
  • Min Case Tijd: 4 uur
  • Max Case Tijd: 67 dagen
  • Gemiddeld aantal activiteiten per case: 11.2

Inzichten: De huidige factuurverwerking duurt gemiddeld 12,3 dagen met aanzienlijke variatie (4 uur tot 67 dagen). Het verschil tussen gemiddelde (12,3 dagen) en mediaan (9,5 dagen) suggereert dat een subset van facturen met zeer lange verwerkingstijden het gemiddelde omhoog trekt. Deze metrics vormen een duidelijke baseline om verbetering te meten na implementatie van proceswijzigingen.

Uitvoer

De Dataset Informatie calculator toont een enkele tabel met twee kolommen:

Naam: De naam van elke meetwaarde

Waarde: De overeenkomstige waarde voor die meetwaarde

Opgenomen Meetwaarden

Tijd Meetwaarden:

  • Start Dataset Tijd: De tijdstempel van het vroegste event in de dataset
  • Eind Dataset Tijd: De tijdstempel van het laatste event in de dataset
  • Dataset Tijdsduur: De totale tijdsperiode die de dataset beslaat

Case Duur Meetwaarden:

  • Min Case Tijd: De kortste case duur in de dataset
  • Max Case Tijd: De langste case duur in de dataset
  • Gemiddelde Case Tijd: De gemiddelde duur over alle cases
  • Mediaan Case Tijd: De mediaan (middenwaarde) van case duur

Volume Meetwaarden:

  • Totaal Aantal Cases: Het aantal unieke cases in de dataset
  • Totaal Aantal Activiteiten: Het totale aantal events over alle cases
  • Gemiddeld aantal activiteiten per case: Het gemiddelde aantal events per case

Structuur Meetwaarden:

  • Activiteiten: Het aantal unieke activiteittypes in het proces
  • Case Kolommen: Het aantal attributen op case-niveau
  • Activiteit Kolommen: Het aantal attributen op event-niveau

Alle tijdwaarden worden weergegeven in een leesbaar formaat (bijvoorbeeld "8.5 dagen" of "2 uur 30 minuten"). De output kan worden toegevoegd aan dashboards voor continue monitoring of worden geëxporteerd voor documentatiedoeleinden.


Deze documentatie is onderdeel van het mindzie Studio process mining platform.