Follows Graphs

Opmerking: Dit is een calculator alleen voor beheerders, ontworpen voor testen en analyse van datakwaliteit. De meeste gebruikers dienen de Process Map calculator te gebruiken voor visuele procesanalyse.

Overzicht

De Follows Graphs calculator genereert gedetailleerde data over hoe activiteiten zich tot elkaar verhouden in uw proces. Het berekent twee typen relaties: direct volgt relaties waarbij de ene activiteit onmiddellijk volgt op de andere, en uiteindelijk volgt relaties waarbij de ene activiteit vóór een andere plaatsvindt op enig moment in het proces, ongeacht tussenliggende activiteiten.

In tegenstelling tot de Process Map calculator die interactieve visualisaties biedt, voert Follows Graphs volledige grafiekberekeningen uit en levert gestructureerde datatabellen die geschikt zijn voor gedetailleerde analyse, testen, prestatiebenchmarking en validatie van datakwaliteit. Deze calculator wordt voornamelijk gebruikt door beheerders en proces mining-analisten die toegang nodig hebben tot ruwe grafiekdata voor technische analyse of export naar externe tools.

Veelvoorkomende Toepassingen

  • Testen en valideren van grafiekberekeningsalgoritmes op correctheid en prestaties
  • Benchmarken van berekeningstijden bij verschillende datasetgroottes en complexiteiten
  • Identificeren van datakwaliteitsproblemen bij evenementen met identieke timestamps
  • Exporteren van gedetailleerde grafiekdata voor externe analyse in tools zoals R, Python of Gephi
  • Analyseren van duurverdelingen voor specifieke activiteitparen in detail
  • Valideren van process mining-algoritmes tijdens ontwikkeling en regressietesten

Instellingen

Deze calculator heeft geen configureerbare instellingen. Hij verwerkt elke keer alle cases en evenementen om volledige grafiekdata te genereren.

Voorbeelden

Voorbeeld 1: Identificeren van Datakwaliteitsproblemen met Identieke Timestamps

Scenario: U vermoedt dat uw eventlog precisieproblemen heeft waarbij meerdere activiteiten identieke timestamps hebben, waardoor de juiste volgorde niet bepaald kan worden. U wilt vaststellen welke activiteitparen hierdoor worden beïnvloed en hoe vaak dit voorkomt.

Instellingen:

Geen instellingen vereist.

Output:

De calculator genereert vijf datatabellen. Tabellen 2 en 3 tonen onbepaalde paren waarbij evenementen identieke timestamps hebben:

DirectlyFollows-Indeterminate tabel:

  • Create Invoice en Send Invoice: 127 keer
  • Receive Payment en Record Payment: 89 keer
  • Approve Request en Notify Approver: 45 keer

EventuallyFollows-Indeterminate tabel toont dezelfde paren plus eventuele aanvullende uiteindelijk-volgt relaties met nul duur.

De Stats tabel toont:

  • Berekeningstijd: 2.347 milliseconden
  • Tijd voor Tabelleninvulling: 156 milliseconden
  • Totaal aantal berekeningen: 1.247.893

Inzichten: Het hoge aantal onbepaalde paren wijst op significante problemen met timestampprecisie in uw eventlog. De meest voorkomende kwestie doet zich voor bij Create Invoice en Send Invoice die exact gelijktijdig plaatsvinden in 127 gevallen. Dit suggereert dat deze events worden vastgelegd met alleen datumprecisie of gelijktijdig worden getimestamped door uw bronsysteem. U dient te onderzoeken of deze activiteiten daadwerkelijk gelijktijdig zijn of dat uw data-extractieproces tijdsinformatie verliest. Dit datakwaliteitsprobleem kan de nauwkeurigheid van procesanalyse beïnvloeden en dient opgelost te worden door de timestampprecisie in uw brondatabron te verbeteren.

Voorbeeld 2: Prestatiebenchmarking bij Verschillende Datasetgroottes

Scenario: U optimaliseert uw process mining-infrastructuur en wilt begrijpen hoe de prestatie van grafiekberekeningen schaalt met de datasetgrootte. U wilt berekeningstijden meten voor verschillende datavolumes om resourceallocatie te plannen.

Instellingen:

Geen instellingen vereist.

Output:

De calculator draait op steeds grotere datasets en onderzoekt de Stats tabel:

Dataset van 10.000 cases:

  • Berekeningstijd: 847 milliseconden
  • Totaal aantal berekeningen: 186.234

Dataset van 50.000 cases:

  • Berekeningstijd: 4.521 milliseconden
  • Totaal aantal berekeningen: 931.170

Dataset van 100.000 cases:

  • Berekeningstijd: 9.234 milliseconden
  • Totaal aantal berekeningen: 1.862.340

De DirectlyFollows tabel bevat 156 unieke activiteitparen terwijl de EventuallyFollows tabel 2.847 paren bevat, wat de uitgebreide aard van uiteindelijk-volgt relaties aantoont.

Inzichten: De berekeningstijd schaalt min of meer lineair met het aantal cases voor deze dataset waarbij cases een consistent gemiddeld aantal evenementen hebben. Het totale aantal berekeningen toont echter dat het berekenen van de uiteindelijk-volgt grafiek aanzienlijk duurder is dan direct-volgt, wat overeenkomt met de kwadratische complexiteit van het algoritme bij cases met veel evenementen. Voor datasets groter dan 100.000 cases wordt aanbevolen om te filteren op de meest relevante cases voordat deze calculator wordt uitgevoerd, of extra computationele middelen toe te wijzen. De tijd voor het vullen van tabellen blijft consistent laag bij alle datasetgroottes, wat aangeeft dat de tabelconversie geen bottleneck vormt.

Voorbeeld 3: Exporteren van Procesdata voor Externe Onderzoeksanalyse

Scenario: U werkt samen met een universitair onderzoeksteam dat procesoptimalisatie-algoritmes bestudeert. Zij hebben ruwe procesgrafiekdata nodig in een gestandaardiseerd formaat om hun nieuwe analyse-aanpak te testen. U wilt uw procesrelaties exporteren met volledige duurstatistieken.

Instellingen:

Geen instellingen vereist.

Output:

De calculator genereert de DirectlyFollows tabel met 243 unieke activiteitparen:

Voorbeeldrijen uit de DirectlyFollows tabel:

  • Submit Claim -> Validate Documents: Aantal=1.847, Gemiddelde=2,3 dagen, Mediaan=1,8 dagen, Standaardafwijking=3,2 dagen
  • Validate Documents -> Approve Claim: Aantal=1.245, Gemiddelde=4,7 dagen, Mediaan=3,1 dagen, Standaardafwijking=6,8 dagen
  • Validate Documents -> Request Additional Info: Aantal=602, Gemiddelde=1,2 dagen, Mediaan=0,9 dagen, Standaardafwijking=2,1 dagen

De EventuallyFollows tabel bevat 4.892 paren die alle mogelijke activiteitrelaties tonen, inclusief niet-op-rij-volgende.

Inzichten: U kunt de DirectlyFollows tabel exporteren naar CSV-formaat en aan het onderzoeksteam leveren. De tabel bevat alle essentiële informatie voor process mining onderzoek: activiteitsnamen, frequenties van relaties en uitgebreide duurstatistieken zoals gemiddelde, mediaan, standaardafwijking, minimum en maximum waarden. De EventuallyFollows tabel biedt een nog completer beeld van activiteitrelaties voor onderzoekers die langeafstandafhankelijkheden in processen bestuderen. Het gestructureerde outputformat maakt eenvoudige import mogelijk in analysetools zoals R of Python voor statistische modellering.

Voorbeeld 4: Valideren van Wijzigingen in Process Mining Algoritmes

Scenario: Uw ontwikkelingsteam heeft het grafiekberekeningsalgoritme aangepast om de prestaties te verbeteren. U wilt controleren dat de wijzigingen identieke resultaten opleveren ten opzichte van de vorige versie om regressies uit te sluiten.

Instellingen:

Geen instellingen vereist.

Output:

Beide algoritmeversies worden uitgevoerd op een bekende testdataset met 5 cases en 11 evenementen:

DirectlyFollows tabel (beide versies):

  • 8 unieke activiteitparen
  • Identieke tellingen per paar
  • Identieke duurstatistieken

EventuallyFollows tabel (beide versies):

  • 28 unieke activiteitparen
  • Alle tellingen komen exact overeen
  • Alle duurstatistieken komen overeen binnen floating-point precisie

Vergelijking Stats tabel:

  • Oud algoritme: 89 milliseconden
  • Nieuw algoritme: 42 milliseconden
  • Beide: 138 totaal aantal berekeningen

Inzichten: De validatie bevestigt dat de algoritme-optimalisatie de berekeningstijd met 53 procent heeft verminderd zonder outputwaarden te wijzigen. Alle activiteitparen, tellingen en duurstatistieken zijn exact hetzelfde tussen versies, wat aantoont dat geen regressie heeft plaatsgevonden. Het consistente aantal berekeningen bevestigt dat beide algoritmes dezelfde evenementparen verwerken. Dit type validatie is essentieel bij prestatieverbeteringen om nauwkeurigheid te waarborgen. U kunt de geoptimaliseerde versie nu met vertrouwen in productie nemen.

Voorbeeld 5: Analyseren van Duurvariabiliteit voor Specifieke Activiteitparen

Scenario: Uw operations team meldt inconsistente verwerkingstijden tussen documentvalidatie en goedkeuringsactiviteiten. U wilt gedetailleerde duurstatistieken voor dit specifieke activiteitpaar om de variabiliteit te begrijpen en te zien of er meerdere onderscheidende patronen zijn.

Instellingen:

Geen instellingen vereist.

Output:

Bekijk de DirectlyFollows tabel voor het paar "Validate Documents -> Approve":

Activity1: Validate Documents
Activity2: Approve
Aantal: 3.247 keer
Gemiddelde duur: 5,8 dagen
Mediaan duur: 2,3 dagen
Standaardafwijking: 12,4 dagen
Minimale duur: 0,2 dagen
Maximale duur: 87,3 dagen

Het grote verschil tussen gemiddelde en mediaan wijst op een rechtsscheve verdeling met enkele extreme uitschieters. De hoge standaardafwijking duidt op significante variabiliteit.

Inzichten: Het opvallende verschil tussen mediaan (2,3 dagen) en gemiddelde (5,8 dagen) suggereert dat hoewel de meeste cases relatief snel worden verwerkt, een subset veel langer duurt en het gemiddelde omhoog trekt. De maximale duur van 87,3 dagen wijst op extreme uitschieters die onderzoek vereisen. De minimale duur van 0,2 dagen suggereert enkele versneld verwerkte cases. Dit variabiliteitspatroon geeft aan dat u cases zou moeten segmenteren om te identificeren wat snelle, normale en trage verwerking onderscheidt. U kunt dieper ingaan op de ruwe evenementpaargegevens om specifieke gevallen met extreme duur te identificeren en hun kenmerken te onderzoeken.

Output

De Follows Graphs calculator genereert vijf gestructureerde datatabellen met uitgebreide procesgrafiekinformatie:

Tabel 0: DirectlyFollows

Toont alle direct volgt relaties waarbij de ene activiteit onmiddellijk op de andere volgt zonder tussenliggende activiteiten.

Kolommen: Key (activiteitpaar-identifier), Activity1 (eerste activiteit), Activity2 (tweede activiteit), Count (frequentie), MeanDuration, MedianDuration, StdevDuration, MinDuration, MaxDuration

Deze tabel bevat doorgaans minder relaties dan EventuallyFollows, omdat alleen opeenvolgende activiteitparen zijn opgenomen.

Tabel 1: EventuallyFollows

Toont alle uiteindelijk volgt relaties waarbij de ene activiteit vóór een andere optreedt op enig moment in de case.

Kolommen: Zelfde structuur als DirectlyFollows tabel

Deze tabel is aanzienlijk groter omdat alle mogelijke activiteitparen worden opgenomen, ongeacht tussenliggende activiteiten. Voor een case met 10 evenementen zijn dit 45 mogelijke paren versus slechts 9 direct volgt paren.

Tabel 2: DirectlyFollows-Indeterminate

Identificeert direct volgt paren waarbij evenementen identieke timestamps hebben, wat ordening onbepaald maakt.

Kolommen: Key (ongerichte paar-identifier), Activity1, Activity2, Count

Een goed gestructureerde eventlog met precieze timestamps zou nul of zeer weinig onbepaalde paren moeten hebben. Hoge tellingen duiden op datakwaliteitsproblemen.

Tabel 3: EventuallyFollows-Indeterminate

Identificeert uiteindelijk volgt paren met identieke timestamps.

Kolommen: Zelfde structuur als DirectlyFollows-Indeterminate tabel

Bevat doorgaans dezelfde paren als DirectlyFollows-Indeterminate omdat timestampproblemen beide relatievormen beïnvloeden.

Tabel 4: Stats

Bevat prestatiestatistieken van de berekening.

Kolommen: CalculationTime (milliseconden voor grafiekberekening), FillTablesTime (milliseconden voor conversie naar tabellen), Calculations (totaal aantal evenementpaarvergelijkingen)

Gebruik deze tabel om prestaties te monitoren en te bepalen wanneer datasets te groot worden voor efficiënte verwerking.

Data Export Opties:

Alle tabellen kunnen geëxporteerd worden naar CSV- of Excel-formaat voor verdere analyse in externe tools. Het gestructureerde formaat maakt import in statistische software, grafiekvisualisatietools of aangepaste analysescripts eenvoudig.


Deze documentatie maakt deel uit van het mindzieStudio process mining platform.