Small Ends Filter
Overzicht
De Small Ends-filter knipt automatisch periodes met lage activiteit aan het begin en het einde van je gebeurtenislogboek. Deze intelligente filter op casusniveau detecteert "opwarm-" en "afkoel"-periodes waarin het aantal gebeurtenissen significant lager is dan gemiddeld, en verwijdert vervolgens casussen die volledig binnen deze periodes vallen. Dit zorgt ervoor dat je analyse zich richt op periodes van normale bedrijfsactiviteiten in plaats van op artefacten van dataverzameling of seizoensgebonden lage punten.
Veelvoorkomende Toepassingen
- Verwijderen van data uit go-live periodes van systemen voordat processen gestabiliseerd zijn
- Uitsluiten van periodes aan het einde van extracties waarbij data mogelijk incompleet is
- Filteren van vakantieperiodes met verminderde activiteit
- Elimineren van datakwaliteitsproblemen bij logboekgrenzen
- Focus op analyse van perioden met representatief procesgedrag
- Opschonen van gebeurtenislogboeken voor accurate doorvoer- en prestatiemaatstaven
Instellingen
Start Factor: Een vermenigvuldigingsfactor (0,0 tot 1,0) toegepast op het gemiddelde dagelijkse aantal gebeurtenissen. Dagen aan het begin van de log met een aantal gebeurtenissen lager dan (Start Factor x Gemiddeld Aantal Gebeurtenissen Per Dag) worden weggeknipt. Een lagere waarde is minder streng (houdt meer data); een hogere waarde is strenger (verwijdert meer vroege data).
End Factor: Een vermenigvuldigingsfactor (0,0 tot 1,0) toegepast op het gemiddelde dagelijkse aantal gebeurtenissen. Dagen aan het einde van de log met een aantal gebeurtenissen lager dan (End Factor x Gemiddeld Aantal Gebeurtenissen Per Dag) worden weggeknipt. Werkt hetzelfde als de Start Factor, maar dan voor het einde van de log.
Standaardwaarden: Beide factoren staan standaard op 0,1 (10%), wat betekent dat dagen met minder dan 10% van de gemiddelde dagelijkse activiteit als "klein" worden beschouwd en worden weggeknipt.
Voorbeelden
Voorbeeld 1: Standaard Opschoning
Scenario: Je gebeurtenislogboek begint met een periode van systeemonwikkeling waarin weinig transacties plaatsvonden, en eindigt met incomplete data van de extractiedatum. Je wilt deze periodes met lage activiteit automatisch knippen.
Instellingen:
- Start Factor: 0,1
- End Factor: 0,1
Resultaat:
De filter berekent het gemiddelde aantal gebeurtenissen per dag over je gehele log (bijvoorbeeld 500 gebeurtenissen/dag). Dagen met minder dan 50 gebeurtenissen worden als lage activiteit beschouwd. Als de eerste 5 dagen respectievelijk 10, 25, 30, 45 en 80 gebeurtenissen bevatten, begint de filter vanaf dag 4. Evenzo worden dagen met lage activiteit aan het einde weggeknipt.
Inzichten: Dit handelt automatisch problemen met datalimieten af zonder handmatige datumselectie, waardoor de analyse alleen perioden met representatieve activiteitsniveaus bevat.
Voorbeeld 2: Agressief Begin Knippen
Scenario: Je procesdata bevat een lange pilotperiode voorafgaand aan de volledige uitrol. Je wilt vroegtijdige data agressief knippen terwijl je de data aan het einde van de log behoudt.
Instellingen:
- Start Factor: 0,3
- End Factor: 0,1
Resultaat:
Dagen aan het begin met minder dan 30% van de gemiddelde dagelijkse activiteit worden weggeknipt. Dit verwijdert een groter deel van de pilot-/opstartperiode. Het einde gebruikt de standaard drempel van 10%, waardoor recentere data behouden blijft.
Inzichten: Asymmetrische factoren laten je situaties afhandelen waarin het begin en het einde van je log verschillende kenmerken hebben. Pilotperiodes hebben vaak een langere opstart dan afbouw.
Voorbeeld 3: Minimale Knipbeurt
Scenario: Je wilt zo veel mogelijk data behouden maar toch duidelijke datakwaliteitsproblemen bij de logboekgrenzen verwijderen.
Instellingen:
- Start Factor: 0,05
- End Factor: 0,05
Resultaat:
Alleen dagen met minder dan 5% van de gemiddelde dagelijkse activiteit worden weggeknipt. Dit pakt alleen de meest extreme lage-activiteitsperiodes aan terwijl het merendeel van de data behouden blijft, inclusief gematigde seizoensvariaties.
Inzichten: Gebruik lage factoren wanneer je bedrijf natuurlijke activiteitsschommelingen kent en je legitieme periodes met lage activiteit zoals weekenden of seizoensdipjes niet per ongeluk wilt verwijderen.
Voorbeeld 4: Verwijderen van Seizoensgebonden Grenzen
Scenario: Je log beslaat een heel jaar maar bevat december (vakantieperiode) aan zowel het begin als het einde vanwege de extractietiming. Je wilt je richten op periodes buiten de feestdagen.
Instellingen:
- Start Factor: 0,4
- End Factor: 0,4
Resultaat:
Dagen met minder dan 40% van de gemiddelde activiteit worden aan beide zijden weggeknipt. Dit verwijdert effectief vakantieperiodes waarin de activiteit aanzienlijk lager was dan normaal.
Inzichten: Hogere factoren helpen seizoensgebonden variaties uit te sluiten die de analyse kunnen vertekenen. Wees echter voorzichtig om niet te veel geldige data te verwijderen.
Voorbeeld 5: Nieuwe Systeemimplementatie
Scenario: Data werd geëxtraheerd uit een nieuw systeem dat 3 maanden geleden live ging. De eerste maand was er zeer weinig activiteit omdat gebruikers werden getraind en gemigreerd.
Instellingen:
- Start Factor: 0,5
- End Factor: 0,1
Resultaat:
Het eerste deel van de log (implementatie-/trainingsperiode met < 50% activiteit) wordt verwijderd, terwijl recente data behouden blijft met slechts minimale eindknip. Dit richt de analyse op de periode na het stabiliseren van het systeem.
Inzichten: Implementatieperiodes tonen vaak patronen die niet representatief zijn voor normale operaties. Het knippen ervan zorgt dat je procesmetingen de daadwerkelijke operationele prestaties weerspiegelen.
Hoe Het Werkt
- Bereken Dagelijkse Frequenties: De filter telt gebeurtenissen per dag in het logboek
- Bereken Gemiddelde Activiteit: Berekent het gemiddelde aantal gebeurtenissen per dag over het gehele tijdvak
- Vind Startgrens: Scant vanaf het begin om de eerste dag te vinden die hoger is dan (Start Factor x Gemiddelde)
- Vind Eindgrens: Scant vanaf het einde om de laatste dag te vinden die hoger is dan (End Factor x Gemiddelde)
- Pas Datumbereik Toe: Filtert om enkel casussen binnen de berekende datumbereiken te behouden
Output
Deze filter werkt op casusniveau gebaseerd op temporele grenzen:
- Berekent automatisch activiteitendrempels gebaseerd op gemiddelde dagelijkse gebeurtenissen
- Identificeert de eerste dag met "normale" activiteit aan het begin van de log
- Identificeert de laatste dag met "normale" activiteit aan het einde van de log
- Retourneert casussen die binnen de berekende periode van normale activiteit vallen
- Behoudt alle casus- en gebeurtenisattributen van de opgenomen casussen
- Factoren moeten tussen 0 en 1 liggen (exclusief)
Gebruik de Small Ends-filter om automatisch de grenzen van gebeurtenislogboeken op te schonen, zodat je analyse normale bedrijfsvoering weerspiegelt in plaats van implementatiefases, dataverzamelingsartefacten of seizoensgebonden afwijkingen.
Deze documentatie maakt deel uit van het mindzie Studio process mining platform.