Gegevens verwijderen uit onderactieve periodes

Overzicht

De filter Gegevens verwijderen uit onderactieve periodes trimt automatisch het begin en einde van je proceslog door periodes met weinig activiteit te identificeren en te verwijderen. Deze intelligente case-level filter berekent dagelijkse gebeurtenisfrequenties, bepaalt gemiddelde activiteitsniveaus en verwijdert cases die in "opwarm-" of "afrondings"periodes vallen waarin het aantal gebeurtenissen onder je opgegeven drempels ligt. Het is bijzonder nuttig om opstart- en afsluitperiodes te elimineren bij het analyseren van processen in een stabiele toestand.

Veelvoorkomende toepassingen

  • Verwijderen van systeemopwarmperiodes aan het begin van proceslogs
  • Elimineren van afrondingsperiodes aan het einde van dataverzameling
  • Analyse richten op stabiele operaties exclusief opstartfasen
  • Logs opschonen van pilotprogramma's vóór volledige uitrol
  • Verwijderen van periodes met weinig activiteit tijdens systeemmigraties of overgangen
  • Trimmen van dataverzamelingsperioden die geen normale operaties representeren

Instellingen

Start Factor: Een vermenigvuldiger die wordt toegepast op het gemiddelde dagelijkse aantal gebeurtenissen om de drempel voor de eerste dag die moet worden opgenomen te bepalen. Dagen worden opgenomen zodra de dagelijkse activiteit hoger is dan StartFactor keer het gemiddelde.

End Factor: Een vermenigvuldiger die wordt toegepast op het gemiddelde dagelijkse aantal gebeurtenissen om de drempel voor de laatste dag die moet worden opgenomen te bepalen. Dagen worden opgenomen zolang de dagelijkse activiteit hoger is dan EndFactor keer het gemiddelde.

Instelling Doel Typische waarden Effect
Start Factor Bepaalt hoe agressief het begin wordt getrimd 0.1 - 0.5 Lager = milder, Hoger = agressiever trimmen
End Factor Bepaalt hoe agressief het einde wordt getrimd 0.1 - 0.5 Lager = milder, Hoger = agressiever trimmen

Werking:

  1. Berekent het aantal gebeurtenissen per dag over de hele log
  2. Berekent het gemiddelde dagelijkse aantal gebeurtenissen
  3. Vindt de eerste dag waarop activiteit groter is dan (Start Factor x Gemiddelde)
  4. Vindt de laatste dag waarop activiteit groter is dan (End Factor x Gemiddelde)
  5. Verwijdert alle cases die buiten dit datumbereik vallen

Voorbeelden

Voorbeeld 1: Verwijderen van systeemlanceringsperiode

Scenario: Je nieuwe ordermanagementsysteem werd gelanceerd op 1 januari, maar alleen enkele pilootgebruikers waren actief in de eerste twee weken terwijl het systeem werd gevalideerd. Je wilt deze periode met lage activiteit verwijderen en de analyse richten op normale operaties die vanaf half januari begonnen.

Instellingen:

  • Start Factor: 0.3
  • End Factor: 0.1

Resultaat:

De filter berekent dat het gemiddelde aantal dagelijkse gebeurtenissen 500 is. Met Start Factor = 0.3 zoekt hij de eerste dag met minstens 150 gebeurtenissen (30% van gemiddeld). Dagen begin januari met slechts 20-80 gebeurtenissen worden uitgesloten. De analyse begint op 14 januari wanneer de activiteit 150+ gebeurtenissen bereikte. Het trimmen aan het einde is minimaal met End Factor = 0.1, en verwijdert alleen de allerlaatste dagen als de activiteit onder de 50 gebeurtenissen per dag daalde.

Inzichten: Dit verwijdert de pilotfase uit je analyse, zodat je statistieken de daadwerkelijke operationele prestaties weergeven en niet de vroege testfase. Je cyclustijden, variantfrequenties en bottleneckanalyse vertegenwoordigen nu werkelijke stabiele operaties na volledige adoptie van het systeem.

Voorbeeld 2: Opschonen van eindejaarsdataverzameling

Scenario: Je dataverzameling eindigde op 31 december, maar de activiteit nam natuurlijk af in eind december omdat het personeel vakantie nam. Ook was er een trage start in begin januari bij het optuigen van operaties. Je wilt alleen de kernoperatieperiode met normale bezetting analyseren.

Instellingen:

  • Start Factor: 0.2
  • End Factor: 0.2

Resultaat:

Met evenwichtige start- en eindfactoren trimt de filter beide periodes met lage activiteit. Als het gemiddelde dagelijkse aantal gebeurtenissen 800 was, worden dagen met minder dan 160 gebeurtenissen aan beide kanten uitgesloten. De vertraging tijdens de feestdagen in eind december (misschien 50-100 evenementen per dag) wordt verwijderd, net als de trage opschaling in januari, waardoor alleen gelegenheden met volledige bezetting overblijven voor analyse.

Inzichten: Jouw analyse weerspiegelt nu de normale operationele capaciteit zonder seizoensgebonden afwijkingen. Statistieken zoals gemiddelde case-duur en resourcegebruik staan voor typische prestaties en worden niet vertekend door de feestdagen met minimale bezetting.

Voorbeeld 3: Analyseren van volwassen systeemoperaties

Scenario: Je analyseert een systeem dat al jaren in productie is, maar je wilt de laatste paar dagen uitsluiten die onvolledige data of lopende cases kunnen bevatten. Je wilt agressief trimmen aan het begin maar voorzichtig aan het einde.

Instellingen:

  • Start Factor: 0.5
  • End Factor: 0.1

Resultaat:

Met Start Factor = 0.5 worden alleen dagen opgenomen die ten minste 50% van de gemiddelde activiteit bereiken vanaf het begin, waardoor trage periodes stevig worden gekapt. Met End Factor = 0.1 blijven bijna alle recente dagen behouden zolang zij ten minste 10% van de gemiddelde activiteit hebben. Dit levert een volwassen operationele periode op zonder recente data te veel te verwijderen.

Inzichten: Het agressieve trimmen aan het begin zorgt ervoor dat je een volledig volwassen systeem analyseert, terwijl het milde trimmen aan het einde recente data voor trendanalyse behoudt. Deze balans is ideaal als je jaren aan historische data hebt en je wilt richten op recente stabiele operaties.

Voorbeeld 4: Conservatief trimmen voor volledige analyse

Scenario: Je wilt zoveel mogelijk data behouden en alleen de meest extreem lage activiteitperiodes aan het begin en einde van je log verwijderen. Je analyseert een proces met van nature variabele activiteitsniveaus en wil geen geldige operationele data verliezen.

Instellingen:

  • Start Factor: 0.1
  • End Factor: 0.1

Resultaat:

Met beide factoren op 0.1 worden alleen dagen uitgesloten met minder dan 10% van het gemiddelde dagelijkse aantal gebeurtenissen. Als het gemiddelde 1000 gebeurtenissen per dag is, worden alleen dagen met minder dan 100 gebeurtenissen getrimd. Deze conservatieve aanpak verwijdert alleen de meest opvallende opstart- en afrondingsperiodes en behoudt alle normale operationele periodes, ook die met lagere activiteit.

Inzichten: Dit minimale trimmen zorgt ervoor dat je geen waardevolle data kwijtraakt uit van nature rustigere periodes zoals weekenden of feestdagen die nog steeds legitieme operationele tijd zijn. Gebruik dit wanneer je proces sterk variabel is of wanneer je een zo volledig mogelijke historische dekking nodig hebt.

Output

Deze filter werkt op case-niveau en gebruikt datumbasis filtering:

  • Berekent automatisch optimale start- en einddatums op basis van activiteitsdrempels
  • Verwijdert volledige cases die buiten het berekende datumbereik vallen
  • Behoudt alle cases binnen de actieve periode onveranderd
  • Wijzigt geen gebeurtenisdata, filtert alleen cases op datum
  • Retourneert originele data als de activiteitsberekening niet mogelijk is

De resulterende dataset concentreert zich op stabiele operaties en sluit periodes met lage activiteit bij opstart en afsluiting uit die je procesmininganalyse kunnen vertekenen.


Deze documentatie maakt deel uit van het mindzie Studio process mining platform.