Vind Datum Afwijkingen

Overzicht

De Find Date Outliers calculator identificeert datum- en tijdstempelwaarden in uw evenementenlogboek die buiten normale verwachte bereiken vallen, waardoor u kwaliteitsproblemen in de data kunt opsporen voordat ze uw procesanalyse beïnvloeden. Deze gespecialiseerde calculator voor datakwaliteit scant automatisch alle datum- en tijdstempelattributen in uw gehele evenementenlogboek om waarden te vinden die duidelijk ongeldig zijn, zoals data in het verre verleden, verre toekomst, of nulwaarden.

In tegenstelling tot handmatige databerekeningen, onderzoekt deze calculator systematisch elk datumveld in uw procesdata om potentiële problemen te markeren die uw process mining analyse kunnen vertekenen, zoals onjuiste activiteits-timestamps, verkeerd geïmporteerde data, of standaard tijdelijke waarden die nooit zijn bijgewerkt.

Veelvoorkomend Gebruik

  • Valideren van datakwaliteit na het importeren van evenementlogs uit legacy systemen of nieuwe databronnen
  • Detecteren van tijdelijke datumwaarden of standaardwaarden die onvolledige data-invoer aangeven
  • Identificeren van systeemklokfouten of problemen bij tijdzoneconversie die onmogelijke tijdstempels creëren
  • Opsporen van testdata-datums die per ongeluk in productielogs zijn beland
  • Controleren of tijdstempeldata binnen verwachte bedrijfsperioden valt
  • Snel een overzicht krijgen van de kwaliteit van alle datumvelden voordat gedetailleerde analyse plaatsvindt

Instellingen

Deze calculator vereist geen configuratie-instellingen. Hij onderzoekt automatisch alle datum- en tijdstempelattributen in uw evenementenlogboek en identificeert afwijkende waarden op basis van vooraf gedefinieerde regels over wat onrealistische of problematische data zijn.

Standaardvelden:

  • Titel: Optionele aangepaste titel voor de output van de calculator
  • Beschrijving: Optionele beschrijving voor documentatiedoeleinden

Detectieregels:

De calculator identificeert datumafwijkingen door te controleren op:

  • Data voor 1990: Waarden eerder dan 1 januari 1990 worden gemarkeerd als waarschijnlijk dat fouten of tijdelijke waarden
  • Data na 2040: Waarden na 1 januari 2040 worden beschouwd als onrealistisch voor huidige bedrijfsprocessen
  • Nul- of ontbrekende data: Ontbrekende, null, of nul tijdstempelwaarden die op onvolledige data wijzen
  • Ongeldige datumformaten: Verkeerd gevormde datumwaarden die niet juist geparsed kunnen worden

Voorbeelden

Voorbeeld 1: Validatie Legacy Systeem Migratie

Scenario: Uw organisatie is recent overgestapt op een modern platform voor factuurverwerking, vanuit een 20 jaar oud legacy ERP-systeem. Voordat u process mining analyse uitvoert, wilt u controleren of alle datumvelden correct zijn geconverteerd en dat er geen tijdelijke of standaarddatums in de dataset achter zijn gebleven.

Instellingen:

  • Titel: "Validatie Factuurdatamigratie"
  • Beschrijving: "Controle op datumconversieproblemen vanuit legacy systeem"

Output:

De calculator produceert een tabel die problematische datumwaarden toont, gegroepeerd per attribuut. Elke rij representeert een specifiek attribuut waar afwijkingen zijn gevonden:

Attribuutnaam Aantal Afwijkingen Voorbeeld van Afwijkende Waarde Issue Type
Invoice_Date 847 1900-01-01 Voor 1990
Payment_Due_Date 847 1900-01-01 Voor 1990
Last_Modified_Date 23 2099-12-31 Na 2040
Approval_Timestamp 156 NULL Nul/Null

Inzichten:

De output onthult significante datakwaliteitsproblemen door de migratie. De 847 facturen met datum 1 januari 1900 zijn duidelijk tijdelijke waarden uit het legacy systeem die niet correct zijn geconverteerd - deze datum werd vaak gebruikt als standaard "lege" waarde in oudere systemen. De 23 records met een 2099 datum op Last_Modified_Date suggereren testrecords die per ongeluk in productie terecht kwamen. De 156 null Approval_Timestamp waarden duiden op onvolledige records die belangrijke proces-tijdinformatie missen.

Voordat u procesanalyse uitvoert, dient u:

  1. Samenwerken met het datateam om de 847 records met tijdelijke datums te corrigeren of verwijderen
  2. De 23 testrecords met 2099 datums filteren
  3. Onderzoeken waarom 156 facturen geen goedkeurings-timestamps hebben

Deze validatie heeft u behoed voor verkeerde conclusies over factuurverwerkingstijden en goedkeuringspatronen op basis van corrupte datumdata.

Voorbeeld 2: Detecteren van Systeemklokproblemen

Scenario: Gebruikers hebben gerapporteerd dat sommige tijdstempels in uw orderverwerkingsproces "niet logisch" zijn, waarbij activiteiten in de verkeerde volgorde lijken te gebeuren. U vermoedt problemen met serverkloksynchronisatie of tijdzoneconversies die tijdstempels verstoren.

Instellingen:

  • Titel: "Validatie Tijdstempels Orderverwerking"
  • Beschrijving: "Identificeer problemen met kloksynchronisatie of tijdzone"

Output:

De calculator toont afwijkingen in de activiteitentijdstempelvelden:

Attribuutnaam Aantal Afwijkingen Voorbeeld van Afwijkende Waarde Issue Type
Activity_Timestamp 1,247 2043-08-15 14:23:00 Na 2040
Event_Start_Time 1,247 2043-08-15 14:23:00 Na 2040

Inzichten:

De 1.247 gebeurtenissen hebben tijdstempels in augustus 2043 - precies 20 jaar in de toekomst. Dit is een klassiek teken van een systeemklokfout op een van uw applicatieservers of een bug in tijdzoneconversie die decennia toevoegt in plaats van uren. Dat zowel Activity_Timestamp als Event_Start_Time identieke afwijkingen tonen bevestigt dat het dezelfde gebeurtenissen betreft die via meerdere velden worden geregistreerd.

Onderzoek toont aan dat een server van het magazijnbeheersysteem zijn klok verkeerd had ingesteld na een onderhoudsperiode, en alle gebeurtenissen die via deze server werden verwerkt gedurende een periode van 6 uur tijdstempels kregen die 20 jaar in de toekomst lagen. Deze 1.247 gebeurtenissen vertegenwoordigen kritische orderverwerkingsactiviteiten (picken, inpakken, verzenden) die gecorrigeerd moeten worden om correcte processtroomanalyses mogelijk te maken.

Zonder deze calculator zouden deze tijdstempelfouten uw proceskaarten volledig uit de volgorde hebben laten lopen, waardoor het onmogelijk was om nauwkeurig de orderverwerkingprestaties in de betreffende periode te analyseren.

Voorbeeld 3: Data Kwaliteitscontrole vóór Analyse

Scenario: U staat op het punt een uitgebreide process mining analyse uit te voeren van uw purchase-to-pay proces met drie jaar data. Als beste praktijk voert u eerst de Find Date Outliers calculator uit om ervoor te zorgen dat uw dataset schoon is voordat u tijd investeert in gedetailleerde analyse.

Instellingen:

  • Titel: "Purchase-to-Pay Kwaliteitsscan"
  • Beschrijving: "Validatiecontrole voorafgaand aan analyse"

Output:

De calculator toont een tabel waarin alle attributen geldige datumreeksen hebben zonder gevonden afwijkingen.

Resultaat: Geen afwijkingen gevonden in enige datumattributen.

Inzichten:

Dit is de best mogelijke uitkomst - een schoon rapport over uw datumdata. De calculator heeft alle tijdstempel- en datumvelden in uw gehele purchase-to-pay evenementlogboek van drie jaar onderzocht en geen waarden gevonden van voor 1990, na 2040 of met nul/null. Dit geeft u het vertrouwen dat u door kunt gaan met process mining analyse wetende dat:

  • Alle tijdstempels nauwkeurig weergeven wanneer activiteiten plaatsvonden
  • Geen tijdelijke datums uw tijdgebaseerde metrics vervormen
  • Geen testdata per ongeluk uw productiedataset hebben besmet
  • Systeemklokken gedurende de dataverzamelperiode goed gesynchroniseerd waren

U kunt nu vertrouwen op de temporele volgorde van activiteiten in proceskaarten, de nauwkeurigheid van duur-berekeningen, en de betrouwbaarheid van tijdgebaseerde inzichten. Deze upfront validatie bespaart u talloze uren aan foutopsporing van verwarrende resultaten veroorzaakt door corrupte datumdata.

Voorbeeld 4: Identificeren van Onvolledige Data-invoer

Scenario: Uw klantenservicesysteem voor tickets staat toe dat agents bepaalde datums handmatig invoeren, en u vermoedt dat veel tickets ontbrekende of onvolledige tijdstempelinformatie hebben die uw analyse van case oplossingtijd kan verstoren.

Instellingen:

  • Titel: "Controle volledigheid supportticketdata"
  • Beschrijving: "Identificeer tickets met ontbrekende datumgegevens"

Output:

Attribuutnaam Aantal Afwijkingen Voorbeeld van Afwijkende Waarde Issue Type
First_Response_Date 3,456 NULL Nul/Null
Resolution_Date 892 NULL Nul/Null
Escalation_Date 12,034 NULL Nul/Null
Follow_Up_Date 8,721 1970-01-01 Voor 1990

Inzichten:

De analyse onthult significante datalekken. Het hoge aantal null-waarden wijst erop dat agents kritieke datums niet consequent registreren:

  • 3.456 tickets zonder First_Response_Date: Deze cases kunnen niet worden meegenomen in analyses van reactietijden conform SLA
  • 892 tickets zonder Resolution_Date: Het is onmogelijk oplossingtijd te berekenen voor deze cases
  • 12.034 tickets zonder Escalation_Date: Dit is acceptabel - de meeste tickets worden niet geëscaleerd, dus null is hier verwacht
  • 8.721 tickets met 1970-01-01 als Follow_Up_Date: Deze Unix-epochdatum (1 januari 1970) is een klassieke standaardwaarde, die aangeeft dat het veld nooit juist is ingevuld

Het meest zorgwekkend zijn de 3.456 tickets zonder eerste reactiedatum, dit is 15% van uw ticketvolume en beïnvloedt direct uw vermogen om klantresponsiviteit te meten. U dient:

  1. Uw ticketsysteem bij te werken om First_Response_Date een verplicht veld te maken
  2. Agents te trainen over het belang van volledige datumregistratie
  3. Geautomatiseerde tijdregistratie te overwegen in plaats van handmatige invoer waar mogelijk
  4. De 892 onopgeloste tickets uit te sluiten bij analyse van afgeronde cases

Deze validatie heeft u geholpen te begrijpen dat uw oplossingsmetrics onderschat waren omdat tickets met ontbrekende data werden uitgesloten, wat het management een onterecht optimistisch beeld van de prestaties van het supportteam gaf.

Output

De calculator genereert een datatabel die alle datum- en tijdstempelattributen met afwijkende waarden opsomt. De tabel is bedoeld om u snel te helpen datakwaliteitsproblemen te identificeren en prioriteren:

Attribuutnaam (Tekst): De naam van het case- of gebeurtenisattribuutveld dat datumafwijkingen bevat. Hiermee kunt u precies zien welke velden problemen hebben.

Aantal Afwijkingen (Nummer): Het aantal cases of gebeurtenissen die problematische datumwaarden hebben in dit attribuut. Hogere aantallen wijzen op ernstigere datakwaliteitsproblemen die dringend aandacht vereisen.

Voorbeeld Afwijkende Waarde (DatumTijd): Een voorbeeld van een problematische datumwaarde gevonden in het attribuut, om u te helpen de aard van het probleem te begrijpen (bijv. "1900-01-01" duidt op tijdelijke datums, terwijl "2050-01-15" wijst op klokfouten).

Issue Type (Categorie): Het type afwijking dat is gedetecteerd - "Voor 1990", "Na 2040", of "Nul/Null" - wat helpt te begrijpen of het gaat om tijdelijke datums, toekomstige datums of ontbrekende waarden.

Interactieve Analyse:

De outputtabel is volledig interactief - u kunt:

  • Op elke rij klikken om in te zoomen op specifieke cases met die afwijkende waarden
  • Sorteren op Aantal Afwijkingen om prioriteit te geven aan welke attributen eerst moeten worden gecorrigeerd
  • Resultaten filteren om te focussen op specifieke soorten problemen
  • De lijst met afwijkingen exporteren om te delen met teams datakwaliteit

Best Practices:

  • Voer deze calculator als eerste stap uit in elk nieuw process mining project
  • Voer opnieuw uit na data-imports of systeemmigraties
  • Los afwijkingen op voordat u proceskaarten maakt of prestatie-indicatoren berekent
  • Gebruik de calculator regelmatig op doorlopende datafeeds om kwaliteitsverslechtering vroeg te detecteren

Opmerking: De calculator onderzoekt alleen attributen met datum- of tijdstempeldatatype. Tekstvelden die datums bevatten worden niet geanalyseerd. Indien geen afwijkingen worden gevonden, toont de calculator "No date outliers detected" - dit duidt op uitstekende datakwaliteit.


Deze documentatie maakt deel uit van het mindzie Studio process mining platform.