Verberg Lege Attributen
Overzicht
De Hide Blank Attributes-verrijking is een automatische data cleanup-operator die alle attributen (kolommen) identificeert en verwijdert die geen data bevatten in de gehele dataset. Deze krachtige cleanup-tool scant zowel case-level als event-level attributen en verbergt automatisch alle kolommen waarin elke rij null- of lege waarden bevat. Door het verwijderen van deze lege kolommen vereenvoudigt de verrijking aanzienlijk het overzicht van de dataset, vermindert visuele rommel in analysetools en verbetert de prestaties bij het werken met grote datasets.
Deze verrijking is vooral waardevol bij het importeren van data uit enterprise-systemen die vaste schema’s exporteren met veel optionele velden, of bij het werken met datasets die meerdere transformaties hebben ondergaan waarbij sommige attributen overbodig worden. In tegenstelling tot handmatig kolom verwijderen, waarbij elke lege kolom afzonderlijk moet worden geïdentificeerd, voert deze verrijking een uitgebreide controle uit over de hele dataset in één enkele bewerking. De verrijking behoudt alle kolommen die ten minste één niet-null waarde bevatten, waardoor er geen potentiële bruikbare data verloren gaat en de netheid en bruikbaarheid van je process mining-werkruimte wordt gemaximaliseerd.
Veelvoorkomende Toepassingen
- Het opschonen van geïmporteerde datasets uit ERP-systemen die honderden optionele velden bevatten zonder gevulde data
- Het vereenvoudigen van datasetweergaven na filteroperaties die bepaalde attributen volledig leeg kunnen achterlaten
- Het verminderen van visuele rommel in de case- en event-attribuutpanelen om te focussen op betekenisvolle data
- Het verbeteren van prestaties en verminderen van geheugengebruik bij het werken met brede datasets met veel ongebruikte kolommen
- Het voorbereiden van datasets voor export of delen door irrelevante lege kolommen te verwijderen
- Het opruimen na datatransformaties die meerdere attributen consolideren in nieuwe berekende velden
- Het stroomlijnen van conformance checks door attributen te verwijderen die geen analytische waarde bieden
Instellingen
Deze verrijking werkt automatisch zonder dat er configuratie nodig is. Hij scant alle niet-berekende en niet-verborgen attributen in je dataset en verwijdert alleen die kolommen die volledig leeg zijn over alle cases en events.
Voorbeelden
Voorbeeld 1: Opschonen van ERP-systeemexport
Scenario: Een productiebedrijf exporteert orderverwerkingsdata uit SAP met meer dan 200 standaardvelden, maar hun specifieke implementatie gebruikt slechts ongeveer 60 velden, waardoor meer dan 140 kolommen volledig leeg zijn en analyse bemoeilijkt wordt.
Voor de Verrijking: Dataset bevat 215 attributen in totaal, waaronder:
- Case-attributen: 125 kolommen (75 leeg)
- Event-attributen: 90 kolommen (65 leeg)
- Voorbeelden van lege kolommen: Legacy_System_ID, Deprecated_Cost_Center, Old_Warehouse_Code, Custom_Field_1 tot en met Custom_Field_50
Na de Verrijking: Dataset vereenvoudigd tot 75 betekenisvolle attributen:
- Case-attributen: 50 kolommen (allemaal gevuld)
- Event-attributen: 25 kolommen (allemaal gevuld)
- Alle lege kolommen automatisch verborgen
Uitvoer: De verrijking verwijderde 140 lege kolommen terwijl alle 75 kolommen die minstens één waarde bevatten behouden werden. De datasetweergave richt zich nu alleen op attributen met daadwerkelijke data, wat navigatie en analyse aanzienlijk vergemakkelijkt.
Inzichten: Na opschoning konden analisten snel de relevante attributen voor process mining identificeren. De vereenvoudigde weergave toonde dat orderverwerking feitelijk maar 12 kernattributen voor besluitvorming betrof, die eerder verborgen zaten tussen honderden lege velden. De prestatie verbeterde met 40% bij het laden van de dataset door verminderd geheugenverbruik.
Voorbeeld 2: Opruiming na filteren in de gezondheidszorg
Scenario: Een ziekenhuis filtert hun patiëntbehandelingsdataset om alleen spoedeisende hulpgevallen te analyseren. Dit veroorzaakt dat veel gespecialiseerde afdeling-attributen volledig leeg worden omdat spoedeisende gevallen die data niet gebruiken.
Voor de Verrijking: Na filteren op alleen spoedeisende gevallen:
- Totaal attributen: 180
- Gevulde attributen: Emergency_Triage_Level, Emergency_Wait_Time, Emergency_Treatment
- Lege attributen: ICU_Ventilator_Settings, Surgery_Type, Rehabilitation_Plan, Oncology_Stage en 85 andere gespecialiseerde afdelingsvelden
Na de Verrijking:
- Totaal zichtbare attributen: 92
- Alle attributen bevatten nu relevante data voor de spoedeisende hulp
- 88 lege gespecialiseerde afdelingsattributen verborgen
Uitvoer: De verrijking identificeerde en verstopte automatisch alle attributen die leeg waren na het toepassen van het filter voor spoedeisende hulp. De resterende attributen bevatten allemaal data relevant voor deze gevallen.
Inzichten: De opgeschoonde dataset stelde de managers van de spoedeisende hulp in staat zich te richten op hun specifieke KPI’s zonder afleiding van irrelevante velden. Analysetijd nam af met 60% omdat personeel niet meer door lege kolommen hoefde te scrollen om relevante data te vinden.
Voorbeeld 3: Financiële procesconsolidatie
Scenario: Een bank voegt factuurverwerkingsdata samen uit drie verschillende systemen, elk met unieke veldstructuren, waardoor veel systeem-specifieke attributen leeg zijn voor cases uit andere systemen.
Voor de Verrijking: Samengevoegde dataset met 340 attributen:
- Gemeenschappelijke velden (door alle systemen gebruikt): 45 attributen
- Systeem A-specifieke velden: 95 attributen (leeg voor systeem B en C)
- Systeem B-specifieke velden: 110 attributen (leeg voor systeem A en C)
- Systeem C-specifieke velden: 90 attributen (leeg voor systeem A en B)
Na de Verrijking: Gefocuste dataset met 45 zichtbare gemeenschappelijke attributen, plus alleen de systeem-specifieke attributen die data bevatten voor de huidige caseselectie.
Uitvoer: De verrijking verwijderde alle kolommen die volledig leeg waren, waardoor alleen de 45 gemeenschappelijke velden overbleven die door alle drie systemen werden gevuld. Systeem-specifieke attributen die over de gehele samengevoegde dataset leeg waren, werden automatisch verborgen.
Inzichten: De consolidatie toonde aan dat ondanks verschillende systeemstructuren, alle drie de systemen dezelfde 45 kernprocesattributen vastlegden. Deze ontdekking stelde de bank in staat hun factuurverwerking te standaardiseren en de complexiteit met 85% te verminderen.
Voorbeeld 4: Voorbereiding inkoopdata
Scenario: De inkoopdataset van een retailbedrijf bevat attributen voor diverse goedkeuringsniveaus en speciale verwerkingscodes, maar veel van deze velden worden alleen gebruikt voor dure of gereguleerde artikelen, en zijn leeg voor routineaankopen.
Voor de Verrijking: Dataset met 150 attributen waaronder:
- Standaardvelden: PO_Number, Supplier, Amount, Create_Date (altijd gevuld)
- Voorwaardelijke velden: VP_Approval, Legal_Review, Hazmat_Code, Export_License, Compliance_Check (95% leeg)
- Legacy velden: Old_Vendor_Code, Previous_System_Ref (100% leeg na migratie)
Na de Verrijking: Gestroomlijnde dataset met 67 actieve attributen:
- Alle standaard inkoopvelden behouden
- Voorwaardelijke velden met ten minste één waarde behouden
- Volledig lege legacyvelden verwijderd
Uitvoer: De verrijking verstopte 83 attributen zonder data, inclusief alle legacyvelden en conditional approval-velden die nooit gebruikt werden in de lopende dataset. De overgebleven attributen dragen allemaal bij aan procesanalyse.
Inzichten: Na opschonen ontdekte het inkoopteam dat slechts 5% van de aankopen daadwerkelijk speciale goedkeuringen vereiste, waardoor zij het proces konden stroomlijnen voor 95% van de routineaankopen. De vereenvoudigde weergave maakte het gemakkelijk om deze hoge-complexiteitsgevallen te identificeren voor aparte analyse.
Voorbeeld 5: Kwaliteitscontrole in de productie
Scenario: Een fabrikant van auto-onderdelen exporteert kwaliteitscontroledataset met honderden meetvelden, maar elke productielijn gebruikt alleen specifieke metingen die relevant zijn voor hun onderdelen, waardoor veel velden leeg blijven.
Voor de Verrijking: Kwaliteitsdataset met 450 attributen:
- Gemeenschappelijke velden: Part_Number, Production_Line, Timestamp, Pass_Fail (altijd gevuld)
- Lijn-specifieke metingen: 200+ meetvelden per lijn (leeg voor andere lijnen)
- Verouderde metingen: 50+ oude kwaliteitsmetingen niet langer verzameld
Na de Verrijking: Relevante dataset met 125 attributen:
- Alle gemeenschappelijke velden behouden
- Alleen metingen met data behouden
- Alle verouderde en ongebruikte meetvelden verborgen
Uitvoer: De verrijking verwijderde 325 lege meetkolommen terwijl de 125 kolommen met daadwerkelijke kwaliteitsdata behouden bleven. Elke productielijn toont nu alleen relevante metingen.
Inzichten: De opschoning toonde aan dat ondanks 450 mogelijke metingen, elke productielijn slechts 20-30 kritieke kwaliteitsmetingen actief bewaakte. Dit inzicht leidde tot een gericht kwaliteitsverbeteringsprogramma dat het aantal defecten met 15% verlaagde door te focussen op de tussentijdse metingen die daadwerkelijk belangrijk waren.
Uitvoer
De Hide Blank Attributes-verrijking wijzigt de zichtbaarheid van bestaande kolommen zonder data te verwijderen:
Verborgen Kolommen:
- Case-attributen waarbij elke case-rij null/lege waarden bevat
- Event-attributen waarbij elke event-rij null/lege waarden bevat
- Kolommen worden als verborgen gemarkeerd, maar niet verwijderd uit de dataset
- Verbergen kan worden teruggedraaid via kolombeheer indien nodig
Behoudende Kolommen:
- Alle kolommen die minstens één niet-null waarde bevatten
- Alle berekende kolommen (gemaakt door andere verrijkingen)
- Alle kolommen die al als verborgen zijn gemarkeerd (geen dubbele bewerking)
- Systeemkolommen zoals Case ID en Activiteitennamen
Prestatie-impact:
- Minder geheugengebruik bij het laden van datasets
- Snellere weergave van attributenlijsten en filters
- Betere queryprestaties op vereenvoudigde kolomsets
- Schonere exportbestanden bij delen van datasets
De effecten van de verrijking zijn direct zichtbaar in de case- en event-attribuutpanelen, waar lege kolommen niet langer verschijnen. Dit creëert een gefocuste, efficiënte werkruimte voor procesanalyse.
Zie Ook
- Anonimiseren - Verberg gevoelige gegevens en behoud de processtructuur
- Tekst Trimmen - Verwijder witruimte uit tekstattributen
- Tekst Begin - Extraheer beginstukjes van tekstattributen
- Tekst Eind - Extraheer eindstukjes van tekstattributen
- Groeperen Attribuutwaarden - Consolideer vergelijkbare attribuutwaarden
Deze documentatie maakt deel uit van het mindzie Studio process mining platform.