Converteren naar Case-attributen
Overzicht
De Convert to Case Attributes verrijking is een intelligente data-optimalisatie-operator die automatisch event-niveau attributen identificeert en converteert naar case-niveau attributen wanneer hun waarden constant blijven gedurende elke case. Deze krachtige opschoningsfunctie analyseert uw volledige dataset om event-attributen te vinden die binnen een case nooit veranderen - zoals klant-ID’s, productcategorieën of regiocodes die onnodig op eventniveau worden herhaald - en verhoogt deze naar case-attributen voor verbeterde prestaties en schonere datamodellen.
Deze verrijking lost een veelvoorkomend datakwaliteitsprobleem op in process mining waarbij bronsystemen overbodige data op eventniveau exporteren, wat leidt tot opgeblazen datasets en complexere analyses. Door deze stabiele attributen automatisch te detecteren en naar het case-niveau te converteren, vermindert de verrijking dataredundantie, verbetert de query-prestaties en creëert een logischere datastructuur. Het conversieproces is volledig automatisch en vereist geen configuratie, waardoor het een essentiële eerste stap is in datapreparatie die datasetgrootte aanzienlijk kan verkleinen terwijl alle informatie intact blijft.
Veelvoorkomende toepassingen
- Optimaliseer geïmporteerde ERP-gegevens waar klantinformatie bij elk event wordt herhaald maar binnen een order nooit verandert
- Converteer statische productattributen zoals categorie, familie of type van event- naar case-niveau in productieprocessen
- Verhoog vaste projectattributen zoals projectmanager, budget of afdeling in projectmanagementdatasets
- Verplaats constante patiëntdemografieën zoals leeftijdsgroep, verzekeringssoort of opname-type naar case-niveau in zorgdata
- Converteer stabiele financiële attributen zoals leningstype, rentepercentage of filiaalcode in bankprocesdata
- Ruim inkoopdata op door leveranciersinformatie, contractnummers en betalingsvoorwaarden naar case-niveau te verplaatsen
- Optimaliseer logistieke data door eigenschappen van zendingen zoals bestemmingsland, serviceniveau of vervoerder naar case-attributen te converteren
Instellingen
Deze verrijking werkt automatisch zonder dat enige configuratie vereist is. Hij analyseert alle event-attributen in uw dataset en bepaalt intelligent welke veilig kunnen worden geconverteerd naar case-attributen op basis van waarde-consistentie binnen elke case.
Voorbeelden
Voorbeeld 1: Optimalisatie van orderverwerkingsdata
Scenario: Het orderverwerkingssysteem van een e-commercebedrijf exporteert data waarbij klantinformatie, verzendgegevens en orderkenmerken onnodig in elk event worden herhaald, waardoor de dataset 60% groter is dan nodig.
Eventgegevens vóór verrijking: | Case ID | Activiteit | Customer_Name | Customer_Region | Order_Priority | Product_Category | Timestamp | |---------|------------|---------------|-----------------|----------------|------------------|-----------| | ORD-001 | Create Order | John Smith | North America | High | Electronics | 2024-01-10 08:00 | | ORD-001 | Verify Payment | John Smith | North America | High | Electronics | 2024-01-10 08:15 | | ORD-001 | Pick Items | John Smith | North America | High | Electronics | 2024-01-10 09:00 | | ORD-001 | Ship Order | John Smith | North America | High | Electronics | 2024-01-10 14:00 | | ORD-002 | Create Order | Jane Doe | Europe | Normal | Clothing | 2024-01-10 08:30 | | ORD-002 | Verify Payment | Jane Doe | Europe | Normal | Clothing | 2024-01-10 08:45 |
Case-attributen na verrijking: | Case ID | Customer_Name | Customer_Region | Order_Priority | Product_Category | |---------|---------------|-----------------|----------------|------------------| | ORD-001 | John Smith | North America | High | Electronics | | ORD-002 | Jane Doe | Europe | Normal | Clothing |
Eventgegevens na verrijking: | Case ID | Activiteit | Timestamp | |---------|------------|-----------| | ORD-001 | Create Order | 2024-01-10 08:00 | | ORD-001 | Verify Payment | 2024-01-10 08:15 | | ORD-001 | Pick Items | 2024-01-10 09:00 | | ORD-001 | Ship Order | 2024-01-10 14:00 | | ORD-002 | Create Order | 2024-01-10 08:30 | | ORD-002 | Verify Payment | 2024-01-10 08:45 |
Uitkomst: De verrijking ontdekte dat Customer_Name, Customer_Region, Order_Priority en Product_Category binnen elke case nooit veranderen en heeft deze automatisch geconverteerd naar case-attributen. De eventtabel is nu 60% kleiner en bevat alleen de essentiële eventspecifieke informatie.
Inzichten: Na conversie draaien dashboardqueries 3x sneller dankzij het verminderde datavolume. Filters op case-niveau voor klantsegmenten en productcategorieën zijn intuïtiever, en het datamodel onderscheidt duidelijk tussen case-eigenschappen en eventdetails, wat het voor analisten eenvoudiger maakt om met de data te werken.
Voorbeeld 2: Optimalisatie van de patiëntreis in de gezondheidszorg
Scenario: Het patiëntbeheersysteem van een ziekenhuis exporteert opnamedata waarbij patiëntdemografieën, verzekeringsinformatie en medische classificaties in elk behandel-event worden herhaald, wat de dataset onnodig complex maakt en de analyse vertraagt.
Eventgegevens vóór verrijking: | Case ID | Activiteit | Patient_Age_Group | Insurance_Type | Admission_Type | Department | Diagnosis_Code | Resource | |---------|------------|-------------------|----------------|----------------|------------|----------------|----------| | PAT-501 | Registration | 45-60 | Private | Emergency | ER | CARD-01 | Nurse Smith | | PAT-501 | Triage | 45-60 | Private | Emergency | ER | CARD-01 | Dr. Jones | | PAT-501 | Treatment | 45-60 | Private | Emergency | ER | CARD-01 | Dr. Jones | | PAT-501 | Discharge | 45-60 | Private | Emergency | ER | CARD-01 | Nurse Brown |
Na verrijking:
Case-attributen: | Case ID | Patient_Age_Group | Insurance_Type | Admission_Type | Diagnosis_Code | |---------|-------------------|----------------|----------------|----------------| | PAT-501 | 45-60 | Private | Emergency | CARD-01 |
Event-attributen (variabele waarden blijven): | Case ID | Activiteit | Department | Resource | |---------|------------|------------|----------| | PAT-501 | Registration | ER | Nurse Smith | | PAT-501 | Triage | ER | Dr. Jones | | PAT-501 | Treatment | ER | Dr. Jones | | PAT-501 | Discharge | ER | Nurse Brown |
Uitkomst: Patiëntdemografieën en vaste medische informatie zijn naar case-niveau verplaatst, terwijl Department en Resource event-attributen blijven omdat deze kunnen variëren (patiënten kunnen van afdeling wisselen). De dataset is nu 40% kleiner en logisch gestructureerd.
Inzichten: De geoptimaliseerde datastructuur maakt snellere patiëntcohortanalyse mogelijk, waarbij filters op verzekeringssoort en leeftijdsgroep direct op case-niveau werken. Proces mining op basis van diagnoses is efficiënter, en het ziekenhuis kan snel behandelpatronen voor specifieke patiëntsegmenten identificeren zonder overbodige eventdata te verwerken.
Voorbeeld 3: Opschoning van productieprocesdata
Scenario: Het MES-systeem van een productiebedrijf exporteert productiedata waarbij productspecificaties, orderdetails en kwaliteitsnormen in elke productiestap worden gedupliceerd, wat tot prestatieproblemen bij procesanalyses leidt.
Voor verrijking: Elke productie-event bevat: Product_ID, Product_Type, Material_Grade, Quality_Standard, Customer_Code, Order_Size, Target_Date
Na verrijking:
- Geconverteerd naar Case-attributen: Product_ID, Product_Type, Material_Grade, Quality_Standard, Customer_Code, Order_Size, Target_Date (allen constant binnen elke productie-run)
- Blijvende event-attributen: Activity, Timestamp, Machine_ID, Operator, Temperature, Pressure (variabele waarden)
Uitkomst: Zeven attributen die binnen een productie-run nooit veranderen zijn automatisch naar case-niveau verheven. De eventtabel richt zich nu uitsluitend op uitvoeringsdetails die per activiteit variëren.
Inzichten: De conversie verminderde de datasetgrootte met 65%, waardoor realtime procesmonitoring mogelijk werd die eerder onmogelijk was vanwege het datavolume. Kwaliteitsanalyse per producttype en materiaalsoort is nu eenvoudig met case-niveau filters en de fabriek kan KPI’s efficiënt volgen over verschillende productcategorieën.
Voorbeeld 4: Vereenvoudiging van financiële leningsverwerking
Scenario: Het leningsverwerkingssysteem van een bank exporteert applicatiedata waarbij leenparameters, klantprofielen en regelgevingclassificaties in elke workflowstap worden herhaald, wat compliancerapportage en procesoptimalisatie bemoeilijkt.
Sample eventdata (voor): Elk event bevat: Loan_Type, Interest_Rate, Loan_Amount, Credit_Score_Range, Branch, Region, Product_Code, Regulatory_Class, Customer_Segment
Na verrijking:
- Case-niveau: Alle leenparameters en klantclassificaties (9 attributen) verplaatst naar casetabel
- Event-niveau: Alleen Activity, Timestamp, Approver, Decision en Comments blijven
Uitkomst: De verrijking ontdekte dat leenparameters en klantinformatie tijdens het aanvraagproces nooit veranderen en converteerde ze naar case-attributen. De eventtabel is gereduceerd tot de essentiële workflowinformatie.
Inzichten: Classificaties en compliancerapportages die eerder uren duurden, draaien nu binnen enkele minuten. De bank kan onmiddellijk goedkeuringspatronen analyseren per kredietscores en leningstype via case-niveau data, en proces mining onthult knelpunten in specifieke klantsegmenten zonder overbodige eventdata.
Voorbeeld 5: Optimalisatie van supply chain data
Scenario: Het trackingsysteem van een logistiek bedrijf registreert zendingdetails bij elk scanpunt, waarbij vaste zendingseigenschappen zoals serviceniveau, bestemming, gewichtsklasse en klantaccount miljoenen keren worden herhaald in tracking-events.
Voor verrijking: 500.000 zendingen × 15 scanpunten × 8 statische attributen = 60 miljoen redundante datapoints
Na verrijking:
- Case-attributen: Service_Level, Origin_Country, Destination_Country, Weight_Class, Customer_Account, Declared_Value, Shipment_Type, Contract_ID
- Event-attributen: Activity (Scan Location), Timestamp, Scanner_ID, Location_Code, Exception_Flag
Uitkomst: Acht zendingseigenschappen zijn naar case-niveau geconverteerd en worden slechts één keer per zending opgeslagen in plaats van bij elke scan herhaald. De eventtabel is met 70% verkleind en bevat alleen dynamische trackinginformatie.
Inzichten: Routeanalyse per bestemming en serviceniveau is nu 10x sneller met case-niveau queries. Het bedrijf kan efficiënt leveringspatronen per klantsegment identificeren en routes optimaliseren op basis van zendingseigenschappen zonder massale hoeveelheden dubbelle data te verwerken. Realtime trackingprestaties zijn sterk verbeterd, waardoor live dashboardupdates mogelijk zijn die eerder onmogelijk waren.
Output
De Convert to Case Attributes verrijking wijzigt de datastructuur door attribuutwaarden op intelligente wijze van eventniveau naar case-niveau te verplaatsen. De verrijking voert een uitgebreide analyse uit om event-attributen te identificeren waarvan de waarden nooit veranderen binnen elke case, en converteert deze automatisch tot case-attributen voor optimale dataorganisatie.
Conversieproces:
- Analyseert alle event-niveau datakolommen behalve systeemkolommen (Activity, Timestamp, Resource)
- Controleert per attribuut of waarden binnen elke case constant blijven in de dataset
- Converteert alleen attributen met identieke waarden over alle events binnen elke case
- Behoudt originele attribuutnamen en datatypes tijdens conversie
- Waarborgt dataintegriteit door gebruik van de laatste niet-NULL waarde indien aanwezig
Attributen die worden geconverteerd:
- Event-attributen met constante waarden binnen elke case (klant-ID’s, productcodes, categorieën)
- Statische eigenschappen die onnodig herhaald worden op eventniveau (regio’s, types, classificaties)
- Referentiegegevens die logisch thuishoren op case-niveau (contractnummers, projectcodes, ordereigenschappen)
Attributen die op eventniveau blijven:
- Systeemkolommen (Activity, Timestamp, Start Time, Resource, Expected Order)
- Attributen met variërende waarden binnen cases (verschillende resources, veranderende statussen, metingen)
- Verborgen systeemattributen die niet gemodificeerd mogen worden
- Attributen die al bestaan op case-niveau met dezelfde naam
Impact op uw dataset: De verrijking creëert een schonere, efficiëntere datastructuur waarin elke informatiecomponent op zijn logische niveau staat. Case-niveau filtering en aggregatie worden intuïtiever doordat case-eigenschappen goed georganiseerd zijn. Query-prestaties verbeteren aanzienlijk dankzij verminderde dataredundantie, en datasetgrootte neemt doorgaans met 30-70% af afhankelijk van hoeveelheid redundante eventdata.
De geconverteerde attributen integreren naadloos met alle mindzieStudio functies. Filters kunnen case-attributen efficiënt bevragen zonder eventdata te scannen, rekenfuncties kunnen rechtstreeks case-attributen raadplegen zonder aggregatiefuncties, en andere verrijkingen profiteren van de geoptimaliseerde datastructuur. Procesontdekking en conformance-checking werken sneller op de gestroomlijnde eventdata, terwijl volledige toegang tot case-eigenschappen behouden blijft wanneer nodig.
Deze documentatie maakt deel uit van het mindzie Studio process mining platform.