Set Groepswaarde
Overzicht
De Set Groepswaarde verrijking maakt krachtige data-aggregaties door samenvattende statistieken te berekenen voor groepen cases en deze berekende waarden terug toe te wijzen aan elke case in de groep. Deze verrijking transformeert uw procesdata door aggregaatstatistieken zoals totalen, gemiddelden, aantallen of andere statistische functies te berekenen over cases die gemeenschappelijke attribuutwaarden delen, en vult vervolgens een nieuw attribuut met de groepsaggregate waarde voor elke case in die groep. Dit maakt geavanceerde groepsgebaseerde analyse mogelijk waarbij elke case informatie draagt over de collectieve kenmerken van zijn peergroep.
Deze verrijking is essentieel voor vergelijkende analyse en benchmarking in process mining. Het stelt u in staat individuele cases te verrijken met contextuele informatie over de algehele prestaties van hun groep, waardoor inzichten mogelijk worden als "de waarde van deze order vergeleken met het gemiddelde voor zijn productcategorie" of "de behandelduur van deze patiënt ten opzichte van anderen met dezelfde diagnose". Door groepsniveau-metrics op caseniveau te brengen, kunt u outliers identificeren, referentiewaarden vaststellen en begrijpen hoe individuele procesinstanties zich verhouden tot hun peergroepen. De verrijking ondersteunt diverse aggregatiefuncties en kan werken met gefilterde subsets van data, wat flexibiliteit biedt in het definiëren van wat een betekenisvolle groep is voor analyse.
Veelvoorkomende toepassingen
- Bereken gemiddelde verwerkingstijd per afdeling en ken deze toe aan alle cases in elke afdeling
- Bepaal totale orderwaarde per klant en vul elke order aan met de totale uitgaven van die klant
- Tel het aantal cases per leverancier en voeg deze telling toe aan elke case voor analyse van leveranciersvolume
- Vind de maximale of minimale waarden binnen productcategorieën voor prijsanalyse
- Bereken de mediaan van de behandelduur per diagnosegroep voor benchmarking in de gezondheidszorg
- Bereken de som van hoeveelheden per magazijnlocatie voor inzichten in voorraadverdeling
- Bepaal gemiddelde goedkeuringstijd per regio voor geografische prestatievergelijking
Instellingen
Filter (Optioneel): Pas filters toe om te beperken welke cases worden opgenomen in de groepsberekeningen. Alleen cases die voldoen aan de filtercriteria worden meegeteld bij het berekenen van de aggregaatwaarden. Dit stelt u in staat groepsstatistieken te berekenen op specifieke subsets, zoals alleen voltooide cases, items met hoge prioriteit, of transacties binnen een bepaalde periode. Cases die door het filter zijn uitgesloten ontvangen de nieuwe attribuutwaarde niet.
Nieuwe Attribuutnaam: Specificeer de naam voor het nieuwe case-attribuut waarin de berekende groepswaarde wordt opgeslagen. Kies een beschrijvende naam die zowel de groeplogica als de toegepaste aggregatiefunctie aangeeft. Bijvoorbeeld "Gem_Duur_Per_Afdeling" of "Totaal_Bestellingen_Per_Klant". De naam moet uniek zijn en mag niet conflicteren met bestaande attributen in uw dataset.
Groeperen op kolomnaam: Selecteer het attribuut dat gebruikt wordt om groepen te definiëren. Cases met dezelfde waarde in dit attribuut worden samengevoegd voor de aggregaatberekening. Dit kan elk categorisch attribuut zijn zoals afdeling, leverancier, productcategorie, klant-ID of regio. Het groeperingsattribuut bepaalt hoe uw data wordt gesegmenteerd voor de aggregatie. Elke unieke waarde in deze kolom creëert een aparte groep.
Waarde kolomnaam: Kies het attribuut waarvan de waarden binnen elke groep worden geaggregeerd. Dit is de brondata voor uw berekening - bijvoorbeeld, als u de gemiddelde duur per afdeling berekent, is dit uw duurattribuut. De beschikbare aggregatiefuncties passen zich aan op basis van het datatype van deze kolom. Numerieke kolommen ondersteunen wiskundige bewerkingen, terwijl tekst- en datumkolommen beperkte aggregatiemogelijkheden hebben.
Aggregatiefunctie: Selecteer de statistische functie die wordt toegepast op de waarden binnen elke groep. De beschikbare functies hangen af van het datatype van uw waarde kolom:
- Som: Telt alle waarden in de groep op (alleen numerieke en duur attributen)
- Gemiddelde: Bereken het rekenkundig gemiddelde van de groepswaarden (numerieke en duur attributen)
- Mediaan: Vind de middelste waarde wanneer de groepswaarden gesorteerd zijn (numerieke en duur attributen)
- Min: Identificeer de kleinste waarde binnen de groep (werkt met nummers, datums en duur)
- Max: Identificeer de grootste waarde binnen de groep (werkt met nummers, datums en duur)
- Aantal: Tel het aantal niet-lege waarden in de groep (alle datatypes)
- Aantal Uniek: Tel unieke waarden in de groep (alle datatypes)
- Aantal Null: Tel ontbrekende/null waarden in de groep (alle datatypes)
Voorbeelden
Voorbeeld 1: Gemiddelde verwerkingstijd per afdeling
Scenario: In een leninggoedkeuringsproces wil het management de gemiddelde verwerkingstijd per afdeling begrijpen om prestatieverschillen te identificeren en realistische SLA-doelen te bepalen.
Instellingen:
- Filter: Status = "Completed"
- Nieuwe Attribuutnaam: Gem_Verk_Tijd_Per_Afdeling
- Groeperen op kolomnaam: Afdeling
- Waarde kolomnaam: Totale_Verwerkingstijd
- Aggregatiefunctie: Gemiddelde
Output: Voor elke leningaanvraag wordt "Gem_Verk_Tijd_Per_Afdeling" toegevoegd met de gemiddelde verwerkingstijd voor alle voltooide leningen in die afdeling:
- Gemiddelde afdeling Commerciële Bankieren: 72,5 uur (toegewezen aan alle 150 cases)
- Gemiddelde afdeling Retail Bankieren: 24,3 uur (toegewezen aan alle 890 cases)
- Gemiddelde afdeling Private Banking: 48,7 uur (toegewezen aan alle 75 cases)
Nu toont elke case zowel de individuele verwerkingstijd als het gemiddelde van zijn afdeling, wat directe vergelijking mogelijk maakt.
Inzichten: Leningadviseurs kunnen snel zien of een aanvraag langer duurt dan het afdelingsgemiddelde, en het management ziet dat Commerciële Bankieren de langste gemiddelde verwerkingstijd heeft, wat wijst op een mogelijke noodzaak voor procesoptimalisatie of extra middelen.
Voorbeeld 2: Totale klantorderwaarde
Scenario: Een e-commercebedrijf wil klanten met hoge waarde identificeren door de totale orderwaarde van elke klant over al hun aankopen te berekenen en deze informatie aan elke order toe te voegen.
Instellingen:
- Filter: Order_Status NIET IN ("Cancelled", "Returned")
- Nieuwe Attribuutnaam: Klant_Totaal_Uitgaven
- Groeperen op kolomnaam: Customer_ID
- Waarde kolomnaam: Order_Bedrag
- Aggregatiefunctie: Som
Output: Elke order bevat nu de totale historische uitgaven van de klant:
- Customer_ID "C10234": Totaal uitgaven $15.750 (toegewezen aan alle 23 orders)
- Customer_ID "C10891": Totaal uitgaven $3.200 (toegewezen aan alle 8 orders)
- Customer_ID "C11567": Totaal uitgaven $45.900 (toegewezen aan alle 67 orders)
Inzichten: Verkoopteams kunnen direct zien dat ze met een klant met hoge waarde te maken hebben, waardoor ze prioriteit kunnen geven aan de service. Marketing kan VIP-klanten identificeren voor speciale promoties op basis van de totale uitgaven.
Voorbeeld 3: Aantal cases per leverancier voor werklastanalyse
Scenario: Een inkoopafdeling wil inzicht krijgen in de werklastverdeling van leveranciers door te tellen hoeveel inkooporders elke leverancier afhandelt en deze telling aan elke PO toe te voegen voor context.
Instellingen:
- Filter: PO_Datum >= "2024-01-01"
- Nieuwe Attribuutnaam: Leverancier_PO_Aantal
- Groeperen op kolomnaam: Vendor_Name
- Waarde kolomnaam: Case_ID
- Aggregatiefunctie: Aantal
Output: Elke inkooporder toont hoeveel totaal aantal POs die leverancier heeft ontvangen:
- Leverancier "TechSupplies Inc": 145 POs (aantal toegevoegd aan elke PO)
- Leverancier "Office Essentials": 892 POs (aantal toegevoegd aan elke PO)
- Leverancier "Industrial Parts Co": 43 POs (aantal toegevoegd aan elke PO)
Inzichten: Inkoop kan over-afhankelijkheid van specifieke leveranciers identificeren (Office Essentials met 892 POs wijst op hoge afhankelijkheid) en onderbenutte leveranciers die mogelijk meer volume aankunnen.
Voorbeeld 4: Maximale behandelingskosten per diagnose
Scenario: Een ziekenhuis wil de hoogste behandelingskosten binnen elke diagnosegroep identificeren om kostenvariaties te begrijpen en dure outlier cases te detecteren.
Instellingen:
- Filter: Treatment_Complete = "Yes" AND Billing_Finalized = "Yes"
- Nieuwe Attribuutnaam: Max_Kosten_In_Diagnosegroep
- Groeperen op kolomnaam: Primary_Diagnosis_Code
- Waarde kolomnaam: Totale_Behandelingskosten
- Aggregatiefunctie: Max
Output: Elke patiëntcase bevat de maximale kosten die zijn vastgesteld binnen hun diagnosegroep:
- Diagnose "J18.9" (Longontsteking): Max kosten $45.000 (alle 234 cases tonen deze max)
- Diagnose "I21.9" (Hartinfarct): Max kosten $125.000 (alle 89 cases tonen deze max)
- Diagnose "K35.8" (Appendicitis): Max kosten $32.000 (alle 156 cases tonen deze max)
Patiënten kunnen direct zien of hun behandelingskosten dicht bij of boven de maximale kosten voor hun diagnosegroep liggen.
Inzichten: Zorgbeheerders kunnen cases identificeren waarbij de kosten significant dicht bij het maximum liggen, wat kan wijzen op complicaties of inefficiënties die nader onderzoek vereisen.
Voorbeeld 5: Mediaan oplostijd per prioriteitsniveau
Scenario: Een IT-servicedesk wil basislijnen voor oplostijden vaststellen door de mediaan oplostijd te berekenen voor tickets per prioriteitsniveau.
Instellingen:
- Filter: Ticket_Status = "Resolved" AND Created_Date >= DateAdd(Today(), -90, "days")
- Nieuwe Attribuutnaam: Mediaan_Oplostijd_Uur_Per_Prioriteit
- Groeperen op kolomnaam: Priority_Level
- Waarde kolomnaam: Oplostijd_Uur
- Aggregatiefunctie: Mediaan
Output: Elk ticket toont de mediaan oplostijd voor zijn prioriteitsniveau:
- Prioriteit 1 (Kritiek): Mediaan 2,5 uur (toegewezen aan 145 tickets)
- Prioriteit 2 (Hoog): Mediaan 8,0 uur (toegewezen aan 512 tickets)
- Prioriteit 3 (Middel): Mediaan 24,0 uur (toegewezen aan 1.234 tickets)
- Prioriteit 4 (Laag): Mediaan 72,0 uur (toegewezen aan 2.891 tickets)
Inzichten: Servicedesk managers kunnen direct tickets identificeren die langer dan de mediaan oplostijd vergen voor hun prioriteit, wat kan wijzen op mogelijke SLA-schendingen of procesproblemen die aandacht vereisen.
Output
De Set Groepswaarde verrijking creëert een nieuw case-attribuut met de berekende aggregaatwaarde voor de groep van elke case. Elke case binnen dezelfde groep ontvangt dezelfde berekende waarde, wat groepsniveau-vergelijkingen en analyses op individueel caseniveau mogelijk maakt.
Datatype bepaling: Het datatype van het outputattribuut hangt af van zowel de geselecteerde aggregatiefunctie als het bronkolomtype:
- Aantalfuncties (Aantal, Aantal Uniek, Aantal Null) produceren altijd gehele getallen
- Som, Gemiddelde en Mediaan behouden het datatype van de bronkolom (numerieke waarden blijven numeriek, duurwaarden blijven duur)
- Min en Max behouden het exacte datatype van de bronkolom
- Bij TimeSpan kolommen retourneren Som, Gemiddelde en Mediaan TimeSpan waarden
Groepsberekeningsproces: De verrijking identificeert eerst alle unieke waarden in de groepeerkolom, berekent vervolgens de aggregaatfunctie afzonderlijk voor elke groep met alleen de cases die tot die groep behoren (en voldoen aan eventuele filters). Tenslotte wijst het de berekende waarde toe aan elke case in de betreffende groep.
Omgaan met null-waarden: Als de groepeerkolom null-waarden bevat, vormen cases met null hun eigen groep. Voor de waarde-kolom hangt de null-afhandeling af van de aggregatiefunctie - Aantal sluit nulls uit, Aantal Null telt ze specifiek, en Som/Gemiddelde/Mediaan slaan null-waarden over in de berekeningen. Cases die door het filter zijn uitgesloten of die een null groepeervalue hebben, kunnen de nieuwe attribuutwaarde niet ontvangen.
Integratiemogelijkheden: Het nieuwe groepswaarde-attribuut integreert naadloos met andere mindzieStudio-functies. Gebruik het in filters om cases boven of onder groepsgemiddelden te identificeren, in rekenmodules om extra metrics af te leiden zoals "percentage van groepstotaal", in proceskaarten om te kleuren op basis van groepsstatistieken, of in verdere verrijkingen om multi-level aggregaties te creëren. Het attribuut is direct beschikbaar in alle analysetools en kan met uw verrijkte dataset geëxporteerd worden.
Zie ook
- Group Attribute Values - Maak aangepaste groepsindelingen door meerdere attribuutwaarden te combineren tot categorieën
- Categorize Attribute Values - Definieer numerieke bereiken en wijs categorielabels toe voor segmentatie
- Representative Case Attribute - Selecteer één representatieve waarde uit eventattributen voor case-niveau analyse
- Count Boolean Attributes with Value - Tel het voorkomen van specifieke booleaanse condities over attributen heen
- Add - Voer eenvoudige optellingen uit van meerdere numerieke attributen zonder groepering
Deze documentatie maakt deel uit van het mindzie Studio process mining platform.