Gruppenwert festlegen

Überblick

Das Enrichment "Gruppenwert festlegen" erstellt leistungsfähige Datenaggregation, indem zusammenfassende Statistiken für Gruppen von Fällen berechnet und diese berechneten Werte dann jedem Fall in der Gruppe zugewiesen werden. Dieses Enrichment transformiert Ihre Prozessdaten, indem aggregierte Kennzahlen wie Summen, Durchschnitte, Zählungen oder andere statistische Funktionen über Fälle berechnet werden, die gemeinsame Attributwerte teilen, und anschließend ein neues Attribut mit dem Aggregatwert der Gruppe für jeden Fall in dieser Gruppe gefüllt wird. Dies ermöglicht eine ausgefeilte gruppenbasierte Analyse, bei der jeder Fall Informationen über die kollektiven Merkmale seiner Peer-Gruppe enthält.

Dieses Enrichment ist essentiell für vergleichende Analysen und Benchmarking im Process Mining. Es erlaubt die Anreicherung einzelner Fälle mit kontextbezogenen Informationen über die Gesamtleistung ihrer Gruppe und ermöglicht Einblicke wie „der Wert dieser Bestellung im Vergleich zum Durchschnitt für ihre Produktkategorie“ oder „die Behandlungsdauer dieses Patienten im Vergleich zu anderen mit derselben Diagnose“. Durch die Überführung von Gruppenkennzahlen auf die Ebene einzelner Fälle können Ausreißer identifiziert, Baselines etabliert und verstanden werden, wie einzelne Prozessinstanzen zu ihren Peer-Gruppen in Beziehung stehen. Das Enrichment unterstützt verschiedene Aggregationsfunktionen und kann mit gefilterten Datensätzen arbeiten, was Flexibilität bei der Definition einer bedeutungsvollen Gruppe für die Analyse bietet.

Häufige Anwendungsfälle

  • Durchschnittliche Bearbeitungszeit pro Abteilung berechnen und allen Fällen in der jeweiligen Abteilung zuweisen
  • Gesamtbestellwert pro Kunde bestimmen und jede Bestellung mit den Gesamtausgaben des Kunden versehen
  • Anzahl der Fälle pro Lieferant ermitteln und diese Zahl jedem Fall für eine Analyse des Lieferantenvolumens hinzufügen
  • Maximale oder minimale Werte innerhalb von Produktkategorien für Preisanalyse ermitteln
  • Median der Behandlungsdauer pro Diagnosegruppe für Benchmarking im Gesundheitswesen berechnen
  • Summe der Mengen pro Lagerstandort für Einblicke in die Lagerverteilung berechnen
  • Durchschnittliche Genehmigungsdauer pro Region für geografischen Leistungsvergleich ermitteln

Einstellungen

Filter (Optional): Wenden Sie Filter an, um einzuschränken, welche Fälle in die Gruppenkalkulationen einbezogen werden. Nur Fälle, die die Filterkriterien erfüllen, werden bei der Berechnung der Aggregatwerte berücksichtigt. So können Sie Gruppenstatistiken auf spezifische Teilmengen berechnen, z. B. nur abgeschlossene Fälle, Elemente mit hoher Priorität oder Transaktionen innerhalb eines bestimmten Zeitraums. Durch den Filter ausgeschlossene Fälle erhalten den neuen Attributwert nicht.

Neuer Attributname: Geben Sie den Namen für das neue Fallattribut an, das den berechneten Gruppenwert speichern soll. Wählen Sie einen aussagekräftigen Namen, der sowohl die Gruppierungslogik als auch die angewendete Aggregatfunktion beschreibt. Zum Beispiel „Avg_Duration_By_Department“ oder „Total_Orders_Per_Customer“. Der Name muss eindeutig sein und darf nicht mit bestehenden Attributen im Datensatz kollidieren.

Gruppieren nach Spaltenname: Wählen Sie das Attribut, das zur Definition der Gruppen verwendet wird. Fälle mit demselben Wert in diesem Attribut werden für die Aggregatberechnung zusammengefasst. Dies kann jedes kategorische Attribut sein, wie Abteilung, Lieferant, Produktkategorie, Kunden-ID oder Region. Das Gruppierungsattribut bestimmt, wie Ihre Daten für die Aggregation segmentiert werden. Jeder eindeutige Wert in dieser Spalte erzeugt eine separate Gruppe.

Wert-Spaltenname: Wählen Sie das Attribut, dessen Werte innerhalb jeder Gruppe aggregiert werden. Dies ist die Quelldaten für Ihre Berechnung – beispielsweise bei der Berechnung der durchschnittlichen Dauer nach Abteilung ist dies das Attribut der Dauer. Die verfügbaren Aggregationsfunktionen passen sich basierend auf dem Datentyp dieser Spalte an. Numerische Spalten unterstützen mathematische Operationen, während Text- und Datumsfelder eingeschränkte Aggregationsoptionen bieten.

Aggregatfunktion: Wählen Sie die statistische Funktion, die auf die Werte innerhalb jeder Gruppe angewendet wird. Die verfügbaren Funktionen hängen vom Datentyp der Wert-Spalte ab:

  • Summe: Addiert alle Werte in der Gruppe (nur numerische und Zeitdauer-Attribute)
  • Durchschnitt: Berechnet das arithmetische Mittel der Gruppenwerte (numerische und Zeitdauer-Attribute)
  • Median: Findet den mittleren Wert, wenn Gruppenwerte sortiert sind (numerische und Zeitdauer-Attribute)
  • Minimum: Ermittelt den kleinsten Wert in der Gruppe (für Zahlen, Daten und Zeitdauern)
  • Maximum: Ermittelt den größten Wert in der Gruppe (für Zahlen, Daten und Zeitdauern)
  • Anzahl: Zählt nicht-leere Werte in der Gruppe (alle Datentypen)
  • Anzahl unterschiedlicher Werte: Zählt eindeutige Werte in der Gruppe (alle Datentypen)
  • Anzahl Nullwerte: Zählt fehlende/null-Werte in der Gruppe (alle Datentypen)

Beispiele

Beispiel 1: Durchschnittliche Bearbeitungszeit pro Abteilung

Szenario: In einem Kreditgenehmigungsprozess möchte das Management die durchschnittliche Bearbeitungszeit für jede Abteilung verstehen, um Leistungsveränderungen zu erkennen und realistische SLA-Ziele zu setzen.

Einstellungen:

  • Filter: Status = „Abgeschlossen“
  • Neuer Attributname: Avg_Processing_Hours_By_Dept
  • Gruppieren nach Spaltenname: Department
  • Wert-Spaltenname: Total_Processing_Hours
  • Aggregatfunktion: Durchschnitt

Ergebnis: Für jede Kreditanfrage wird „Avg_Processing_Hours_By_Dept“ hinzugefügt, das die durchschnittliche Bearbeitungszeit aller abgeschlossenen Kredite in dieser Abteilung enthält:

  • Abteilung Commercial Banking: Durchschnitt 72,5 Stunden (zugewiesen an alle 150 Fälle)
  • Abteilung Retail Banking: Durchschnitt 24,3 Stunden (zugewiesen an alle 890 Fälle)
  • Abteilung Private Banking: Durchschnitt 48,7 Stunden (zugewiesen an alle 75 Fälle)

Jetzt zeigt jeder Fall sowohl seine individuelle Bearbeitungszeit als auch den Durchschnitt seiner Abteilung, was einen sofortigen Vergleich ermöglicht.

Erkenntnisse: Kreditsachbearbeiter erkennen schnell, ob ein Antrag länger als der Abteilungsdurchschnitt dauert, und das Management sieht, dass Commercial Banking die längste durchschnittliche Bearbeitungszeit hat, was auf Optimierungsbedarf oder zusätzliche Ressourcen hindeutet.

Beispiel 2: Gesamtbestellwert pro Kunde

Szenario: Ein E-Commerce-Unternehmen möchte wertvolle Kunden identifizieren, indem der gesamte Bestellwert jedes Kunden über alle Käufe berechnet und diese Information jeder Bestellung hinzugefügt wird.

Einstellungen:

  • Filter: Order_Status NICHT IN („Cancelled“, „Returned“)
  • Neuer Attributname: Customer_Total_Spend
  • Gruppieren nach Spaltenname: Customer_ID
  • Wert-Spaltenname: Order_Amount
  • Aggregatfunktion: Summe

Ergebnis: Jede Bestellung enthält nun die gesamten historischen Ausgaben des Kunden:

  • Customer_ID „C10234“: Gesamtbetrag 15.750 $ (zugewiesen an alle 23 Bestellungen)
  • Customer_ID „C10891“: Gesamtbetrag 3.200 $ (zugewiesen an alle 8 Bestellungen)
  • Customer_ID „C11567“: Gesamtbetrag 45.900 $ (zugewiesen an alle 67 Bestellungen)

Erkenntnisse: Vertriebsteams sehen sofort beim Bearbeiten einer Bestellung von einem wertvollen Kunden, was eine priorisierte Betreuung ermöglicht. Marketing kann VIP-Kunden für Sonderaktionen anhand von Gesamtumsatzgrenzen identifizieren.

Beispiel 3: Fallanzahl pro Lieferant für Arbeitslastanalyse

Szenario: Die Einkaufsabteilung möchte die Verteilung der Arbeitslast bei Lieferanten verstehen, indem sie zählt, wie viele Bestellungen jeder Lieferant bearbeitet, und diese Zahl jeder Bestellung für Kontext hinzufügt.

Einstellungen:

  • Filter: PO_Date >= "2024-01-01"
  • Neuer Attributname: Vendor_PO_Count
  • Gruppieren nach Spaltenname: Vendor_Name
  • Wert-Spaltenname: Case_ID
  • Aggregatfunktion: Anzahl

Ergebnis: Jede Bestellung zeigt, wie viele Gesamt-Bestellungen dieser Lieferant erhalten hat:

  • Lieferant „TechSupplies Inc“: 145 Bestellungen (Zahl bei jeder Bestellung)
  • Lieferant „Office Essentials“: 892 Bestellungen (Zahl bei jeder Bestellung)
  • Lieferant „Industrial Parts Co“: 43 Bestellungen (Zahl bei jeder Bestellung)

Erkenntnisse: Die Einkaufsabteilung erkennt eine starke Abhängigkeit von bestimmten Lieferanten (Office Essentials mit 892 Bestellungen) und Lieferanten mit geringerer Auslastung, die mehr Volumen übernehmen könnten.

Beispiel 4: Maximale Behandlungskosten pro Diagnose

Szenario: Ein Krankenhaus möchte die höchsten Behandlungskosten innerhalb jeder Diagnosegruppe identifizieren, um Kostenunterschiede zu verstehen und teure Ausreißerfälle zu erkennen.

Einstellungen:

  • Filter: Treatment_Complete = „Ja“ UND Billing_Finalized = „Ja“
  • Neuer Attributname: Max_Cost_In_Diagnosis_Group
  • Gruppieren nach Spaltenname: Primary_Diagnosis_Code
  • Wert-Spaltenname: Total_Treatment_Cost
  • Aggregatfunktion: Maximum

Ergebnis: Jeder Patientenfall enthält die maximal beobachteten Kosten für seine Diagnose:

  • Diagnose „J18.9“ (Lungenentzündung): Max-Kosten 45.000 $ (alle 234 Fälle zeigen diesen Max-Wert)
  • Diagnose „I21.9“ (Herzinfarkt): Max-Kosten 125.000 $ (alle 89 Fälle zeigen diesen Max-Wert)
  • Diagnose „K35.8“ (Blinddarmentzündung): Max-Kosten 32.000 $ (alle 156 Fälle zeigen diesen Max-Wert)

Patienten können sofort sehen, ob ihre Behandlungskosten nahe am Maximum oder darüber liegen.

Erkenntnisse: Krankenhausverwaltungen können Fälle identifizieren, bei denen Kosten signifikant am Maximum liegen, was auf Komplikationen oder Ineffizienzen hinweisen könnte, die untersucht werden sollten.

Beispiel 5: Median der Lösungszeit nach Priorität

Szenario: Ein IT-Service-Desk möchte Basislösungszeiten ermitteln, indem er den Median der Lösungszeit für Tickets auf jeder Prioritätsebene berechnet.

Einstellungen:

  • Filter: Ticket_Status = „Gelöst“ UND Created_Date >= DateAdd(Today(), -90, „days“)
  • Neuer Attributname: Median_Resolution_Hours_By_Priority
  • Gruppieren nach Spaltenname: Priority_Level
  • Wert-Spaltenname: Resolution_Duration_Hours
  • Aggregatfunktion: Median

Ergebnis: Jedes Ticket zeigt die mediane Lösungszeit für seine Prioritätsstufe:

  • Priorität 1 (Kritisch): Median 2,5 Stunden (für 145 Tickets)
  • Priorität 2 (Hoch): Median 8,0 Stunden (für 512 Tickets)
  • Priorität 3 (Mittel): Median 24,0 Stunden (für 1.234 Tickets)
  • Priorität 4 (Niedrig): Median 72,0 Stunden (für 2.891 Tickets)

Erkenntnisse: Service-Desk-Manager erkennen sofort Tickets, die die Median-Lösungszeit ihrer Priorität überschreiten, was auf mögliche SLA-Verletzungen oder Prozessprobleme hinweist, die Aufmerksamkeit erfordern.

Ausgabe

Das Enrichment "Gruppenwert festlegen" erzeugt ein neues Fallattribut mit dem berechneten Aggregatwert für die Gruppe jedes Falls. Jeder Fall innerhalb derselben Gruppe erhält denselben berechneten Wert, was gruppenbezogene Vergleiche und Analysen auf der Ebene einzelner Fälle ermöglicht.

Datentypbestimmung: Der Datentyp des Ausgabe-Attributs hängt sowohl von der gewählten Aggregatfunktion als auch vom Typ der Quellspalte ab:

  • Zählfunktionen (Count, Distinct Count, Null Count) liefern immer ganzzahlige Werte
  • Summe, Durchschnitt und Median behalten den Datentyp der Quellspalte bei (numerische Werte bleiben numerisch, Zeitdauern bleiben Zeitdauern)
  • Minimum und Maximum behalten den genauen Datentyp der Quellspalte bei
  • Bei TimeSpan-Spalten liefern Summe, Durchschnitt und Median TimeSpan-Werte

Gruppenkalkulationsprozess: Das Enrichment ermittelt zunächst alle eindeutigen Werte in der Gruppierungsspalte, berechnet dann die Aggregatfunktion separat für jede Gruppe nur anhand der zugehörigen Fälle (und der angewendeten Filter) und weist schließlich den berechneten Wert jedem Fall in der jeweiligen Gruppe zu.

Umgang mit Nullwerten: Enthält die Gruppierungsspalte Nullwerte, bilden diese Fälle eine eigene Gruppe. Für die Wert-Spalte hängt der Umgang mit Nullwerten von der Aggregatfunktion ab – Count schließt Nullwerte aus, Null Count zählt sie explizit, und Summe/Durchschnitt/Median ignorieren Nullwerte bei der Berechnung. Gefilterte oder Fälle mit Null-Gruppierungswerten erhalten eventuell kein neues Attribut.

Integrationsmöglichkeiten: Das neue Gruppenwert-Attribut lässt sich nahtlos mit anderen mindzieStudio-Funktionen verwenden. Nutzen Sie es in Filtern, um Fälle ober- oder unterhalb des Gruppendurchschnitts zu identifizieren, in Berechnungen für Zusatzmetriken wie „Prozentsatz der Gruppensumme“, in Prozessvisualisierungen zur farblichen Hervorhebung basierend auf Gruppenstatistiken oder in weiteren Enrichments für mehrstufige Aggregationen. Das Attribut steht sofort in allen Analysewerkzeugen zur Verfügung und kann mit Ihrem angereicherten Datensatz exportiert werden.

Siehe auch

  • Gruppenattributwerte – Erstellen Sie benutzerdefinierte Gruppierungen durch Kombination mehrerer Attributwerte in Kategorien
  • Attributwerte kategorisieren – Definieren Sie numerische Bereiche und weisen Sie Kategorienamen für Segmentierung zu
  • Repräsentatives Fallattribut – Wählen Sie einen einzigen repräsentativen Wert aus Ereignisattributen für fallbezogene Analysen
  • Boolesche Attribute mit Wert zählen – Zählen Sie das Auftreten spezifischer boolescher Bedingungen über Attribute hinweg
  • Addieren – Führen Sie einfache Addition mehrerer numerischer Attribute ohne Gruppierung durch

Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.