Vorhersagewert

Überblick

Die Anreicherung "Vorhersagewert" verwendet fortgeschrittene Regressionsverfahren, um numerische Attributwerte basierend auf historischen Mustern in Ihren Prozessdaten vorherzusagen. Dieser leistungsstarke statistische Operator analysiert abgeschlossene Fälle mit bekannten Ergebnissen, um Vorhersagemodelle zu erstellen, die Werte für laufende oder neue Fälle schätzen können. Durch die Untersuchung der Beziehungen zwischen Eingabeattributen und abhängigen Variablen erkennt die Anreicherung Muster und wendet diese an, um datenbasierte Vorhersagen zu zukünftigen Werten zu treffen.

Diese Anreicherung ist besonders wertvoll für Prognosen und Planung in Process-Mining-Szenarien. Sie ermöglicht es Organisationen, Prozessergebnisse vor Abschluss vorherzusagen, finanzielle Auswirkungen anhand früher Indikatoren abzuschätzen und proaktive Entscheidungen auf Basis wahrscheinlicher zukünftiger Werte zu treffen. Die Anreicherung verwendet konfigurierbare Aggregationsfunktionen und historische Fallanalysen, um nicht nur Vorhersagen, sondern auch Vertrauenswerte bereitzustellen, die den Nutzern helfen, die Zuverlässigkeit jeder Vorhersage zu verstehen. Der Operator kann komplexe Szenarien einschließlich minimaler Wertgrenzen und Fallback-Berechnungen handhaben und gewährleistet so robuste Vorhersagen, selbst wenn historische Daten begrenzt sind.

Häufige Anwendungsfälle

  • Vorhersage von Lieferzeiten basierend auf Bestellmerkmalen und Kundenstandort
  • Schätzung der endgültigen Rechnungsbeträge anhand von Details aus der ursprünglichen Bestellung
  • Prognose der Produktionsleistung basierend auf eingesetzten Materialien und Prozessparametern
  • Vorhersage von Kundenzufriedenheitswerten anhand früher Interaktionsindikatoren
  • Schätzung von Projektabschlussdaten basierend auf ersten Meilensteinen
  • Prognose des Ressourcenverbrauchs anhand von Prozessattributen
  • Vorhersage von Qualitätswerten basierend auf Parametern der Produktionslinie

Einstellungen

Name des neuen Attributs: Geben Sie den Namen für das neue Attribut an, das den vorhergesagten Wert speichern wird. Dieses Attribut enthält die numerische Vorhersage für jeden Fall. Wählen Sie einen aussagekräftigen Namen, der klar angibt, welcher Wert vorhergesagt wird, z. B. "Predicted_Delivery_Days" oder "Estimated_Final_Cost".

Name des Algorithmus (optional): Geben Sie einen individuellen Namen für den Vorhersagealgorithmus an. Dieser Name wird in einem Begleitattribut (neben der Vorhersage und dem Vertrauenswert) gespeichert, um nachzuverfolgen, welche Methode für jede Vorhersage verwendet wurde. Nützlich beim Testen verschiedener Vorhersagekonfigurationen oder bei Anwendung mehrerer Vorhersageanreicherungen.

Eingabeattributnamen: Wählen Sie ein oder mehrere String-Attribute aus, die verwendet werden, um Fälle für die Vorhersage zu gruppieren. Fälle mit gleichen Werten in diesen Attributen werden als ähnlich betrachtet und gemeinsam für die Vorhersage genutzt. Zum Beispiel bedeutet die Auswahl von "Customer_Region" und "Product_Category", dass Vorhersagen auf historischen Fällen derselben Region und Produktkategorie basieren. Wenn keine Attribute ausgewählt sind, werden alle Fälle mit der abhängigen Variablen als Prädiktoren verwendet.

Name des abhängigen Attributs: Wählen Sie das numerische Attribut aus, das Sie vorhersagen möchten. Es muss ein numerisches Feld (Ganzzahl oder Dezimalzahl) sein, das in einigen abgeschlossenen Fällen vorhanden ist, aber in laufenden Fällen fehlen kann. Die Anreicherung analysiert historische Werte dieses Attributs, um Vorhersagen für Fälle zu treffen, in denen der Wert noch nicht verfügbar ist.

Name des Attributs für Mindestwert (optional): Wählen Sie ein numerisches Attribut aus, das eine Mindestschwelle für Vorhersagen vorgibt. Wenn angegeben, werden Vorhersagen niemals unter diesem Wert liegen. Dies ist hilfreich bei Geschäftsregeln wie "Die vorhergesagte Lieferzeit kann nicht geringer sein als die bereits verstrichene Zeit" oder "Der geschätzte Kostenbetrag darf nicht unter den Materialkosten liegen". Das Attribut muss sich vom abhängigen Attribut unterscheiden.

Filter (optional): Wenden Sie Filter an, um einzuschränken, welche historischen Fälle für den Aufbau des Vorhersagemodells verwendet werden. So können Sie Ausreißer ausschließen, sich auf aktuelle Daten konzentrieren oder nur Fälle hoher Qualität für die Vorhersage verwenden. Beispielsweise können Sie festlegen, nur Fälle der letzten 6 Monate zu verwenden oder Fälle mit Datenqualitätsproblemen auszuschließen.

Aggregationsfunktion: Wählen Sie die statistische Funktion, die verwendet wird, um historische Werte zu einer Vorhersage zu kombinieren:

  • Mittelwert: Verwendet den Durchschnitt der historischen Werte (Standard, balanciert alle Beobachtungen)
  • Median: Verwendet den mittleren Wert (robust gegenüber Ausreißern)
  • Max: Verwendet den höchsten historischen Wert (konservativ für obere Grenzen)
  • Min: Verwendet den niedrigsten historischen Wert (konservativ für untere Grenzen)

Minimale Fälle: Legen Sie die minimale Anzahl historischer Fälle fest, die für eine Vorhersage erforderlich sind. Standard ist 2. Wenn weniger passende Fälle verfügbar sind, erfolgt keine Vorhersage, es sei denn, eine Mindestwertgrenze bietet eine Fallback-Option. Höhere Werte erhöhen die Zuverlässigkeit der Vorhersage, können jedoch zu weniger Vorhersagen führen.

Maximale Fälle: Legen Sie die maximale Anzahl der aktuellen Fälle fest, die für die Vorhersage verwendet werden. Standard ist 10. Die Anreicherung nutzt die aktuellsten Fälle bis zu diesem Limit. Dadurch spiegeln die Vorhersagen die aktuellen Muster wider und nicht veraltete historische Daten. Niedrigere Werte machen Vorhersagen reaktiver auf kürzliche Änderungen.

Konstante für Mindestwert: Wenn Mindestwertgrenzen verwendet werden, wird dieser konstante Wert zum Mindestwert hinzuaddiert, um eine Fallback-Vorhersage zu erzeugen. Standard ist 0. Zum Beispiel würde mit einem Mindestwert von 100 und einer Konstante von 10 der Fallback 110 betragen. So erfüllen Vorhersagen auch bei unzureichenden historischen Daten die Geschäftsanforderungen.

Faktor für Mindestwert: Wenn Mindestwertgrenzen verwendet werden, wird dieser Faktor für die Mindestwertberechnung im Fallback multipliziert. Standard ist 1,0. Zum Beispiel ergibt sich bei einem Mindestwert von 100 und Faktor 1,2 ein Fallback von 120. So sind proportionale Anpassungen basierend auf der Mindestschwelle möglich.

Beispiele

Beispiel 1: Vorhersage von Lieferzeiten im E-Commerce

Szenario: Ein Online-Händler möchte Lieferzeiten für neue Bestellungen basierend auf historischen Liefermustern vorhersagen und dabei Kundenstandort und Versandart berücksichtigen, um genaue Kundenerwartungen zu setzen.

Einstellungen:

  • Name des neuen Attributs: Predicted_Delivery_Days
  • Name des Algorithmus: Regional_Shipping_Model
  • Eingabeattributnamen: Customer_Region, Shipping_Method
  • Name des abhängigen Attributs: Actual_Delivery_Days
  • Name des Attributs für Mindestwert: Current_Days_In_Transit
  • Filter: Order_Date > 30 days ago
  • Aggregationsfunktion: Average
  • Minimale Fälle: 5
  • Maximale Fälle: 20
  • Konstante für Mindestwert: 1
  • Faktor für Mindestwert: 1.1

Ausgabe: Erzeugt drei neue Fallattribute:

  • Predicted_Delivery_Days: Die geschätzte Anzahl der Tage für die Lieferung (z. B. 5,3 Tage)
  • Predicted_Delivery_Days - Confidence: Vertrauenswert zwischen 0 und 1 (z. B. 0,75)
  • Predicted_Delivery_Days - Algorithm: Verwendeter Algorithmus ("Regional_Shipping_Model" oder "Fixed" für Fallback)

Für eine neue Bestellung aus Region_West mit Express_Shipping findet die Anreicherung 15 ähnliche historische Bestellungen mit einem Durchschnitt von 3,2 Tagen, was zu einer Vorhersage von 3,2 Tagen mit 0,75 Vertrauenswert führt.

Erkenntnisse: Die Vorhersage hilft, realistische Liefererwartungen zu setzen, verspätungsgefährdete Bestellungen zu identifizieren und Versandmethoden basierend auf vorhergesagten versus versprochenen Lieferzeiten zu optimieren.

Beispiel 2: Prognose von Rechnungsbeträgen im Einkauf

Szenario: Eine Einkaufsabteilung möchte Endrechnungsbeträge basierend auf Details der ursprünglichen Bestellanforderung prognostizieren, um die Budgetplanung zu verbessern und potenzielle Kostenüberschreitungen frühzeitig zu erkennen.

Einstellungen:

  • Name des neuen Attributs: Predicted_Invoice_Amount
  • Eingabeattributnamen: Vendor_Name, Material_Category
  • Name des abhängigen Attributs: Final_Invoice_Amount
  • Name des Attributs für Mindestwert: Initial_PO_Amount
  • Aggregationsfunktion: Median
  • Minimale Fälle: 3
  • Maximale Fälle: 15
  • Konstante für Mindestwert: 0
  • Faktor für Mindestwert: 1.05

Ausgabe: Erzeugt Vorhersageattribute mit geschätztem Endrechnungsbetrag. Für eine neue Bestellung über 10.000 $ von Vendor_A für Rohmaterialien:

  • Predicted_Invoice_Amount: 10.750 $ (basierend auf historischem Median, 7,5 % über PO-Betrag)
  • Confidence: 0,6 (nutzt 9 historische Fälle)
  • Algorithmus: Median-basierte Vorhersage

Erkenntnisse: Ermöglicht proaktives Budgetmanagement, frühzeitige Identifikation von Lieferanten mit konstanten Mehrkosten und verbesserte Genauigkeit in der Finanzplanung.

Beispiel 3: Schätzung von Qualitätswerten in der Fertigung

Szenario: Ein Fertigungswerk möchte Qualitätswerte für Produkte in der Produktion basierend auf frühen Prozessparametern vorhersagen, um frühzeitig bei potenziellen Qualitätsproblemen eingreifen zu können.

Einstellungen:

  • Name des neuen Attributs: Predicted_Quality_Score
  • Eingabeattributnamen: Production_Line, Product_Type, Shift
  • Name des abhängigen Attributs: Final_Quality_Score
  • Filter: Production_Date > 60 days ago AND Quality_Score IS NOT NULL
  • Aggregationsfunktion: Average
  • Minimale Fälle: 10
  • Maximale Fälle: 30

Ausgabe: Für Produkte in Produktion auf Line_A vom Produkttyp Product_Type_X während der Tagschicht:

  • Predicted_Quality_Score: 92,5 (Skala 0–100)
  • Confidence: 0,87 (basierend auf 26 ähnlichen historischen Fällen)
  • Algorithmus: Standardvorhersage

Erkenntnisse: Ermöglicht Qualitätsabteilungen, Inspektionsaufwand auf Produkte mit niedrigen prognostizierten Werten zu fokussieren, Prozessparameter proaktiv anzupassen und kostenintensive Nachbesserungen zu reduzieren.

Beispiel 4: Vorhersage der Verweildauer von Patienten im Gesundheitswesen

Szenario: Ein Krankenhaus möchte die Verweildauer von Patienten basierend auf Aufnahme-Diagnose und initialen Bewertungsdaten vorhersagen, um Bettenmanagement und Ressourcenzuteilung zu optimieren.

Einstellungen:

  • Name des neuen Attributs: Predicted_LOS_Days
  • Eingabeattributnamen: Admission_Diagnosis, Patient_Age_Group, Admission_Type
  • Name des abhängigen Attributs: Actual_LOS_Days
  • Name des Attributs für Mindestwert: Current_LOS_Days
  • Aggregationsfunktion: Median
  • Minimale Fälle: 8
  • Maximale Fälle: 25
  • Konstante für Mindestwert: 1
  • Faktor für Mindestwert: 1.0

Ausgabe: Für einen neu aufgenommenen älteren Patienten mit Pneumonie nach Notaufnahmepatient aktuell an Tag 2:

  • Predicted_LOS_Days: 7 Tage (Median ähnlicher Fälle)
  • Confidence: 0,72
  • Algorithmus: Zeigt "Fixed" an, falls weniger als Mindestanzahl historischer Fälle vorliegt, mit aktuellem LOS + 1 Tag

Erkenntnisse: Ermöglicht bessere Planung der Bettenkapazitäten, hilft Patienten mit voraussichtlich längerer Verweildauer mit zusätzlicher Betreuung zu identifizieren und verbessert Entlassungsplanungen.

Beispiel 5: Prognose von Projektkosten im Bauwesen

Szenario: Ein Bauunternehmen möchte die endgültigen Projektkosten basierend auf Anfangsmerkmalen vorhersagen, um Angebotstreue zu verbessern und Projekte mit Kostenrisiko frühzeitig zu erkennen.

Einstellungen:

  • Name des neuen Attributs: Predicted_Total_Cost
  • Eingabeattributnamen: Project_Type, Client_Industry, Project_Region
  • Name des abhängigen Attributs: Final_Project_Cost
  • Name des Attributs für Mindestwert: Current_Spent_Amount
  • Filter: Project_Start_Date > 365 days ago
  • Aggregationsfunktion: Average
  • Minimale Fälle: 4
  • Maximale Fälle: 12
  • Konstante für Mindestwert: 50000
  • Faktor für Mindestwert: 1.15

Ausgabe: Für ein neues Gewerbegebäudeprojekt in Region_North für einen Einzelhandelskunden mit bereits 2 Mio. $ ausgegeben:

  • Predicted_Total_Cost: 3.500.000 $ (basierend auf 8 ähnlichen historischen Projekten)
  • Confidence: 0,67
  • Algorithmus: Zeigt verwendete Berechnungsmethode

Bei unzureichenden historischen Daten nutzt es Fallback: 2.000.000 \(× 1,15 + 50.000\) = 2.350.000 $

Erkenntnisse: Verbessert die Projektprofitabilität durch genaue Kostenvorhersagen, ermöglicht frühzeitiges Eingreifen bei Budgetüberschreitungen und unterstützt wettbewerbsfähigere und realistischere Angebotsstrategien.

Ausgabe

Die Anreicherung "Vorhersagewert" erstellt drei zusammengehörende Fallattribute, die umfassende Vorhersageinformationen bereitstellen:

Primäres Vorhersageattribut: Benannt entsprechend Ihrer Einstellung "Name des neuen Attributs", enthält dieses Attribut den vorhergesagten numerischen Wert. Der Datentyp ist immer Double (Dezimalzahl), um präzise Vorhersagen zu ermöglichen. Werte werden basierend auf historischen Mustern oder Mindestwertgrenzen berechnet, wenn anwendbar.

Attribut für Vertrauenswert: Wird automatisch mit dem Namensformat "[Name des neuen Attributs] - Confidence" erstellt und enthält einen Vertrauenswert zwischen 0 und 1, der die Zuverlässigkeit der Vorhersage angibt. Höhere Werte bedeuten, dass mehr historische Fälle für die Vorhersage genutzt wurden. Die Berechnung erfolgt als: (Anzahl der verwendeten Fälle) / (maximale Fälle + 1).

Attribut für Algorithmusverfolgung: Wird automatisch mit dem Namensformat "[Name des neuen Attributs] - Algorithm" erstellt. Dieses String-Attribut dokumentiert, welche Methode für jede Vorhersage verwendet wurde. Es enthält entweder Ihren benutzerdefinierten Algorithmusnamen (sofern angegeben) für Standardvorhersagen oder "Fixed", wenn Fallback-Berechnungen mit Mindestwerten verwendet wurden.

Diese Attribute integrieren sich nahtlos mit anderen mindzieStudio-Funktionen – verwenden Sie sie in Filtern, um Vorhersagen mit hoher Zuverlässigkeit zu identifizieren, in Kalkulatoren zum Vergleich von vorhergesagten und tatsächlichen Werten oder in Visualisierungen zur Analyse von Prognosegenauigkeiten.

Siehe auch


Diese Dokumentation ist Teil der mindzie Studio Process Mining Plattform.