KI-Fallvorhersage
Schnellstart: Vorgefertigte Python-Vorlagen
mindzie liefert drei sofort einsatzbereite Vorlagenpakete, mit denen Sie die KI-Fallvorhersage ohne Python-Programmierung ausführen können. Wählen Sie das Paket passend zu Ihrer Vorhersagespalte, laden Sie die ZIP-Datei herunter und laden Sie sie über das Menü Modell hochladen des KI-Fallvorhersage-Blocks hoch – fertig.
| Vorlage | Verwenden, wenn die Vorhersagespalte... | Typische Beispiele | Herunterladen |
|---|---|---|---|
| Binärer Klassifikator | Genau 2 Kategorien | "Genehmigt" / "Abgelehnt", Wahr / Falsch, 0 / 1, "Bestanden" / "Nicht bestanden" | mindzie_ai_binary_classifier_v1.zip |
| Mehrklassen-Klassifikator | 3 oder mehr Kategorien | "Niedrig" / "Mittel" / "Hoch", Regionscodes, Statuskategorien | mindzie_ai_multiclass_classifier_v1.zip |
| Regressor | Ein kontinuierlicher numerischer Wert | Dauer in Sekunden, Dollarbetrag, Stückzahl, Prozentsatz | mindzie_ai_regressor_v1.zip |
Alle drei Pakete sind generisch – sie lesen Spaltennamen und -typen aus den Schema-Dateien, die mindzieStudio zur Laufzeit schreibt, und funktionieren somit mit jeder Kombination von Feature- und Zielspaltennamen. Sie bearbeiten nichts innerhalb der ZIP-Datei.
Der vollständige Upload-Workflow mit Screenshots, welche Aufgaben jede Vorlage automatisch übernimmt und wie Sie sie anpassen können, finden Sie weiter unten in Vorgefertigte Python-Vorlagen verwenden.
Überblick
Die KI-Fallvorhersage-Anreicherung ermöglicht es Ihnen, maschinelles Lernen und künstliche Intelligenz zu nutzen, um Vorhersagen über Fall-Ergebnisse, Verhaltensweisen oder Eigenschaften auf Basis historischer Muster Ihrer Prozessdaten zu treffen. Diese leistungsstarke Anreicherung trainiert prädiktive Modelle anhand Ihrer vorhandenen Fallattribute und wendet diese Modelle dann an, um unbekannte Werte für aktuelle oder zukünftige Fälle vorherzusagen.
Im Gegensatz zu herkömmlichen regelbasierten Anreicherungen verwendet die KI-Fallvorhersage statistische Lernalgorithmen, um komplexe Muster und Zusammenhänge in Ihren Daten zu entdecken, die nicht sofort ersichtlich sind. Die Anreicherung unterstützt Klassifikationsaufgaben (Vorhersage von Kategorien oder Ergebnissen) und kann sowohl die Erstellung von Trainingsmodellen als auch deren Einsatz zur Vorhersage innerhalb Ihres Process Mining-Workflows abdecken.
Diese Anreicherung ist besonders wertvoll für Prozessoptimierung, Risikomanagement und proaktive Entscheidungsfindung. Durch die frühzeitige Vorhersage von Fallergebnissen im Prozesslebenszyklus können Sie präventive Maßnahmen ergreifen, Ressourcen effektiver zuweisen und potenzielle Probleme erkennen, bevor sie auftreten.
Häufige Anwendungsfälle
- Ergebnisvorhersage: Vorhersage, ob ein Fall genehmigt oder abgelehnt, termingerecht abgeschlossen oder verzögert, erfolgreich oder fehlgeschlagen ist, basierend auf frühen Fallattributen
- Risikobewertung: Identifikation von Hochrisikofällen, die wahrscheinlich Probleme verursachen, Nacharbeit erfordern oder zu Kundenbeschwerden führen
- Dauerprognose: Vorhersage, wie lange ein Fall zur Fertigstellung benötigt, basierend auf Anfangsmerkmalen und aktuellem Fortschritt
- Ressourcenzuweisung: Vorhersage, welche Fälle spezialisierte Bearbeitung oder zusätzliche Ressourcen erfordern, basierend auf Komplexitätsindikatoren
- Kundenabwanderung vermeiden: Vorhersage, welche Kundenfälle Gefahr laufen, storniert oder abgebrochen zu werden, basierend auf Verhaltensmustern
- Qualitätsvorhersage: Prognose, ob ein Fall Qualitätsstandards erfüllt oder zusätzliche Prüfungen erfordert, basierend auf Ausführungsmustern im Prozess
- Kostenabschätzung: Vorhersage der Gesamtkosten eines Falls basierend auf Anfangsparametern und frühen Aktivitätsmustern
Einstellungen
Vorhersagetyp
Vorhersagetyp: Legt fest, welche Art von maschineller Lernaufgabe durchgeführt wird. Derzeit unterstützt die Anreicherung die Klassifikation, die kategorische Ergebnisse oder Klassenlabels vorhersagt.
- Klassifikation: Für die Vorhersage diskreter Kategorien oder Ergebnisse wie "Genehmigt/Ablehnt", "Hochrisiko/Niedrigrisiko", "Pünktlich/Verzögert" oder jedes kategoriale Attribut. Das Modell lernt, Fälle basierend auf Mustern in den Feature-Spalten in vordefinierte Gruppen einzuordnen.
- Regression: (Zukünftig) Wird kontinuierliche numerische Werte wie Dauern, Kosten oder Mengen vorhersagen.
- Clustering: (Zukünftig) Wird ähnliche Fälle ohne vordefinierte Kategorien gruppieren.
- Zeitreihen: (Zukünftig) Wird zeitliche Muster und Sequenzen vorhersagen.
- Anomalie-Erkennung: (Zukünftig) Wird ungewöhnliche oder Ausreißer-Fälle identifizieren.
- Empfehlung: (Zukünftig) Wird optimale nächste Aktionen oder Aktivitäten vorschlagen.
Für die meisten geschäftlichen Anwendungsfälle ist die Klassifikation die richtige Wahl, wenn Sie ein bestimmtes Ergebnis vorhersagen möchten, das in eindeutig unterscheidbare Kategorien fällt.
Feature-Spalten
Feature-Spalten: Wählen Sie die Fallattribute aus, die als Eingabe-Features für Training und Vorhersage verwendet werden. Dies sind die unabhängigen Variablen, die das KI-Modell zur Vorhersage analysiert. Wählen Sie Attribute aus, die den Ausgang beeinflussen oder mit ihm korrelieren.
Beste Praktiken für die Auswahl von Features:
- Einschluss von Attributen, die früh im Fallzyklus verfügbar sind, wenn Sie frühe Vorhersagen machen möchten
- Auswahl von Attributen mit guter Datenqualität (minimale fehlende Werte)
- Einschluss sowohl kategorialer als auch numerischer Attribute für reichhaltigere Muster
- Vermeiden der Verwendung der Zielspalte (Vorhersagespalte) als Feature
- Berücksichtigung domänenspezifischen Wissens über Einflussfaktoren
- Beginn mit 3–10 relevanten Features; zu viele können die Modellgenauigkeit reduzieren
Beispiele für nützliche Feature-Spalten:
- Kundentyp, Region oder Segment
- Bestellmenge, Priorität oder Kategorie
- Merkmale der ursprünglichen Anfrage
- Ressourcenzuweisungen oder Abteilung
- Zeitbasierte Attribute (Wochentag, Monat, Jahreszeit)
Vorhersagespalte
Vorhersagespalte: Wählen Sie das Fallattribut, das die bekannten Ergebnisse enthält, von denen das Modell im Training lernen soll. Dies ist die abhängige Variable oder das Ziel, das das Modell für neue Fälle vorhersagen wird. Diese Spalte muss in den Trainingsdaten bekannte Werte haben, kann aber für Fälle, für die eine Vorhersage gemacht werden soll, leer sein.
Gültige Spalten für den Vorhersagetyp Klassifikation sind:
- Zeichenfolgenattribute (Textkategorien wie "Genehmigt", "Abgelehnt", "Ausstehend")
- Boolesche Attribute (wahr/falsch Ergebnis)
- Ganzzahlige Attribute (numerische Codes für Kategorien)
Die Vorhersagespalte sollte:
- Das tatsächliche Ergebnis enthalten, das vorhergesagt werden soll
- Ausreichend Beispiele jeder Kategorie in den Trainingsdaten enthalten
- Das zentrale Geschäftsergebnis sein, das prognostiziert werden soll
- Zum Zeitpunkt der Vorhersage nicht verfügbar oder bekannt sein
Trainingsfilter
Trainingsfilter: Definieren Sie Filterkriterien, um festzulegen, welche Fälle zum Training des KI-Modells verwendet werden. Damit können Sie nur hochwertige, vollständige Fälle zum Training verwenden und Fälle mit unvollständigen oder nicht repräsentativen Daten ausschließen.
Typische Trainingsfilter-Szenarien:
- Nur abgeschlossene Fälle einschließen (laufende Fälle ausschließen)
- Nur Fälle einbeziehen, bei denen die Vorhersagespalte bekannt ist (nicht leer)
- Fälle mit Datenqualitätsproblemen oder fehlenden Feature-Werten ausschließen
- Nur aktuelle Fälle verwenden, um auf aktuellen Prozessmustern zu trainieren
- Nach bestimmten Zeiträumen, Abteilungen oder Regionen filtern
- Trainingsmenge balancieren durch gleiche Anzahl verschiedener Ergebnis-Kategorien
Beispiel: "Case End Time ist nicht leer UND Outcome ist nicht leer UND Case Start Time ist nach 2024-01-01"
Vorhersagefilter
Vorhersagefilter: Definieren Sie Filterkriterien, welche Fälle bei der Ausführung der Anreicherung Vorhersagen erhalten sollen. Damit können Sie gezielt nur dort vorhersagen, wo es sinnvoll ist oder das Ergebnis noch unbekannt ist.
Typische Vorhersagefilter-Szenarien:
- Nur laufende Fälle einbeziehen (Ergebnis noch unbekannt)
- Nur Fälle mit leerer Vorhersagespalte einbeziehen
- Auf bestimmte Zeiträume oder aktuell aktive Fälle filtern
- Nur Fälle einschließen, die bestimmte Risiko-Kriterien erfüllen
- Nur für Hochwert- oder Prioritätsfälle vorhersagen
Beispiel: "Outcome ist leer UND Case Status ist 'In Progress' UND Case Start Time ist nach 2025-01-01"
Neue Vorhersagespalte
Neue Vorhersagespalte: Legen Sie Namen, Datentyp und Anzeigeformat der neuen Fallattribute fest, die die KI-Vorhersagen speichern. Diese Spalte wird Ihrer Falltabelle hinzugefügt und bei Ausführung der Anreicherung mit den Vorhersagewerten gefüllt.
Konfigurationsoptionen:
- Spaltenname: Interner Name für das neue Attribut (keine Leerzeichen, Unterstriche verwenden)
- Anzeigename: Benutzerfreundlicher Name in Analyse-Dashboards
- Datentyp: Muss mit dem Datentyp Ihrer Vorhersagespalte übereinstimmen (String für Textkategorien, Boolean für wahr/falsch, Integer für numerische Codes)
- Format: Wie die Werte in Visualisierungen dargestellt werden sollen (Text, Zahl, Prozent, etc.)
Beispielkonfigurationen:
- Spaltenname: "predicted_outcome", Anzeigename: "Voraussichtliches Ergebnis", Typ: String
- Spaltenname: "risk_prediction", Anzeigename: "Risikovorhersage", Typ: String
- Spaltenname: "will_delay", Anzeigename: "Wird verzögern", Typ: Boolean
Model Id
Model Id: (Optional) Geben Sie die eindeutige Kennung (GUID) eines zuvor trainierten Modells an, das für Vorhersagen verwendet werden soll. Wenn Sie ein Modell trainieren und speichern, weist mindzieStudio ihm eine eindeutige Model Id zu. Durch Angabe dieser Id können Sie das trainierte Modell erneut verwenden, ohne es neu trainieren zu müssen, und so konsistente Vorhersagen über verschiedene Datensätze oder Zeiträume gewährleisten.
Lassen Sie das Feld leer, wenn die Anreicherung jedes Mal ein neues Modell trainieren soll. Geben Sie eine Model Id an, wenn:
- Sie bereits ein gut funktionierendes Modell trainiert und validiert haben
- Sie Konsistenz durch Nutzung desselben Modells über die Zeit sicherstellen wollen
- Sie Vorhersagen für einen neuen Datensatz mit einem bestehenden Modell machen möchten
- Sie die Rechenkosten für erneutes Training vermeiden möchten
Die Model Id finden Sie in den Ausführungsprotokollen der Anreicherung oder im Modellverwaltungsinterface nach erfolgreichem Modelltraining.
Python-Image
Python Image: Gibt die Python-Ausführungsumgebung an, die für das Ausführen der KI-Modelltrainings- und Vorhersageskripte verwendet wird. mindzieStudio unterstützt mehrere Python-Ausführungsmodi, um verschiedene Bereitstellungsszenarien abzudecken.
Optionen:
- LOCAL: Verwendet die lokale Python-Installation auf dem mindzieStudio-Server. Dies ist die schnellste Option, wenn Python 3.x lokal mit den erforderlichen Machine-Learning-Bibliotheken (pandas, scikit-learn etc.) installiert ist.
- Docker-Image-Name: Gibt ein Docker-Container-Image an, das Python und notwendige Bibliotheken enthält. Beispiel: "python:3.9-slim" oder benutzerdefinierte Images mit vorinstallierten ML-Bibliotheken.
- Python nicht konfiguriert: Zeigt an, dass weder lokal Python noch Docker verfügbar ist. Python-Ausführung muss vor Benutzung der Anreicherung konfiguriert werden.
Standardverhalten:
- Wenn lokal Python verfügbar ist, wird automatisch "LOCAL" ausgewählt.
- Wenn Docker konfiguriert, aber kein lokales Python vorhanden ist, wird das Standard-Docker-Python-Image verwendet.
- Wenn keines verfügbar ist, werden Sie zur Konfiguration von Python aufgefordert.
Für den Produktionseinsatz sind Docker-Images aufgrund von Konsistenz und Isolation empfohlen, während LOCAL bequem für Entwicklung und Tests ist, wenn Sie volle Kontrolle über die Serverumgebung haben.
Beispiele
Beispiel 1: Vorhersage von Genehmigungsergebnissen für Bestellungen
Szenario: Eine Einkaufsabteilung möchte vorhersagen, ob Bestellungen genehmigt oder abgelehnt werden, basierend auf Bestelleigenschaften, um mögliche Ablehnungen frühzeitig zu erkennen und proaktiv mit Antragsstellern die Genehmigungsrate zu verbessern.
Einstellungen:
- Vorhersagetyp: Klassifikation
- Feature-Spalten: Order_Amount, Department, Vendor_Category, Requester_Level, Budget_Available, Previous_Orders_Count, Urgency_Flag
- Vorhersagespalte: Approval_Outcome (enthält "Approved" oder "Rejected" für abgeschlossene Bestellungen)
- Trainingsfilter: "Approval_Outcome is not empty AND Case_End_Time is not empty" (nur abgeschlossene Bestellungen mit bekanntem Ergebnis verwenden)
- Vorhersagefilter: "Approval_Outcome is empty AND Case_Status equals 'Under Review'" (Vorhersage für Bestellungen in Prüfung)
- Neue Vorhersagespalte:
- Spaltenname: predicted_approval
- Anzeigename: Erwartetes Genehmigungsergebnis
- Datentyp: String
- Model Id: (leer – neues Modell trainieren)
- Python Image: LOCAL
Ausgabe: Die Anreicherung erstellt ein neues Fallattribut namens "Erwartetes Genehmigungsergebnis" mit jeweils "Genehmigt" oder "Abgelehnt" für Bestellungen in Prüfung. Die Vorhersage basiert auf Mustern aus historischen Bestellungen, z.B.:
- Bestellungen über 50.000 $ von neuen Lieferanten werden eher abgelehnt
- Bestellungen mit verfügbarer Budget und Antragsteller auf Manager-Ebene oder höher werden eher genehmigt
- Dringende Bestellungen mit vorherigen erfolgreichen Bestellungen beim gleichen Lieferanten haben höhere Genehmigungsraten
Erkenntnisse: Durch Analyse der Vorhersagen entdeckt das Einkaufsteam, dass 23 % der aktuellen Bestellungen in Prüfung voraussichtlich abgelehnt werden. Sie kontaktieren proaktiv Antragsteller von erwarteten Ablehnungen, um zusätzliche Begründungen einzuholen, alternative Lieferanten vorzuschlagen oder große Bestellungen in kleinere Aufträge aufzuteilen. Diese Maßnahmen verbessern die Genehmigungsrate von 78 % auf 89 % und verkürzen die Prozessdauer, indem lange Ablehnungs-/Neuprüfungszyklen vermieden werden.
Beispiel 2: Vorhersage des Rückfallrisikos bei Patienten
Szenario: Ein Krankenhaus möchte vorhersagen, welche entlassenen Patienten innerhalb von 30 Tagen mit hoher Wahrscheinlichkeit wieder aufgenommen werden, um Pflegekoordinatoren gezielte Nachsorge zu ermöglichen und Rückfallraten zu senken.
Einstellungen:
- Vorhersagetyp: Klassifikation
- Feature-Spalten: Patient_Age, Diagnosis_Category, Length_of_Stay, Comorbidity_Count, Prior_Admissions, Discharge_Destination, Medication_Complexity, Social_Support_Score
- Vorhersagespalte: Readmitted_30_Days (enthält "Yes" oder "No" für frühere Entlassfälle)
- Trainingsfilter: "Discharge_Date is not empty AND Days_Since_Discharge >= 30" (nur Fälle mit bekanntem 30-Tage-Ergebnis nutzen)
- Vorhersagefilter: "Discharge_Date is not empty AND Days_Since_Discharge < 30" (Vorhersage für kürzlich entlassene Patienten)
- Neue Vorhersagespalte:
- Spaltenname: readmission_risk_prediction
- Anzeigename: Voraussichtliches Rückfallrisiko
- Datentyp: String
- Model Id: (leer)
- Python Image: LOCAL
Ausgabe: Die Anreicherung fügt ein Attribut "Voraussichtliches Rückfallrisiko" mit Werten "Ja" oder "Nein" für kürzlich entlassene Patienten hinzu. Stichprobenhafte Vorhersagen zeigen:
- Patient ID 45321: Alter 72, Herzinsuffizienz, 8 Tage Aufenthalt, 3 Begleiterkrankungen, Entlassung nach Hause allein = Prognose "Ja"
- Patient ID 45322: Alter 55, kleine Operation, 2 Tage Aufenthalt, keine Begleiterkrankungen, Entlassung mit Familie = Prognose "Nein"
- Patient ID 45323: Alter 68, Pneumonie, 5 Tage Aufenthalt, 2 Begleiterkrankungen, vorherige Aufnahme vor 3 Monaten = Prognose "Ja"
Erkenntnisse: Das Modell identifiziert 78 Patienten der letzten 30 Tage mit hohem Rückfallrisiko. Das Koordinationsteam priorisiert diese Patienten für Hausbesuche, Medikationsüberprüfungen und Nachsorgetermine. Nach 90 Tagen mit Vorhersagen zur Intervention sinkt die tatsächliche Rückfallrate von 22 % auf 14 %, was den Wert der datenbasierten Patientenbetreuung unterstreicht.
Beispiel 3: Vorhersage von Qualitätsmängeln in der Fertigung
Szenario: Ein Fertigungsunternehmen möchte vorhersagen, welche Produktionsaufträge Qualitätsmängel aufweisen werden, basierend auf Anfangsparametern und frühen Produktionsmetriken, damit zusätzliche Qualitätskontrollen implementiert werden können.
Einstellungen:
- Vorhersagetyp: Klassifikation
- Feature-Spalten: Product_Type, Batch_Size, Material_Supplier, Production_Line, Operator_Experience_Level, Temperature_Variance, First_Pass_Yield, Cycle_Time_Deviation
- Vorhersagespalte: Quality_Defect_Found (enthält "Defect" oder "Pass" für abgeschlossene Aufträge)
- Trainingsfilter: "Production_Status equals 'Completed' AND Quality_Inspection_Complete equals true" (nur vollständig geprüfte abgeschlossene Aufträge)
- Vorhersagefilter: "Production_Status equals 'In Progress' AND Percent_Complete >= 25 AND Percent_Complete < 100" (Vorhersage für laufende Aufträge)
- Neue Vorhersagespalte:
- Spaltenname: defect_prediction
- Anzeigename: Vorhergesagtes Qualitätsresultat
- Datentyp: String
- Model Id: (leer)
- Python Image: LOCAL
Ausgabe: Die Anreicherung erzeugt Qualitätsvorhersagen für 156 Aufträge in Bearbeitung. Beispielvorhersagen:
- Auftrag #10045: Große Charge, neuer Materiallieferant, hohe Temperaturabweichung = Prognose "Defekt" (Qualitätsalarm)
- Auftrag #10046: Standardprodukt, erfahrener Bediener, normale Werte = Prognose "Bestanden"
- Auftrag #10047: Komplexes Produkt, Linie B, Zykluszeit 15 % über Normal = Prognose "Defekt" (Qualitätsalarm)
Das System erstellt ein Echtzeit-Dashboard mit prognostizierten Qualitätsmängeln und aktuellem Produktionsstatus, um Eingriffe vor Abschluss zu ermöglichen.
Erkenntnisse: Basierend auf Vorhersagen führt das Qualitätsmanagement verstärkte Prüfungen und Prozessanpassungen für gefährdete Aufträge ein. Innerhalb von 3 Monaten konnten 34 mangelhafte Aufträge vor Endkontrolle gestoppt werden. Die Defektrate sank von 8,2 % auf 4,1 %, und Nacharbeitskosten verringerten sich um 127.000 $. Das Modell zeigt, dass Aufträge mit neuen Lieferanten kombiniert mit hoher Temperaturabweichung eine 67 % Defektrate haben, was zu neuen Lieferantenqualifizierungen und strengeren Temperaturkontrollen führte.
Beispiel 4: Vorhersage des Kreditausfallrisikos
Szenario: Eine Finanzinstitution möchte vorhersagen, welche genehmigten Kreditanträge innerhalb der ersten 12 Monate ausfallen, um Risikomanager zu befähigen, Kreditkonditionen anzupassen, zusätzliche Sicherheiten zu verlangen oder häufigere Überwachung durchzuführen.
Einstellungen:
- Vorhersagetyp: Klassifikation
- Feature-Spalten: Loan_Amount, Credit_Score, Debt_to_Income_Ratio, Employment_Duration, Loan_Purpose, Property_Value, Down_Payment_Percent, Previous_Loans
- Vorhersagespalte: Defaulted_12_Months (enthält "Default" oder "Performing" für Kredite mit mind. 12 Monaten Historie)
- Trainingsfilter: "Loan_Origination_Date < '2024-01-01' AND Months_Since_Origination >= 12" (nur Kredite mit bekanntem 12-Monats-Ergebnis)
- Vorhersagefilter: "Loan_Status equals 'Active' AND Months_Since_Origination < 12" (für aktuelle Kredite)
- Neue Vorhersagespalte:
- Spaltenname: default_risk_prediction
- Anzeigename: Prognose des Ausfallrisikos
- Datentyp: String
- Model Id: a1b2c3d4-e5f6-7890-a1b2-c3d4e5f6g7h8 (verwendet zuvor trainiertes und validiertes Modell)
- Python Image: LOCAL
Ausgabe: Die Anreicherung wendet das trainierte Modell auf 892 aktive Kredite der letzten 12 Monate an und generiert Ausfallrisikovorhersagen:
- 724 Kredite prognostiziert als "Performing" (niedriges Risiko)
- 168 Kredite prognostiziert als "Default" (hohes Risiko)
Beispiel für Hochrisikovorhersagen:
- Kredit #50012: $320K, Credit Score 640, DTI 42 %, Beschäftigungsdauer 8 Monate = "Default"
- Kredit #50034: $180K, Credit Score 680, DTI 38 %, vorherige verspätete Zahlungen = "Default"
- Kredit #50078: $425K, Credit Score 655, DTI 45 %, hoher Beleihungsauslauf = "Default"
Erkenntnisse: Das Risikomanagement segmentiert das Portfolio in prognostizierte Risikostufen und implementiert differenzierte Überwachungsstrategien. Hochrisiko-Kredite erhalten monatliche Prüfungen statt quartalsweise bei Niedrigrisiko. Preisgestaltungsmodelle wurden angepasst, um Zinssätze für Hochrisikoprofile um 0,5-1,0 % zu erhöhen. Nach 12 Monaten beträgt die Modellgenauigkeit 82 %, und die proaktive Überwachung reduziert tatsächliche Ausfälle bei Hochrisiko-Krediten von 15 % auf 9 % und spart geschätzte 2,3 Mio. $.
Beispiel 5: Vorhersage der Lösung von Kundenservice-Fällen
Szenario: Eine Kundenservice-Organisation möchte vorhersagen, ob Support-Tickets innerhalb der Ziel-SLA-Zeit gelöst werden, um Fälle mit Risiko frühzeitig zu eskalieren und SLA-Compliance zu verbessern.
Einstellungen:
- Vorhersagetyp: Klassifikation
- Feature-Spalten: Issue_Category, Customer_Tier, Complexity_Score, Assigned_Team, Initial_Response_Time, Customer_Sentiment, Product_Version, Similar_Cases_Count
- Vorhersagespalte: Resolved_Within_SLA (enthält "Yes" oder "No" für abgeschlossene Tickets)
- Trainingsfilter: "Ticket_Status equals 'Closed' AND Close_Date is not empty" (nur abgeschlossene Tickets)
- Vorhersagefilter: "Ticket_Status equals 'Open' AND Hours_Since_Creation >= 2 AND Hours_Since_Creation < 24" (für kürzlich geöffnete Tickets)
- Neue Vorhersagespalte:
- Spaltenname: sla_compliance_prediction
- Anzeigename: Prognose der SLA-Einhaltung
- Datentyp: String
- Model Id: (leer)
- Python Image: LOCAL
Ausgabe: Die Anreicherung prognostiziert die SLA-Einhaltung für 234 aktuell offene Tickets. Beispielvorhersagen:
- Ticket #7845: Abrechnungsproblem, Premiumkunde, Komplexität 2, Team A, 15 Min Reaktionszeit = Prognose "Ja"
- Ticket #7846: Technischer Fehler, Standardkunde, Komplexität 8, Team B, 45 Min Reaktionszeit = Prognose "Nein" (Eskalation ausgelöst)
- Ticket #7847: Passwort zurücksetzen, Basiskunde, Komplexität 1, Team C, 5 Min Reaktionszeit = Prognose "Ja"
Die Vorhersagen werden im Support-Dashboard farbcodiert angezeigt: Grün für SLA-Erfüllung, Rot für SLA-Verstöße.
Erkenntnisse: Support-Manager nutzen die Vorhersagen, um risikobehaftete Tickets frühzeitig an Senior-Engineer weiterzuleiten oder mit zusätzlichen Ressourcen zu versehen. Nach 6 Monaten steigt die SLA-Einhaltungsrate von 83 % auf 91 %. Das Modell zeigt, dass Tickets mit hoher Komplexität, die Team B und Peak-Zeiten zugeordnet sind, nur 58 % Chance auf SLA-Erfüllung haben, was zu Lastenausgleich und zusätzlichem Training führt. Außerdem wurde erkannt, dass die erste Reaktionszeit der stärkste Prädiktor für Gesamtbearbeitungsdauer ist, woraus neue Richtlinien entstanden, die Antwortzeiten innerhalb 15 Minuten sicherstellen.
Vorgefertigte Python-Vorlagen verwenden
Der Schnellstart-Abschnitt oben listet die drei herunterladbaren Pakete und deren Anwendungsbereiche auf. Dieser Abschnitt beschreibt den vollständigen Upload-Workflow, welche Aufgaben die Vorlagen automatisch übernehmen und wie Sie sie anpassen können.
Wenn Sie die KI-Fallvorhersage-Anreicherung ohne Angabe einer Model Id ausführen, generiert mindzieStudio ein Platzhalter-Python-Skript, das zufällige Vorhersagen liefert. Das ist beabsichtigt – das Skript dient als Ausgangspunkt, um echtes maschinelles Lernen einzubinden. Die vorgefertigten Vorlagen ersetzen diesen Platzhalter durch ein echtes scikit-learn-Modell, das aus Ihren Daten trainiert und Vorhersagen in ein neues Fallattribut schreibt.
Schritt-für-Schritt-Workflow
Dieser Workflow verwendet die bestehende Modell hochladen-Funktion des KI-Fallvorhersage-Blocks. Lokales Python ist nicht erforderlich, und es funktioniert mit jeder ausgelieferten Version von mindzieStudio.
1. Konfigurieren Sie die KI-Fallvorhersage-Anreicherung
Stellen Sie Vorhersagetyp, Feature-Spalten, Vorhersagespalte, die beiden Filterlisten und die Neue Vorhersagespalte wie oben im Einstellungsabschnitt beschrieben ein. Speichern Sie den Block. Lassen Sie das Feld Model Id vorerst leer.
2. Laden Sie das passende Vorlagenpaket herunter
Klicken Sie in der obigen Tabelle auf den Link, der zu Ihrer Vorhersagespalte passt. Speichern Sie die ZIP-Datei auf Ihrem Computer. Entpacken Sie sie nicht – laden Sie sie unverändert hoch.
3. Laden Sie die ZIP über das Menü Modell hochladen
Öffnen Sie im KI-Fallvorhersage-Block in mindzieStudio das Block-Menü und wählen Sie Modell hochladen. Wählen Sie die gerade heruntergeladene ZIP-Datei aus. mindzieStudio entpackt das Paket und vergibt eine eindeutige Model Id.
4. Fügen Sie die Model Id in die Anreicherung ein
Kopieren Sie die von mindzieStudio angezeigte Model Id und fügen Sie sie im Feld Model Id im KI-Fallvorhersage-Editor ein. Speichern Sie.
5. Führen Sie die Anreicherung aus
Beim nächsten Ausführen schreibt mindzieStudio basierend auf den aktuellen Trainings- und Vorhersagefiltern neue Training.csv und Prediction.csv, verwendet die hochgeladenen Modell-Dateien und führt python script.py im konfigurierten Python-Image aus. Die Vorlage lädt die Daten, trainiert ein RandomForest-Modell, sagt vor und schreibt das Ergebnis zurück ins neue Fallattribut. Es sind keine weiteren Nutzeraktionen nötig.
Bei folgenden Ausführungen wird auf den aktuellen Trainingsfilterdaten neu trainiert, so dass sich das Modell mit wachsenden Daten anpasst. Wenn Sie ein Modell möchten, das sich nicht bei jedem Lauf neu trainiert, siehe Modellanpassung unten.
Was die Vorlagen automatisch übernehmen
Sie schreiben keine einzige Python-Zeile. Die Vorlagen erledigen:
- Generische Spaltenerkennung – Feature-Spalten, Zielspalte und Fall-ID werden zur Laufzeit aus
Training.schemaausgelesen, sodass beliebige Attributnamen unterstützt werden. - Numerische Features – Mittelwert-Imputation für fehlende Werte.
- Kategoriale / String-Features – One-Hot-Codierung mit sicherer Behandlung unbekannter Kategorien bei Vorhersage.
- Trainings-/Testsplitt – 80/20 Hold-Out für Genauigkeitsberichterstattung (stratifiziert für Klassifikatoren, regulär für Regression).
- Klassendiskrepanz – Das Mehrklassen-Modell nutzt
class_weight='balanced'und entfernt extrem seltene Klassen (weniger als 2 Zeilen). - Typkorrekte Ausgabe – Vorhersagen werden auf den Datentyp der Zielspalte konvertiert, damit mindzieStudio sie korrekt einliest: Int32, Int64, Single, Double, Boolean, String oder TimeSpan-in-Sekunden.
Was die Vorlagen (noch) nicht tun
Die Vorlagen sind einfache Einstiegsbeispiele. Sie tun nicht:
- Persistierung des trainierten Modells zwischen Läufen – bei jedem Lauf wird neu trainiert. Das ist schnell (Sekunden bis Minuten bei typischen Logs), aber bei sehr großen Datenmengen relevant.
- Suche nach optimalen Hyperparametern – nur sinnvolle Standardwerte.
- Feature-Engineering aus Datumszeit-Attributen – wenn Sie Datumsangaben in Features haben, extrahieren Sie numerische Bestandteile (Wochentag, Monat, Stunde) mit einem Rechner vor der Anreicherung.
- Umgang mit sehr großen Datensätzen – getestet bis ca. 100.000 Fälle. Bei größeren Datenmengen Subsampling im Trainingsfilter erwägen.
Modellanpassung
Wenn der Standard-RandomForest-Algorithmus nicht passt oder Sie Hyperparameter, Feature-Engineering oder eigene Algorithmen hinzufügen wollen, bestehen alle Vorlagenpakete aus drei einfachen Python-Dateien in einem ZIP:
model_trainer.py– Algorithmus; die einzige Datei, die Sie bearbeiten müssenmindzie_helper.py– schema-basierter CSV-Lader (nicht bearbeiten)script.py– Einstiegspunkt (nicht bearbeiten)
So passen Sie an:
- Entpacken Sie das Vorlagenpaket auf Ihrem Rechner.
- Bearbeiten Sie
model_trainer.py– ändern Sie Algorithmus, Hyperparameter oder Vorverarbeitung. - Zippen Sie die drei Dateien wieder ohne umgebenden Ordner.
- Laden Sie das neue ZIP wie unter Schritt 3 beschrieben hoch.
Um Ihre Änderungen lokal zu testen, führen Sie in mindzieStudio eine KI-Fallvorhersage ohne Model Id aus, klicken Sie im Block-Menü auf Paket herunterladen. Es enthält die drei Skripte plus echte in/Training.csv und in/Prediction.csv. Ersetzen Sie model_trainer.py durch Ihre Version und führen Sie python script.py im entpackten Ordner aus. Die Ausgabe erscheint in out/Prediction.csv.
Algorithmusübersicht
| Vorlage | Schätzer | Besondere Einstellungen |
|---|---|---|
| Binärer Klassifikator | RandomForestClassifier |
n_estimators=200, min_samples_leaf=2, stratifizierter Split |
| Mehrklassen-Klassifikator | RandomForestClassifier |
n_estimators=300, class_weight='balanced', Rare-Class-Filter |
| Regressor | RandomForestRegressor |
n_estimators=300, min_samples_leaf=2, Ganzzahrrundung |
Alle drei verwenden dieselbe Vorverarbeitungspipeline: ColumnTransformer mit SimpleImputer(median) für numerische Werte und SimpleImputer(constant) + OneHotEncoder(handle_unknown='ignore') für kategoriale Werte, eingebettet in eine Pipeline, sodass die Vorverarbeitung zur Vorhersagezeit genau wie beim Training erfolgt.
Erforderliche Python-Umgebung
Wenn Sie lokal statt per Docker arbeiten, installieren Sie die benötigten Pakete:
pip install pandas==2.1.4 numpy==1.26.3 scikit-learn==1.4.0
Diese Versionen entsprechen den Abhängigkeiten im Image mindzie_windows_python3_11:V01, sodass das Verhalten lokal und im Container identisch ist.
Ausgabe
Wenn die KI-Fallvorhersage-Anreicherung erfolgreich ausgeführt wird, erzeugt sie ein neues Fallattribut in Ihrem Datensatz mit dem in „Neue Vorhersagespalte“ festgelegten Namen. Dieses Attribut wird als abgeleitete Spalte der Falltabelle hinzugefügt und erscheint zusammen mit anderen Fallattributen in Analysedashboards, Filtern und Visualisierungen.
Vorhersagewerte
Die Werte in der neuen Vorhersagespalte hängen vom Datentyp Ihrer Vorhersagespalte ab:
Für String-(Text-)Vorhersagen:
- Die Spalte enthält Textwerte mit Kategorien aus Ihren Trainingsdaten
- Beispiel: "Genehmigt", "Abgelehnt", "Hohes Risiko", "Niedriges Risiko", "Verzögert", "Pünktlich"
- Diese Werte können in Filtern, Gruppierungen und Farbkennungen verwendet werden
Für Boolesche Vorhersagen:
- Die Spalte enthält Wahr-/Falsch-Werte
- Beispiel: Wahr = "Wird ausfallen", Falsch = "Wird nicht ausfallen"
- Ideal für binäre Ergebnisvorhersagen und einfache Ja/Nein-Klassifikation
Für Ganzzahlvorhersagen:
- Die Spalte enthält numerische Codes für Kategorien
- Beispiel: 0 = "Niedriges Risiko", 1 = "Mittleres Risiko", 2 = "Hohes Risiko"
- Nützlich, wenn Kategorien eine natürliche numerische Reihenfolge haben
Verwendung der Vorhersageergebnisse
Nach Erstellung der Vorhersagespalte können Sie diese in mindzieStudio vielseitig nutzen:
In Filtern:
- Fälle mit hohem Risiko filtern: "Vorhergesagtes Risiko = 'Hohes Risiko'"
- Niedrigrisikofälle von Detailanalysen ausschließen: "Vorhergesagtes Ergebnis != 'Niedriges Risiko'"
- Vorhersagen mit anderen Kriterien verknüpfen: "Vorhergesagte Verzögerung = 'Ja' UND Bestellmenge > 10.000 $"
In Dashboards:
- Leistungskurven erstellen, gruppiert nach vorhergesagtem Ergebnis
- Vorhersagen farblich in Prozesskarten anzeigen, um Risiken entlang des Prozesses zu visualisieren
- KPI-Metriken bauen, die Vorhersagegenauigkeit durch Vergleich von Vorhersage vs. Realität ausweisen
- Heatmaps erzeugen, die Risiko nach Abteilungen, Produkten oder Zeit anzeigen
In weiteren Anreicherungen:
- Vorhersagen als Eingabewert für Kalkulatoren nutzen (z.B. "High Risk Score", der vorhergesagtes Risiko bewertet)
- Mit anderen Anreicherungen kombinieren, um zusammengesetzte Risiko-Scores zu erzeugen
- Als Filterkriterium für zielgerichtete Anreicherungen verwenden (z.B. "Compliance-Check nur für vorhergesagte Nicht-Konformität")
Für Prozessverbesserung:
- Prozessmuster mit negativen Vorhersagen identifizieren
- Prozessumgestaltung auf Aktivitäten mit größtem Einfluss auf negative Vorhersagen priorisieren
- Vorhersagetrends über Zeit überwachen, um Prozessverbesserungen zu messen
- Vorhersageergebnisse mit tatsächlichen Ergebnissen vergleichen, um Modell zu validieren und zu verfeinern
Modellausgabe im Training
Beim Trainieren eines neuen Modells (wenn keine Model Id angegeben ist) erzeugt die Anreicherung zusätzlich