AI Case Voorspelling

Snel aan de slag: Vooraf gebouwde Python-sjablonen

mindzie levert drie kant-en-klare templatepakketten die je direct kunt uploaden zodat je AI Case Voorspelling kunt gebruiken zonder Python te schrijven. Kies degene die overeenkomt met je Predict Value Column, download het zipbestand en upload dit via het menu Upload Model van de AI Case Prediction-blok - dat is alles.

Template Gebruik wanneer de Predict Value Column... Typische voorbeelden Download
Binary Classifier Exact 2 categorieën "Approved" / "Rejected", True / False, 0 / 1, "Pass" / "Fail" mindzie_ai_binary_classifier_v1.zip
Multi-class Classifier 3 of meer categorieën "Low" / "Medium" / "High", regiocodes, statuscategorieën mindzie_ai_multiclass_classifier_v1.zip
Regressor Een continue numerieke waarde duur in seconden, dollarbedrag, itemaantal, percentage mindzie_ai_regressor_v1.zip

Alle drie pakketten zijn generiek - ze lezen kolomnamen en typen uit de schema-bestanden die mindzieStudio tijdens runtime schrijft, dus ze werken met elke combinatie van feature- en targetkolomnamen. Je hoeft niets binnen het zipbestand aan te passen.

De volledige upload workflow met screenshots, wat elk template automatisch behandelt, en hoe ze aan te passen zijn, vind je in Pre-Built Python Templates gebruiken verderop op deze pagina.

Overzicht

De AI Case Prediction verrijking stelt je in staat om machine learning en kunstmatige intelligentie te benutten voor het doen van voorspellingen over case-uitkomsten, gedragingen of kenmerken op basis van historische patronen in je procesdata. Deze krachtige verrijking traint voorspellende modellen op basis van je bestaande case-kenmerken en past die vervolgens toe om onbekende waarden te voorspellen voor huidige of toekomstige cases.

In tegenstelling tot traditionele regel-gebaseerde verrijkingen gebruikt AI Case Prediction statistische leeralgoritmen om complexe patronen en relaties in je data te ontdekken die niet direct zichtbaar zijn. De verrijking ondersteunt classificatietaken (het voorspellen van categorieën of uitkomsten) en kan zowel trainingsmodelcreatie als voorspellingsuitrol binnen je process mining workflow aan.

Deze verrijking is bijzonder waardevol voor procesoptimalisatie, risicomanagement en proactieve besluitvorming. Door case-uitkomsten vroeg in de proceslevenscyclus te voorspellen, kun je preventieve acties nemen, middelen effectiever toewijzen en potentiële problemen vroegtijdig signaleren.

Veelvoorkomende toepassingen

  • Uitkomstvoorspelling: Voorspel of een case wordt goedgekeurd of afgewezen, op tijd wordt afgerond of vertraagd is, succesvol of mislukt op basis van vroege case-kenmerken
  • Risicobeoordeling: Identificeer risicovolle cases die waarschijnlijk problemen krijgen, herwerk vereisen, of leiden tot klantklachten
  • Duurvoorspelling: Voorspel hoe lang een case zal duren op basis van initiële kenmerken en huidige voortgang
  • Middelenallocatie: Voorspel welke cases gespecialiseerde behandeling of extra middelen nodig hebben op basis van complexiteitsindicatoren
  • Klantenbehoud: Voorspel welke klantcases risico lopen op annulering of afhakking op basis van gedragspatronen
  • Kwaliteitsvoorspelling: Voorspel of een case aan kwaliteitsnormen voldoet of extra inspectie nodig heeft op basis van procesuitvoeringspatronen
  • Kostenschatting: Voorspel de uiteindelijke kosten van een case op basis van initiële parameters en vroege activiteitspatronen

Instellingen

Prediction Type

Prediction Type: Specificeert het type machine learning-taak dat wordt uitgevoerd. Momenteel ondersteunt de verrijking Classificatie, die categorische uitkomsten of klassen voorspelt.

  • Classificatie: Gebruiken voor het voorspellen van discrete categorieën of uitkomsten zoals "Approved/Rejected", "High Risk/Low Risk", "On Time/Delayed" of elke categorische eigenschap. Het model leert cases te classificeren in vooraf gedefinieerde groepen op basis van patronen in de featurekolommen.
  • Regressie: (Toekomst) Zal continue numerieke waarden voorspellen zoals duur, kosten of hoeveelheden
  • Clustering: (Toekomst) Zal soortgelijke cases zonder vooraf gedefinieerde categorieën groeperen
  • Tijdreeksen: (Toekomst) Zal temporele patronen en sequenties voorspellen
  • Anomaliedetectie: (Toekomst) Zal ongebruikelijke of afwijkende cases identificeren
  • Aanbeveling: (Toekomst) Zal optimale volgende acties of activiteiten voorstellen

Voor de meeste zakelijke toepassingen is Classificatie de juiste keuze wanneer je een specifieke uitkomst wilt voorspellen die in aparte categorieën valt.

Feature Columns

Feature Columns: Selecteer de case-kenmerken die worden gebruikt als inputfeatures voor training en voorspelling. Dit zijn de onafhankelijke variabelen die het AI-model analyseert om voorspellingen te doen. Kies kenmerken waarvan je denkt dat ze van invloed zijn op of correleren met de uitkomst die je wilt voorspellen.

Beste praktijken voor selectie van featurekolommen:

  • Neem kenmerken op die vroeg in de levenscyclus van een case bekend zijn als je vroeg wilt voorspellen
  • Selecteer kenmerken met goede datakwaliteit (minimale missende waarden)
  • Neem zowel categorische als numerieke kenmerken op voor rijkere patronen
  • Vermijd het selecteren van de targetkolom (de kolom die je voorspelt) als feature
  • Overweeg domeinkennis over welke factoren uitkomsten beïnvloeden
  • Begin met 3-10 relevante features; te veel kan de modelnauwkeurigheid verminderen

Voorbeelden van bruikbare featurekolommen:

  • Klanttype, regio of segment
  • Bestelbedrag, prioriteit, of categorie
  • Kenmerken van initiële aanvraag
  • Toewijzingen van middelen of afdeling
  • Tijdgebonden kenmerken (dag van de week, maand, seizoen)

Predict Value Column

Predict Value Column: Selecteer de case-kenmerk die de bekende uitkomsten bevat waar het model van moet leren tijdens training. Dit is de afhankelijke variabele of target die het model voorspelt voor nieuwe cases. Deze kolom moet bekende waarden bevatten in je trainingsdata, maar kan leeg zijn voor cases waarvoor je voorspellingen wilt doen.

Voor Classification prediction type zijn geldige kolommen:

  • String-eigenschappen (teksten zoals "Approved", "Rejected", "Pending")
  • Boolean-eigenschappen (waar/onwaar uitkomsten)
  • Integer-eigenschappen (numerieke codes die categorieën representeren)

De Predict Value Column moet:

  • De daadwerkelijke uitkomst bevatten die je wilt voorspellen
  • Genoeg voorbeelden van elke categorie bevatten in de trainingsdata
  • De belangrijkste zakelijke uitkomst zijn die je wilt voorspellen
  • Niet beschikbaar of bekend zijn op het moment dat je de voorspelling doet

Training Filters

Training Filters: Definieer filtercriteria om te selecteren welke cases worden gebruikt om het AI-model te trainen. Hiermee gebruik je alleen cases van hoge kwaliteit en volledig ingevuld en sluit je cases uit die niet representatief zijn of onvolledige data hebben.

Veelvoorkomende scenarios voor trainingsfilters:

  • Alleen voltooide cases omvatten (exclusief lopende cases)
  • Alleen cases waar predict value bekend is (niet leeg)
  • Cases met datakwaliteitsproblemen of missende featurewaarden uitsluiten
  • Alleen recente cases opnemen om te trainen op actuele procespatronen
  • Filter op specifieke tijdsperiodes, afdelingen of regio’s
  • Trainingsset balanceren door gelijke aantallen per uitkomstcategorie op te nemen

Voorbeeld: "Case End Time is niet leeg EN Outcome is niet leeg EN Case Start Time is na 2024-01-01"

Prediction Filters

Prediction Filters: Definieer filtercriteria om te selecteren welke cases voorspellingen krijgen wanneer de verrijking draait. Dit laat je selectief voorspellen voor cases waar voorspellingen het meest waardevol zijn of waar de uitkomst nog onbekend is.

Veelvoorkomende scenarios voor predictiefilters:

  • Alleen lopende cases omvatten (waar uitkomst nog onbekend is)
  • Alleen cases waar predict value leeg is
  • Filteren op specifieke tijdsperiodes of huidige actieve cases
  • Alleen cases opnemen die aan bepaalde risicocriteria voldoen
  • Alleen voorspellen voor cases met hoge waarde of prioriteit

Voorbeeld: "Outcome is leeg EN Case Status is 'In Progress' EN Case Start Time is na 2025-01-01"

Nieuwe Voorspellingskolom

New Prediction Column: Definieer de naam, het datatype en het weergaveformaat voor de nieuwe case-kenmerk die de AI-voorspellingen gaat opslaan. Deze kolom wordt toegevoegd aan je casetabel en gevuld met de voorspelde waarden wanneer de verrijking wordt uitgevoerd.

Configuratieopties:

  • Kolomnaam: Interne naam voor het nieuwe attribuut (geen spaties, gebruik underscores)
  • Weergavenaam: Gebruiksvriendelijke naam getoond in analysetools
  • Datatype: Moet overeenkomen met het datatype van je Predict Value Column (String voor tekstcategorieën, Boolean voor waar/onwaar, Integer voor numerieke codes)
  • Formaat: Hoe de waarden worden weergegeven in visualisaties (Tekst, Nummer, Percentage, etc.)

Voorbeeldconfiguraties:

  • Kolomnaam: "predicted_outcome", Weergavenaam: "Voorspelde Uitkomst", Type: String
  • Kolomnaam: "risk_prediction", Weergavenaam: "Risiconiveau Voorspelling", Type: String
  • Kolomnaam: "will_delay", Weergavenaam: "Voorspeld Vertraging", Type: Boolean

Model Id

Model Id: (Optioneel) Specificeer het unieke identificatienummer (GUID) van een eerder getraind model om te gebruiken voor voorspellingen. Wanneer je een model traint en opslaat, kent mindzieStudio dit een unieke Model Id toe. Door deze Id op te geven kun je het getrainde model hergebruiken zonder opnieuw te trainen, wat consistente voorspellingen garandeert over verschillende datasets of tijdsperioden.

Laat dit veld leeg als je wilt dat de verrijking telkens een nieuw model traint. Geef een Model Id op wanneer:

  • Je al een goed werkend model hebt getraind en gevalideerd
  • Je consistentie wilt door hetzelfde model herhaald te gebruiken
  • Je voorspellingen toepast op een nieuwe dataset met een bestaand model
  • Je de rekentijd voor opnieuw trainen wilt vermijden

De Model Id is te vinden in de uitvoering logs van de verrijking of in de modelbeheerinterface na succesvolle training.

Python Image

Python Image: Specificeert de Python-uitvoeringsomgeving die wordt gebruikt om de AI-model training en voorspellingsscripts uit te voeren. mindzieStudio ondersteunt meerdere Python-uitvoermodi om verschillende deployment scenario's te accommoderen.

Opties:

  • LOCAL: Gebruikt de lokale Python-installatie op de mindzieStudio server. Dit is de snelste optie als Python 3.x lokaal geïnstalleerd is met de benodigde machine learning bibliotheken (pandas, scikit-learn, etc.)
  • Docker Image Name: Specificeert een Docker container image met Python en benodigde libraries. Bijvoorbeeld: "python:3.9-slim" of aangepaste images met vooraf geïnstalleerde ML-bibliotheken
  • Python niet geconfigureerd: Geeft aan dat noch lokaal Python, noch Docker beschikbaar is. Je moet Python uitvoeren configureren voordat je deze verrijking kunt gebruiken.

Standaardgedrag:

  • Als lokaal Python beschikbaar is, kiest het automatisch "LOCAL"
  • Als Docker is geconfigureerd maar geen lokaal Python, gebruikt hij de standaard Docker Python image
  • Als geen van beide beschikbaar is, wordt gevraagd Python configuratie te doen

Voor productiegebruik worden Docker images aanbevolen voor consistentie en isolatie, terwijl LOCAL handig is voor ontwikkeling en testen wanneer je volledige controle hebt over de serveromgeving.

Voorbeelden

Voorbeeld 1: Voorspellen goedkeuringsuitkomsten van inkooporders

Scenario: Een inkooporganisatie wil voorspellen of inkooporders worden goedgekeurd of afgewezen op basis van orderkenmerken, zodat ze potentiële afwijzingen vroeg kunnen signaleren en proactief met aanvragers kunnen samenwerken om goedkeuringspercentages te verhogen.

Instellingen:

  • Prediction Type: Classificatie
  • Feature Columns: Order_Amount, Department, Vendor_Category, Requester_Level, Budget_Available, Previous_Orders_Count, Urgency_Flag
  • Predict Value Column: Approval_Outcome (bevat "Approved" of "Rejected" voor afgeronde orders)
  • Training Filters: "Approval_Outcome is niet leeg EN Case_End_Time is niet leeg" (alleen afgeronde orders met bekende uitkomst)
  • Prediction Filters: "Approval_Outcome is leeg EN Case_Status is 'Under Review'" (voorspellen voor orders die nu worden beoordeeld)
  • Nieuwe Voorspellingskolom:
    • Kolomnaam: predicted_approval
    • Weergavenaam: Voorspelde Goedkeuringsuitkomst
    • Datatype: String
  • Model Id: (leeg - nieuw model trainen)
  • Python Image: LOCAL

Uitvoer: De verrijking maakt een nieuw case-attribuut "Voorspelde Goedkeuringsuitkomst" met waarden "Approved" of "Rejected" voor elke order onder beoordeling. De voorspelling is gebaseerd op patronen uit historische orders, zoals:

  • Orders boven $50.000 van nieuwe leveranciers worden vaker afgewezen
  • Orders met budget beschikbaar en requester level "Manager" of hoger worden vaker goedgekeurd
  • Dringende orders met eerdere succesvolle orders van dezelfde leverancier hebben hogere goedkeuringskans

Inzichten: Door de voorspellingen ontdekt het inkoopteam dat 23% van de huidige orders onder beoordeling een afwijzing verwacht. Ze nemen proactief contact op met aanvragers van voorspelde afwijzingen om extra onderbouwing te verzamelen, alternatieve leveranciers voor te stellen of grote orders in kleinere goedkeuringen op te splitsen. Deze interventie verhoogt het goedkeuringspercentage van 78% naar 89% en verkort de procestijd door langdurige afwijzing- en herindieningscycli te voorkomen.

Voorbeeld 2: Voorspelling van heropnames in de zorg

Scenario: Een ziekenhuis wil voorspellen welke ontslagen patiënten een hoog risico lopen op heropname binnen 30 dagen, zodat zorgcoördinatoren gerichte nazorg kunnen bieden en heropnamepercentages kunnen verlagen.

Instellingen:

  • Prediction Type: Classificatie
  • Feature Columns: Patient_Age, Diagnosis_Category, Length_of_Stay, Comorbidity_Count, Prior_Admissions, Discharge_Destination, Medication_Complexity, Social_Support_Score
  • Predict Value Column: Readmitted_30_Days (bevat "Yes" of "No" voor eerdere ontslagen)
  • Training Filters: "Discharge_Date is niet leeg EN Days_Since_Discharge >= 30" (alleen cases waar 30-dagen uitkomst bekend is)
  • Prediction Filters: "Discharge_Date is niet leeg EN Days_Since_Discharge < 30" (voorspellen voor recente ontslagen)
  • Nieuwe Voorspellingskolom:
    • Kolomnaam: readmission_risk_prediction
    • Weergavenaam: Voorspeld Heropname Risico
    • Datatype: String
  • Model Id: (leeg)
  • Python Image: LOCAL

Uitvoer: De verrijking voegt een attribuut "Voorspeld Heropname Risico" toe met "Yes" of "No" voor elke recent ontslagen patiënt. Voorbeelden:

  • Patiënt ID 45321: Leeftijd 72, Hartfalen, 8 dagen verblijf, 3 comorbiditeiten, thuis alleen ontslagen = Voorspeld risico "Yes"
  • Patiënt ID 45322: Leeftijd 55, Kleine operatie, 2 dagen verblijf, geen comorbiditeiten, thuis met familie ontslagen = Voorspeld risico "No"
  • Patiënt ID 45323: Leeftijd 68, Longontsteking, 5 dagen verblijf, 2 comorbiditeiten, opname 3 maanden geleden = Voorspeld risico "Yes"

Inzichten: Het model identificeert 78 patiënten in de afgelopen 30 dagen met hoog risico op heropname. Het zorgcoördinatieteam prioriteert deze patiënten voor thuiszorgbezoeken, medicatiereviews en vervolgafspraken. Na 90 dagen voorspellingsgestuurde interventies daalt het werkelijke heropnamepercentage voor hoogrisicopatiënten van 22% naar 14%, wat het belang van proactieve datagedreven zorg onderstreept.

Voorbeeld 3: Voorspelling kwaliteitsdefecten in productie

Scenario: Een productiebedrijf wil voorspellen welke productieorders kwaliteitsdefecten opleveren op basis van initiële orderparameters en vroege productiemetingen, zodat extra kwaliteitscontroles kunnen worden toegepast voordat defecten optreden.

Instellingen:

  • Prediction Type: Classificatie
  • Feature Columns: Product_Type, Batch_Size, Material_Supplier, Production_Line, Operator_Experience_Level, Temperature_Variance, First_Pass_Yield, Cycle_Time_Deviation
  • Predict Value Column: Quality_Defect_Found (bevat "Defect" of "Pass" voor afgeronde orders)
  • Training Filters: "Production_Status is 'Completed' EN Quality_Inspection_Complete is true" (alleen volledig geïnspecteerde afgeronde orders)
  • Prediction Filters: "Production_Status is 'In Progress' EN Percent_Complete >= 25 EN Percent_Complete < 100" (voorspelling voor orders in productie)
  • Nieuwe Voorspellingskolom:
    • Kolomnaam: defect_prediction
    • Weergavenaam: Voorspelde Kwaliteitsuitkomst
    • Datatype: String
  • Model Id: (leeg)
  • Python Image: LOCAL

Uitvoer: De verrijking genereert kwaliteitsvoorspellingen voor 156 orders die nu in productie zijn. Voorbeelden:

  • Order #10045: Grote batch, nieuwe materiaalleverancier, hoge temperatuurvariatie = Voorspeld "Defect" (kwaliteitswaarschuwing)
  • Order #10046: Standaardproduct, ervaren operator, normale waarden = Voorspeld "Pass"
  • Order #10047: Complex product, Productielijn B, cyclustijd 15% boven normaal = Voorspeld "Defect" (kwaliteitswaarschuwing)

Het systeem maakt een realtime kwaliteitsdashboard met voorspelde defecten naast de actuele productiestatus, waardoor kwaliteitsingenieurs kunnen ingrijpen voordat orders worden afgerond.

Inzichten: Met de voorspellingen voert het kwaliteitsteam extra inspecties en procesaanpassingen uit voor orders met voorspelde defecten. Over 3 maanden voorkwamen ze 34 defecte orders door vroegtijdige detectie. De defectrate daalde van 8,2% naar 4,1%, en de kosten voor herwerk verminderden met $127.000. Het model toonde dat orders met nieuwe leverancier plus hoge temperatuurvariatie een defectkans van 67% hebben, leidend tot aangepaste leverancierskwalificatie en strengere temperatuurbewaking.

Voorbeeld 4: Voorspelling van kredietrisico op leningen

Scenario: Een financiële instelling wil voorspellen welke goedgekeurde leningen waarschijnlijk binnen 12 maanden in gebreke blijven, zodat risicomanagers leningsvoorwaarden kunnen aanpassen, extra zekerheden kunnen eisen of vaker kunnen monitoren bij risicovolle leningen.

Instellingen:

  • Prediction Type: Classificatie
  • Feature Columns: Loan_Amount, Credit_Score, Debt_to_Income_Ratio, Employment_Duration, Loan_Purpose, Property_Value, Down_Payment_Percent, Previous_Loans
  • Predict Value Column: Defaulted_12_Months (bevat "Default" of "Performing" voor leningen met 12+ maanden historie)
  • Training Filters: "Loan_Origination_Date < '2024-01-01' EN Months_Since_Origination >= 12" (alleen leningen met bekende 12-maanden uitkomsten)
  • Prediction Filters: "Loan_Status is 'Active' EN Months_Since_Origination < 12" (voorspellen voor recente leningen)
  • Nieuwe Voorspellingskolom:
    • Kolomnaam: default_risk_prediction
    • Weergavenaam: Voorspeld Kredietrisico
    • Datatype: String
  • Model Id: a1b2c3d4-e5f6-7890-a1b2-c3d4e5f6g7h8 (met een eerder getraind en gevalideerd model)
  • Python Image: LOCAL

Uitvoer: De verrijking gebruikt het getrainde model op 892 actieve leningen uit de afgelopen 12 maanden en genereert voorspellingen:

  • 724 leningen voorspeld als "Performing" (laag risico)
  • 168 leningen voorspeld als "Default" (hoog risico)

Enkele voorbeelden van hoog risico:

  • Lening #50012: $320K, credit score 640, DTI 42%, werkplek 8 maanden = "Default"
  • Lening #50034: $180K, credit score 680, DTI 38%, eerdere late betalingen = "Default"
  • Lening #50078: $425K, credit score 655, DTI 45%, hoge loan-to-value ratio = "Default"

Inzichten: Het risicomanagementteam segmenteert de portefeuille in risiconiveaus en implementeert verschillende monitoringsstrategieën. Hoogrisicoloans krijgen maandelijkse check-ins versus kwartaalchecks voor laagrisico. Ze passen ook prijsmodellen aan door rente met 0,5-1,0% te verhogen voor hoogrisicoprofielen. Na 12 maanden tonen voorspellingen 82% accuratesse en daalt het daadwerkelijke defaultpercentage in de hoogrisicocategorie van 15% naar 9%, wat $2,3 miljoen aan verliezen bespaart.

Voorbeeld 5: Voorspelling case-oplossing klantenservice

Scenario: Een klantenserviceorganisatie wil voorspellen of supporttickets binnen de SLA-tijd worden opgelost op basis van initiële ticketkenmerken, zodat ze risicovolle cases vroeg kunnen escaleren en SLA-naleving kunnen verbeteren.

Instellingen:

  • Prediction Type: Classificatie
  • Feature Columns: Issue_Category, Customer_Tier, Complexity_Score, Assigned_Team, Initial_Response_Time, Customer_Sentiment, Product_Version, Similar_Cases_Count
  • Predict Value Column: Resolved_Within_SLA (bevat "Yes" of "No" voor gesloten tickets)
  • Training Filters: "Ticket_Status is 'Closed' EN Close_Date is niet leeg" (alleen gesloten tickets)
  • Prediction Filters: "Ticket_Status is 'Open' EN Hours_Since_Creation >= 2 EN Hours_Since_Creation < 24" (voorspellen voor recent geopende tickets)
  • Nieuwe Voorspellingskolom:
    • Kolomnaam: sla_compliance_prediction
    • Weergavenaam: Voorspelde SLA-Naleving
    • Datatype: String
  • Model Id: (leeg)
  • Python Image: LOCAL

Uitvoer: De verrijking voorspelt SLA-naleving voor 234 open supporttickets. Voorbeeldvoorspellingen:

  • Ticket #7845: Facturatieprobleem, Premium klant, Complexity 2, Team A, 15-min reactietijd = Voorspeld "Yes"
  • Ticket #7846: Technische bug, Standaard klant, Complexity 8, Team B, 45-min reactietijd = Voorspeld "No" (escalatie gestart)
  • Ticket #7847: Wachtwoord reset, Basis klant, Complexity 1, Team C, 5-min reactietijd = Voorspeld "Yes"

De voorspellingen worden in het supportdashboard getoond met kleurcodering: groen voor voorspelde SLA-naleving, rood voor voorspelde SLA-overtreding.

Inzichten: Supportmanagers gebruiken de voorspellingen om risicotickets proactief aan senior engineers over te dragen of extra middelen toe te wijzen. Na 6 maanden stijgt de SLA-naleving van 83% naar 91%. Het model toont dat tickets met hoge complexiteit bij Team B tijdens piekuren slechts 58% kans hebben SLA te halen, leidend tot herverdeling van werk en extra training voor Team B. Ook blijkt dat initiële reactietijd de sterkste voorspeller is van de totale oplossingsduur, waardoor nieuwe beleidsregels voor eerste reacties binnen 15 minuten zijn ingesteld.

Pre-Built Python Templates gebruiken

De sectie Snel Aan De Slag bovenaan deze pagina toont de drie downloadbare pakketten en waar ze voor zijn. Deze sectie begeleidt je door het volledige uploadtraject, wat de templates automatisch afhandelen en hoe je ze kunt aanpassen.

Wanneer je de AI Case Prediction verrijking draait zonder Model Id op te geven, genereert mindzieStudio een placeholder Python-script dat willekeurige voorspellingen produceert. Dit is bewust - het script is een startpunt om echte machine learning logica in te pluggen. De vooraf gebouwde templatepakketten vervangen die placeholder door een echt scikit-learn model dat traint op jouw data en voorspellingen terugschrijft naar een nieuw case-attribuut.

Stapsgewijze workflow

Deze workflow gebruikt de bestaande Upload Model functionaliteit op het AI Case Prediction-blok. Er is geen lokale Python-installatie nodig, en het werkt met elke uitgebrachte versie van mindzieStudio.

1. Stel de AI Case Prediction verrijking in

Configureer Prediction Type, Feature Columns, Predict Value Column, de twee filterlijsten en de New Prediction Column zoals beschreven in de Instellingen hierboven. Sla het blok op. Laat het veld Model Id voorlopig leeg.

2. Download het bijpassende templatepakket

Klik in de tabel hierboven op de link die past bij je Predict Value Column. Sla het zipbestand op je computer op. Pak het niet uit - upload het zo.

3. Upload het via het Upload Model-menu van het blok

Open het blokmenu van het AI Case Prediction blok in mindzieStudio en kies Upload Model. Selecteer het zojuist gedownloade zipbestand. mindzieStudio pakt het uit en kent een unieke Model Id toe.

4. Plak de Model Id in de verrijking

Kopieer het door mindzieStudio getoonde Model Id en plak het in het veld Model Id in de AI Case Prediction editor. Sla op.

5. Voer de verrijking uit

Bij de volgende uitvoering schrijft mindzieStudio verse Training.csv en Prediction.csv uit je huidige training en prediction filters, legt de geüploade modelfiles eroverheen en draait python script.py in de geconfigureerde Python image. De template laadt de data, traint een RandomForest model, doet voorspellingen en schrijft het resultaat terug in het nieuwe caseattribuut. Verder is geen gebruikersactie nodig.

Latere uitvoeringen van dezelfde verrijking trainen opnieuw op wat de training filters op dat moment selecteren, zodat het model meegroeit met je data. Wil je een model dat niet elke run opnieuw traint, zie Model aanpassen hieronder.

Wat de templates automatisch afhandelen

Je hoeft geen regel Python te schrijven. De templates regelen:

  • Generieke kolomdetectie - featurekolommen, targetkolom en case-id worden uit Training.schema gelezen tijdens runtime, dus elke attributenaam werkt.
  • Numerieke features - mediane imputatie voor missende waarden.
  • Categorische/tekstfeatures - one-hot encoding met veilige afhandeling van onbekende categorieën tijdens voorspelling.
  • Train/test splitsing - 80/20 houd-out voor nauwkeurigheidsrapportage (gestratificeerd voor classifiers, standaard voor regressie).
  • Klassenonbalans - de multi-class template gebruikt class_weight='balanced' en laat zeldzame klassen (minder dan 2 rijen) vallen.
  • Type-correcte output - voorspellingen worden teruggezet naar het datatype van de targetkolom zodat mindzieStudio ze correct kan inlezen: Int32, Int64, Single, Double, Boolean, String, of TimeSpan-as-seconds.

Wat de templates (nog) niet doen

De templates zijn bewust eenvoudige startpunten. Ze doen niet:

  • Het getrainde model persistenteren tussen runs - elke run traint van nul af aan. Dit gaat snel (enkele seconden tot een minuut op gebruikelijke event logs) maar kan belangrijk zijn bij zeer grote datasets.
  • Zoeken naar beste hyperparameters - alleen zinnige standaardinstellingen.
  • Features maken uit datetime-attributen - als je datumkolommen in features hebt, haal numerieke onderdelen (weekdag, maand, uur) vooraf met een calculator daarvoor uit.
  • Omgaan met zeer grote datasets - getest tot ~100k cases. Bij grotere datasets overweeg sub-sampling in de Training Filters.

Model aanpassen

Als het standaard RandomForest algoritme niet past bij je probleem, of je wilt hyperparameter tuning, feature engineering of een eigen algoritme toevoegen, elk templatepakket bevat slechts drie gewone Python-bestanden in een zip:

  • model_trainer.py - het algoritme; dit is het enige bestand dat je ooit hoeft aan te passen
  • mindzie_helper.py - schema-bewuste CSV-loader (niet aanpassen)
  • script.py - het entrypoint (niet aanpassen)

Om aan te passen:

  1. Pak het templatepakket uit op je computer.
  2. Bewerk model_trainer.py - wijzig algoritme, hyperparameters of pre-processing.
  3. Zip de drie bestanden opnieuw zonder overkoepelende map.
  4. Upload de nieuwe zip via Upload Model zoals in stap 3.

Wil je lokaal testen voordat je uploadt, voer dan een AI Case Prediction verrijking een keer uit in mindzieStudio met leeg Model Id veld, klik op Download Package in het blokmenu. De download bevat dezelfde drie bestanden plus echte in/Training.csv en in/Prediction.csv. Vervang model_trainer.py door jouw versie en draai python script.py vanuit de uitgepakte map. De output verschijnt in out/Prediction.csv.

Algoritme Referentie

Template Estimator Opmerkelijke instellingen
Binary Classifier RandomForestClassifier n_estimators=200, min_samples_leaf=2, gestratificeerde split
Multi-class Classifier RandomForestClassifier n_estimators=300, class_weight='balanced', zeldzame klasse-regeling
Regressor RandomForestRegressor n_estimators=300, min_samples_leaf=2, afronding integer

Alle drie gebruiken dezelfde pre-processing pipeline: ColumnTransformer met SimpleImputer(median) voor numerieken en SimpleImputer(constant) + OneHotEncoder(handle_unknown='ignore') voor categorische features, verpakt in één Pipeline zodat de pre-processing bij voorspellen exact overeenkomt met training.

Vereiste Python-omgeving

Als je lokaal werkt in plaats van de Docker image te gebruiken, installeer dan de volgende pakketten:

pip install pandas==2.1.4 numpy==1.26.3 scikit-learn==1.4.0

Deze versies matchen de vastgezette dependencies in mindzie_windows_python3_11:V01, dus het gedrag is identiek ongeacht lokaal draaien of in de Docker container.

Output

Wanneer de AI Case Prediction verrijking succesvol draait, maakt het een nieuw caseattribut aan in je dataset met de naam die je heb opgegeven in de "New Prediction Column" configuratie. Dit attribuut wordt toegevoegd als een afgeleide kolom in de casetabel en verschijnt naast je andere caseattributen in alle analyse dashboards, filters en visualisaties.

Voorspellingswaarden

De opgeslagen waarden in de nieuwe voorspellingskolom hangen af van het datatype van je Predict Value Column:

Voor String (Tekst) Voorspellingen:

  • De kolom bevat tekstwaarden overeenkomend met categorieën uit je trainingsdata
  • Voorbeeld: "Approved", "Rejected", "High Risk", "Low Risk", "Delayed", "On Time"
  • Deze waarden zijn bruikbaar in filters, groeperingen en kleurcodering in dashboards

Voor Boolean Voorspellingen:

  • De kolom bevat True of False waarden
  • Voorbeeld: True = "Zal in gebreke blijven", False = "Blijft niet in gebreke"
  • Ideaal voor binaire uitkomstvoorspellingen en simpele ja/nee-classificaties

Voor Integer Voorspellingen:

  • De kolom bevat numerieke codes die categorieën representeren
  • Voorbeeld: 0 = "Laag risico", 1 = "Middel risico", 2 = "Hoog risico"
  • Handig als categorieën een natuurlijke numerieke ordening hebben

Gebruik van Voorspellingsresultaten

Zodra de voorspellingskolom is aangemaakt, kun je deze in mindzieStudio breed inzetten:

In Filters:

  • Filter cases om alleen hoogrisicovoorspellingen te tonen: "Predicted Risk equals 'High Risk'"
  • Sluit laagrisico cases uit van gedetailleerde analyse: "Predicted Outcome not equals 'Low Risk'"
  • Combineer voorspellingen met andere criteria: "Predicted Delay equals 'Yes' AND Order Amount > $10,000"

In Dashboards:

  • Maak prestatiegrafieken gegroepeerd op voorspelde uitkomst
  • Gebruik voorspellingen als kleurcodering in proceskaarten om risico’s per procespad te visualiseren
  • Bouw KPI-metrics die voorspellingsnauwkeurigheid tonen door voorspeld versus feitelijk uit te zetten
  • Maak heatmaps met voorspeld risico per afdeling, product of tijdsperiode

In Verdere Verrijkingen:

  • Gebruik voorspellingen als input voor calculators (voorbeeld: "High Risk Score" calculator die voorspeld risico meeweegt)
  • Combineer met andere verrijkingen voor samengestelde risicoscores
  • Gebruik als filtercriteria voor gerichte verrijkingen (voorbeeld: "Voeg compliance-check toe alleen voor voorspelde niet-nalevingscases")

Voor Procesverbetering:

  • Identificeer procespatronen die leiden tot negatieve voorspelde uitkomsten
  • Prioriteer proces redesign op activiteiten die negatieve voorspellingen het sterkst beïnvloeden
  • Monitor voorspellingsontwikkelingen in de tijd voor evaluatie van procesverbeteringen
  • Vergelijk voorspeld versus feitelijk om het model te valideren en bij te stellen

Model Trainingsoutput

Wanneer een nieuw model getraind wordt (als Model Id niet is opgegeven), genereert de verrijking extra artefacten:

Trainingsbestanden:

  • Training.csv: gefilterde case-data voor modeltraining
  • Training.schema: datatype-definities van trainingskolommen
  • Prediction.csv: gefilterde case-data die voorspellingen nodig heeft
  • Prediction.schema: datatype-definities van predictiekolommen

Modelfiles:

  • script.py: het Python-script dat het model traint en toepast
  • model_trainer.py: de model-trainingslogica
  • mindzie_helper.py: hulpfuncties voor data laden en verwerking

Console Output: De uitvoeringslogboeken van de verrijking laten zien:

  • "Loading training data..." met rijen tellen
  • "Fitting model to training data..." met voortgang
  • "Model training completed successfully!"
  • "Loading prediction data..." met rijen tellen
  • "Generating predictions..." met voortgang
  • "Successfully saved predictions to: out/Prediction.csv"

Deze gedetailleerde output helpt je te controleren dat training gelukt is en de omvang van voorspellingen te begrijpen.

Voorspellingskwaliteitsindicatoren

Overweeg in productie de volgende kwaliteitsindicatoren te monitoren:

  • Voorspellingsdekking: Welk percentage cases kreeg voorspellingen versus niet door missende features
  • Voorspellingsdistributie: Zijn voorspellingen evenwichtig of sterk bevooroordeeld naar één uitkomst
  • Validatie-accuratesse: Bij vergelijking voorspeld versus feitelijk, hoeveel procent klopt
  • Omgang met missende waarden: Voor welke cases lukt het niet voorspellingen te doen door incomplete data

Door deze indicatoren te analyseren, kun je featureselectie, trainingsfilters en datakwaliteit iteratief verbeteren voor betere voorspellingsnauwkeurigheid en zakelijke waarde.

Zie ook

Gerelateerde AI en geavanceerde verrijkingen:

  • Python - Voer eigen Python-code uit voor geavanceerde datatransformaties