Waarde Voorspellen

Overzicht

De Predict Value verrijking gebruikt geavanceerde regressietechnieken om numerieke attribuutwaarden te voorspellen op basis van historische patronen in uw procesdata. Deze krachtige statistische operator analyseert voltooide cases met bekende uitkomsten om voorspellende modellen te bouwen die waarden kunnen schatten voor lopende of nieuwe cases. Door relaties tussen invoerattributen en afhankelijke variabelen te onderzoeken, identificeert de verrijking patronen en past deze toe om op data gebaseerde voorspellingen te doen over toekomstige waarden.

Deze verrijking is bijzonder waardevol voor voorspellen en plannen in process mining-scenario’s. Het stelt organisaties in staat om procesuitkomsten te voorspellen vóór voltooiing, financiële impact te schatten op basis van vroege indicatoren en proactief beslissingen te nemen op basis van waarschijnlijke toekomstwaarden. De verrijking gebruikt configureerbare aggregatiefuncties en historische case-analyse om niet alleen voorspellingen te bieden, maar ook betrouwbaarheidscores, die gebruikers helpen de betrouwbaarheid van elke voorspelling te begrijpen. De operator kan complexe scenario’s aan, waaronder minimumwaardebeperkingen en fallback-berekeningen, waardoor robuuste voorspellingen mogelijk zijn, zelfs wanneer historische data beperkt is.

Veelvoorkomende Toepassingen

Voorspellen van levertijden op basis van orderkenmerken en klantlocatie
Schatten van definitieve factuurbedragen op basis van initiële bestelgegevens
Prognoses van productie-uitvoer op basis van grondstoffen en procesparameters
Voorspellen van klanttevredenheidsscores op basis van vroege interactie-indicatoren
Schatten van projectopleverdata op basis van eerste mijlpalen
Voorspellen van resourceverbruik op basis van procesattributen
Voorspellen van kwaliteitscores op basis van parameters van de productielijn

Instellingen

Nieuwe Attribuutnaam: Specificeer de naam voor het nieuwe attribuut dat de voorspelde waarde zal bevatten. Dit attribuut bevat de numerieke voorspelling voor elke case. Kies een beschrijvende naam die duidelijk aangeeft welke waarde wordt voorspeld, zoals "Predicted_Delivery_Days" of "Estimated_Final_Cost".

Algoritme Naam (Optioneel): Geef een eigen naam op voor het voorspellingsalgoritme. Deze naam wordt opgeslagen in een begeleidend attribuut (naast de voorspelling en betrouwbaarheidscore) om bij te houden welke methode werd gebruikt voor elke voorspelling. Handig bij het testen van verschillende voorspellingconfiguraties of wanneer meerdere voorspellingsverrijkingen worden toegepast.

Input Attribuutnamen: Selecteer één of meer stringattributen die gebruikt worden om cases te groeperen voor voorspelling. Cases met overeenkomende waarden in deze attributen worden als vergelijkbaar beschouwd en samen gebruikt voor voorspelling. Bijvoorbeeld, het selecteren van "Customer_Region" en "Product_Category" betekent dat voorspellingen gebaseerd zijn op historische cases uit dezelfde regio en productcategorie. Als geen attributen worden geselecteerd, worden alle cases met de afhankelijke variabele gebruikt als voorspellingsbasis.

Afhankelijke Attribuutnaam: Selecteer het numerieke attribuut dat u wilt voorspellen. Dit moet een numeriek veld zijn (integer of decimal) dat voorkomt in sommige voltooide cases, maar mogelijk ontbreekt in lopende cases. De verrijking analyseert historische waarden van dit attribuut om voorspellingen te maken voor cases waar deze nog niet beschikbaar is.

Min Waarde Attribuutnaam (Optioneel): Selecteer een numeriek attribuut dat een minimumdrempel biedt voor voorspellingen. Indien opgegeven, zullen voorspellingen nooit lager zijn dan deze waarde. Dit is nuttig voor bedrijfsregels zoals "voorspelde levertijd mag niet lager zijn dan huidige verstreken tijd" of "geschatte kosten mogen niet onder materiaalkosten liggen". Het attribuut moet verschillen van het afhankelijke attribuut.

Filter (Optioneel): Pas filters toe om te beperken welke historische cases worden gebruikt voor het bouwen van het voorspellingsmodel. Hiermee kunt u uitschieters uitsluiten, focussen op recente data of alleen cases van hoge kwaliteit gebruiken voor voorspelling. Bijvoorbeeld, u kunt filteren op cases van de laatste 6 maanden of cases uitsluiten met datakwaliteitsproblemen.

Aggregatiefunctie: Kies de statistische functie die gebruikt wordt om historische waarden samen te voegen in een voorspelling:

Gemiddelde: Gebruikt het gemiddelde van historische waarden (standaard, balanceert alle observaties)
Mediaan: Gebruikt de middelste waarde (robust tegen uitschieters)
Max: Gebruikt de hoogste historische waarde (conservatief voor bovengrenzen)
Min: Gebruikt de laagste historische waarde (conservatief voor ondergrenzen)

Min Cases: Stel het minimumaantal historische cases in dat vereist is om een voorspelling te maken. Standaard is 2. Als er minder overeenkomende cases zijn, wordt er geen voorspelling gemaakt tenzij een minimumwaardebeperking een fallback biedt. Hogere waarden verhogen de betrouwbaarheid van de voorspelling maar kunnen leiden tot minder voorspellingen.

Max Cases: Stel het maximale aantal recente cases in dat voor voorspelling wordt gebruikt. Standaard is 10. De verrijking gebruikt de meest recente cases tot aan deze limiet, waardoor voorspellingen actuele patronen weerspiegelen in plaats van verouderde data. Lagere waarden maken voorspellingen gevoeliger voor recente veranderingen.

Min Waarde Constante: Wanneer minimumwaardebeperkingen worden gebruikt, wordt deze constante opgeteld bij de minimumwaarde om een fallback-voorspelling te maken. Standaard is 0. Bijvoorbeeld, bij een minimumwaarde van 100 en constante van 10, is de fallback 110. Dit zorgt ervoor dat voorspellingen voldoen aan bedrijfsvereisten ook wanneer historische data onvoldoende is.

Min Waarde Factor: Wanneer minimumwaardebeperkingen worden gebruikt, wordt deze factor toegepast op de minimumwaarde in de fallback-berekening. Standaard is 1.0. Bijvoorbeeld, bij een minimumwaarde van 100 en factor 1.2, is de fallback 120. Dit maakt proportionele aanpassingen mogelijk op basis van de minimumdrempel.

Voorbeelden

Voorbeeld 1: Voorspellen van Levertijden in E-commerce

Scenario: Een online retailer wil levertijden voorspellen voor nieuwe orders op basis van historische leveringspatronen, rekening houdend met klantlocatie en verzendmethode om nauwkeurige klantverwachtingen te stellen.

Instellingen:

Nieuwe Attribuutnaam: Predicted_Delivery_Days
Algoritme Naam: Regional_Shipping_Model
Input Attribuutnamen: Customer_Region, Shipping_Method
Afhankelijke Attribuutnaam: Actual_Delivery_Days
Min Waarde Attribuutnaam: Current_Days_In_Transit
Filter: Order_Date > 30 dagen geleden
Aggregatiefunctie: Gemiddelde
Min Cases: 5
Max Cases: 20
Min Waarde Constante: 1
Min Waarde Factor: 1.1

Output: Maakt drie nieuwe caseattributen aan:

Predicted_Delivery_Days: Het geschatte aantal dagen voor levering (bijv. 5,3 dagen)
Predicted_Delivery_Days - Confidence: Betrouwbaarheidsscore tussen 0 en 1 (bijv. 0,75)
Predicted_Delivery_Days - Algorithm: Gebruikt algoritme ("Regional_Shipping_Model" of "Fixed" voor fallback)

Voor een nieuwe order uit Region_West met Express_Shipping vindt de verrijking 15 vergelijkbare historische orders met gemiddeld 3,2 dagen, wat resulteert in een voorspelling van 3,2 dagen met 0,75 betrouwbaarheid.

Inzichten: De voorspelling helpt realistische levertijdverwachtingen te stellen, orders te identificeren die waarschijnlijk vertraagd zijn, en de verzendmethode te optimaliseren op basis van voorspelde versus beloofde levertijden.

Voorbeeld 2: Vooruitzien van Factuurbedragen in Inkoop

Scenario: Een inkoopafdeling moet de definitieve factuurbedragen voorspellen op basis van initiële bestelgegevens om betere budgetplanning mogelijk te maken en vroeg potentiële kostenoverschrijdingen te identificeren.

Instellingen:

Nieuwe Attribuutnaam: Predicted_Invoice_Amount
Input Attribuutnamen: Vendor_Name, Material_Category
Afhankelijke Attribuutnaam: Final_Invoice_Amount
Min Waarde Attribuutnaam: Initial_PO_Amount
Aggregatiefunctie: Mediaan
Min Cases: 3
Max Cases: 15
Min Waarde Constante: 0
Min Waarde Factor: 1.05

Output: Maakt voorspellingattributen aan met geschat definitief factuurbedrag. Voor een nieuwe bestelling van $10.000 van Vendor_A voor Raw_Materials:

Predicted_Invoice_Amount: $10.750 (gebaseerd op historische mediaan van 7,5% boven PO-bedrag)
Confidence: 0,6 (gebruikt 9 historische cases)
Algorithm: Mediaan-gebaseerde voorspelling

Inzichten: Maak proactief budgetbeheer mogelijk, identificeer leveranciers met consistente overschrijdingen vroeg en verhoog de nauwkeurigheid van financiële planning.

Voorbeeld 3: Schatting van Kwaliteitsscores in Productie

Scenario: Een productiefaciliteit wil kwaliteitscores voorspellen voor producten die momenteel in productie zijn op basis van vroege procesparameters, zodat er vroeg kan worden ingegrepen bij mogelijke kwaliteitproblemen.

Instellingen:

Nieuwe Attribuutnaam: Predicted_Quality_Score
Input Attribuutnamen: Production_Line, Product_Type, Shift
Afhankelijke Attribuutnaam: Final_Quality_Score
Filter: Production_Date > 60 dagen geleden EN Quality_Score IS NIET NULL
Aggregatiefunctie: Gemiddelde
Min Cases: 10
Max Cases: 30

Output: Voor producten die momenteel in productie zijn op Line_A, Product_Type_X tijdens Day_Shift:

Predicted_Quality_Score: 92,5 (schaal 0-100)
Confidence: 0,87 (gebaseerd op 26 vergelijkbare historische cases)
Algorithm: Standaard voorspelling

Inzichten: Hiermee kunnen kwaliteitsteams inspectie-inspanningen richten op producten met lage voorspelde scores, procesparameters proactief bijsturen en kosten van kwaliteitsgerelateerde herwerkingen verminderen.

Voorbeeld 4: Voorspellen van Verblijfsduur in de Zorg

Scenario: Een ziekenhuis wil de verblijfsduur van patiënten voorspellen op basis van opname-diagnose en initiële beoordeling om zo bedbeheer en resourceallocatie te optimaliseren.

Instellingen:

Nieuwe Attribuutnaam: Predicted_LOS_Days
Input Attribuutnamen: Admission_Diagnosis, Patient_Age_Group, Admission_Type
Afhankelijke Attribuutnaam: Actual_LOS_Days
Min Waarde Attribuutnaam: Current_LOS_Days
Aggregatiefunctie: Mediaan
Min Cases: 8
Max Cases: 25
Min Waarde Constante: 1
Min Waarde Factor: 1.0

Output: Voor een recent opgenomen oudere patiënt met longontsteking via spoedopname, momenteel dag 2:

Predicted_LOS_Days: 7 dagen (mediaan van vergelijkbare cases)
Confidence: 0,72
Algorithm: Indien er minder dan minimaal benodigde historische cases zijn, toont "Fixed" met huidige verblijfsduur + 1 dag

Inzichten: Biedt betere bedcapaciteitsplanning, helpt patiënten met waarschijnlijk langere verblijven vroeg te identificeren en verbetert ontslagplanningsprocessen.

Voorbeeld 5: Vooruitzien van Projectkosten in Bouw

Scenario: Een bouwbedrijf moet de uiteindelijke projectkosten voorspellen op basis van initiële projectkenmerken om biedingsnauwkeurigheid te verbeteren en projecten met risico op overschrijdingen vroeg te signaleren.

Instellingen:

Nieuwe Attribuutnaam: Predicted_Total_Cost
Input Attribuutnamen: Project_Type, Client_Industry, Project_Region
Afhankelijke Attribuutnaam: Final_Project_Cost
Min Waarde Attribuutnaam: Current_Spent_Amount
Filter: Project_Start_Date > 365 dagen geleden
Aggregatiefunctie: Gemiddelde
Min Cases: 4
Max Cases: 12
Min Waarde Constante: 50000
Min Waarde Factor: 1.15

Output: Voor een nieuw commercieel bouwproject in Region_North voor een retailklant met $2M reeds besteed:

Predicted_Total_Cost: $3.500.000 (gebaseerd op 8 vergelijkbare historische projecten)
Confidence: 0,67
Algorithm: Toont de gebruikte berekeningsmethode

Als historische data onvoldoende is, wordt fallback gebruikt: $2.000.000 × 1,15 + $50.000 = $2.350.000

Inzichten: Verbetert projectwinstgevendheid door accurate kostvoorspelling, maakt vroegtijdige interventie mogelijk bij projecten met budgetoverschrijdingen en ondersteunt meer competitieve en realistische biedstrategieën.

Output

De Predict Value verrijking maakt drie gerelateerde caseattributen aan die samenwerken om uitgebreide voorspellingsinformatie te bieden:

Primair Voorspellingsattribuut: Genoemd volgens uw "Nieuwe Attribuutnaam" instelling, bevat dit attribuut de voorspelde numerieke waarde. Het datatype is altijd Double (decimaal getal) om precieze voorspellingen te ondersteunen. Waarden worden berekend op basis van historische patronen of minimumwaardebeperkingen wanneer van toepassing.

Betrouwbaarheidsscore Attribuut: Automatisch aangemaakt met de naamstructuur "[Nieuwe Attribuutnaam] - Confidence", bevat dit attribuut een betrouwbaarheidswaarde tussen 0 en 1 die de voorspellingsbetrouwbaarheid aangeeft. Hogere waarden betekenen dat meer historische cases beschikbaar waren voor voorspelling. De betrouwbaarheid wordt berekend als: (aantal gebruikte cases) / (maximaal aantal cases + 1).

Algoritmekeuze Attribuut: Automatisch aangemaakt met de naamstructuur "[Nieuwe Attribuutnaam] - Algorithm", bevat dit stringattribuut een registratie van de gebruikte methode voor elke voorspelling. Het bevat ofwel uw eigen opgegeven algoritmenaam (indien gespecificeerd) voor standaardvoorspellingen, of "Fixed" wanneer fallback-berekeningen op basis van minimumwaarden werden gebruikt.

Deze attributen integreren naadloos met andere mindzieStudio functies – gebruik ze in filters om voorspellingen met hoge betrouwbaarheid te identificeren, in calculators om voorspelde versus daadwerkelijke waarden te vergelijken, of in visualisaties om patronen in voorspellingsnauwkeurigheid te analyseren.

Zie ook

Categorize Attribute Values - Groepeer continue voorspelde waarden in categorieën
Representative Case Attribute - Alternatieve methode op basis van meest voorkomende waarden
Python - Maak aangepaste voorspellingsmodellen met machine learning
Add - Combineer meerdere voorspellingen of voeg aanpassingen toe
Multiply - Pas schaalfactoren toe op voorspellingen

Deze documentatie maakt deel uit van het mindzie Studio process mining platform.