LLM Prompts

Overzicht

De LLM Prompts calculator genereert uitgebreide, AI-klare samenvattingen van uw process mining-gegevens die kunnen worden verwerkt door Large Language Models (LLM's). Deze calculator fungeert als de databron tussen mindzieStudio en AI-chatbotsystemen en ondersteunt functies zoals mindzie Copilot.

BELANGRIJK: Dit is een calculator die uitsluitend voor beheerders is bedoeld, ontworpen voor AI-integratie en chatbotfunctionaliteit. Het creëert gestructureerde prompts met processtatistieken, activiteits- en prestatierapportages, specifiek geformatteerd voor verwerking door AI-assistenten. Normale gebruikers gebruiken AI-mogelijkheden via de mindzie Copilot-interface en niet direct via deze calculator.

Deze calculator beheert het delen van gegevens op slimme wijze via vijf privacy-niveaus, zodat u controle houdt over welke informatie wordt gedeeld met externe LLM-diensten, terwijl natuurlijke taal-analyse van uw processgegevens mogelijk blijft.

Veelvoorkomende toepassingen

AI-chatbotassistenten voeden die vragen in natuurlijke taal over uw procesgegevens beantwoorden
Gebruikers in staat stellen vragen te stellen zoals "Welke activiteit veroorzaakt de meeste vertragingen?" en AI-gegenereerde inzichten terugkrijgen
Context bieden aan Large Language Models voor automatische procesanalyse en aanbevelingen
Uitgebreide dataset-samenvattingen genereren die geoptimaliseerd zijn voor AI-verwerking en interpretatie
Privacy beheren door te beperken welke procesdata wordt gedeeld met externe LLM-diensten
Ondersteunen van verschillende vertrouwensniveaus voor on-premise versus cloud-gebaseerde AI-diensten

Instellingen

Data Level: Bepaalt hoeveel procesdata wordt gedeeld met de LLM. Dit is de primaire privacycontrole.

Level 0 (Uit) - Schakelt AI-mogelijkheden volledig uit. Geen data wordt gedeeld met LLM-diensten.
Level 1 (Geen Data) - AI kan generieke vragen over process mining beantwoorden, maar heeft geen toegang tot uw dataset.
Level 2 (Activiteit- en Attribuutnamen) - Deelt alleen kolomnamen en datatypes. AI begrijpt de structuur van uw dataset maar niet de waarden.
Level 3 (Activiteiten, Attributen en Berekende Waarden) - Deelt geaggregeerde statistieken zoals duur en frequenties. Geen ruwe casusgegevens.
Level 4 (Alle Data) - Volledig statistisch profiel inclusief alle berekende metrics. Maximale AI-capaciteit. Opmerking: ruwe casusrecords worden op geen enkel niveau gedeeld.

Include Activities and Attributes: Wanneer ingeschakeld, worden activiteitsnamen gedeeld met casustellingen en percentages, plus volledige lijsten van case- en eventattributen met datatypes. Actief bij datalevels 2, 3 en 4. Dit helpt de AI te begrijpen welke activiteiten en attributen in uw proces aanwezig zijn.

Include Attribute Breakdown: Wanneer ingeschakeld, worden gedetailleerde waardeverdelingen voor categorische attributen verstrekt, met tellingen en percentages per waarde. Actief bij datalevels 3 en 4. Attributen met meer dan 100 categorieën worden automatisch overgeslagen om de AI niet te overladen met te veel detail.

Include Time Between Activities: Wanneer ingeschakeld, worden prestatiegegevens van activiteitsparen gedeeld, inclusief tijd tussen activiteiten, casustellingen, percentages en gemiddelde duur. Beperkt tot de top 100 activiteitsparen. Actief bij datalevels 3 en 4. Dit helpt de AI knelpunten en vertragingen in uw proces te identificeren.

Include Duration Histogram: Wanneer ingeschakeld, wordt de verdeling van casusduur in buckets weergegeven. Actief bij datalevels 3 en 4. Dit helpt de AI typische versus afwijkende casusduur in uw proces te begrijpen.

Include Dataset Information: Wanneer ingeschakeld, worden algemene datasetstatistieken gedeeld, inclusief start- en eindtijden, casustellingen, eventtellingen, duurstatistieken en attributentellingen. Actief bij datalevels 3 en 4. Dit geeft de AI een globaal beeld van omvang en kenmerken van uw dataset.

Include Start and End Frequencies: Wanneer ingeschakeld, wordt weergegeven met welke activiteiten casussen starten en eindigen, met percentages. Actief bij datalevels 3 en 4. Dit helpt de AI inzicht te krijgen in procesingangen en -uitgangen en veelvoorkomende start- en eindpatronen te herkennen.

Include Resource Frequency: Wanneer ingeschakeld, worden casuspercentages per resource weergegeven, beperkt tot de top 100 resources. Alleen opgenomen als er een Resource-kolom in uw dataset aanwezig is. Actief bij datalevels 3 en 4. Dit helpt de AI werkverdeling en mogelijke resourceknelpunten te identificeren.

Include Variant Information: Wanneer ingeschakeld, worden procesvariantstatistieken geleverd, inclusief variantsequenties, casuspercentages en gemiddelde duur per variant. Beperkt tot de top 100 varianten. Actief bij datalevels 3 en 4. Dit helpt de AI te begrijpen welke procespaden het meest voorkomen en hun relatieve prestaties.

Prefix Text: Optionele tekst die voor de gegenereerde prompt wordt geplaatst. Kan worden gebruikt om aangepaste context of instructies toe te voegen vóór de hoofddatasecties. Wordt momenteel opgeslagen maar niet actief gebruikt in de hoofdcalculatie.

Postfix Text: Optionele tekst die aan het einde van de gegenereerde prompt wordt toegevoegd. Kan worden gebruikt om aangepaste context of instructies toe te voegen na de hoofddatasecties. Wordt momenteel opgeslagen maar niet actief gebruikt in de hoofdcalculatie.

Voorbeelden

Voorbeeld 1: AI-gedreven procesanalyse inschakelen

Scenario: U wilt de mindzie Copilot AI-assistent inschakelen om vragen in natuurlijke taal over uw order-to-cash-proces te beantwoorden. U vertrouwt de LLM-dienstverlener en wilt uitgebreide processtatistieken delen om de analytische mogelijkheden van de AI te maximaliseren.

Instellingen:

Data Level: Level 4 (Alle Data)
Include Activities and Attributes: Ingeschakeld
Include Attribute Breakdown: Ingeschakeld
Include Time Between Activities: Ingeschakeld
Include Duration Histogram: Ingeschakeld
Include Dataset Information: Ingeschakeld
Include Start and End Frequencies: Ingeschakeld
Include Resource Frequency: Ingeschakeld
Include Variant Information: Ingeschakeld

Uitvoer:

De calculator genereert een uitgebreide prompt met:

Datasetinformatie:

2.456 cases van 1 oktober tot 31 december 2024
Gemiddelde casusduur: 8,5 dagen
18 unieke activiteiten
15 case-attributen en 12 event-attributen

Activiteitenstatistieken:

Create Order: 100% van de cases
Check Inventory: 98% van de cases
Ship: 95% van de cases
Invoice: 94% van de cases
Payment: 89% van de cases

Tijd tussen activiteiten (vertragingen weergegeven):

Invoice naar Payment: Gemiddeld 4,2 dagen
Check Inventory naar Ship: Gemiddeld 3,1 dagen
Create Order naar Check Inventory: Gemiddeld 1,8 dagen

Variantanalyse:

Topvariant (32% van de cases): Create Order, Check Inventory, Ship, Invoice, Payment - gemiddeld 3,2 dagen
Tweede variant (28% van de cases): Create Order, Check Inventory, Backorder, Ship, Invoice, Payment - gemiddeld 8,5 dagen

Resourceverdeling:

Order Processing Team: 45% van de cases
Warehouse Team: 38% van de cases
Finance Team: 35% van de cases

Geschatte tokens: 6.200 tokens (4,8% van 128K LLM capaciteit)

Inzichten: Met alle datasecties ingeschakeld heeft de AI-assistent uitgebreide context over uw order-to-cash-proces. Gebruikers kunnen nu vragen stellen als "Waarom duren sommige orders twee keer zo lang als andere?" en de AI kan zien dat de tweede variant een backorderstap bevat die gemiddeld 5,3 dagen toevoegt. De AI kan constateren dat de vertraging van 4,2 dagen tussen Invoice en Payment bijna de helft van de gemiddelde casusduur vertegenwoordigt, wat wijst op verbeterpotentieel bij debiteurenbeheer. Het tokenaantal van 6.200 is slechts 5% van de capaciteit van moderne LLM's, waardoor er ruim voldoende ruimte is voor gespreksgeschiedenis en complexe vragen.

Voorbeeld 2: Privacybewust metadata delen

Scenario: Uw bedrijfsbeleid vereist dat gevoelige procesgegevens niet worden gedeeld met externe cloud-gebaseerde LLM-diensten. U wilt echter basis AI-assistentie mogelijk maken die gebruikers kan begeleiden bij het gebruik van mindzieStudio-functies op basis van het begrijpen van de datasetstructuur zonder echte waarden te zien.

Instellingen:

Data Level: Level 2 (Activiteit- en Attribuutnamen)
Include Activities and Attributes: Ingeschakeld
Alle andere secties: Uitgeschakeld (automatisch uitgesloten op Level 2)

Uitvoer:

De calculator genereert een minimale prompt met:

Activiteitnamen:

Create Invoice (2.156 cases - 100%)
Match PO (2.089 cases - 96,9%)
Match Receipt (1.867 cases - 86,6%)
Approve Invoice (2.145 cases - 99,5%)
Pay Invoice (2.001 cases - 92,8%)

Case-attributen:

Invoice_Number (String)
Vendor_Name (String)
Invoice_Amount (Decimal)
Currency (String)
Payment_Terms (String)
Department (String)

Event-attributen:

Activity (String)
Timestamp (DateTime)
Resource (String)
Approval_Level (String)

Geschatte tokens: 450 tokens

Inzichten: Op Level 2 kan de AI de structuur van uw dataset begrijpen en gebruikers helpen bij het navigeren in mindzieStudio-functies. Bijvoorbeeld wanneer een gebruiker vraagt "Hoe kan ik factuurverwerking per leverancier analyseren?", ziet de AI dat er een Vendor_Name attribuut is en raadt het gebruik aan van de Breakdown by Categories calculator met Vendor_Name als categorie. De AI kan echter geen vragen beantwoorden over specifieke leveranciers of actuele verwerkingsstatistieken omdat er geen waarden of berekende metrics worden gedeeld. Deze privacybewuste aanpak biedt nuttige begeleiding terwijl de gegevensvertrouwelijkheid behouden blijft en voldaan wordt aan strenge databeheerregels.

Voorbeeld 3: Selectief datadelen voor performance

Scenario: U wilt AI-analyse mogelijk maken gericht op procesflow en het identificeren van knelpunten, maar u wilt het tokengebruik minimaliseren om LLM API-kosten te verlagen en responstijden te verbeteren. Resource- of attribuutanalyses zijn niet nodig voor de huidige use case.

Instellingen:

Data Level: Level 3 (Activiteiten, Attributen en Berekende Waarden)
Include Activities and Attributes: Ingeschakeld
Include Attribute Breakdown: Uitgeschakeld
Include Time Between Activities: Ingeschakeld
Include Duration Histogram: Ingeschakeld
Include Dataset Information: Ingeschakeld
Include Start and End Frequencies: Ingeschakeld
Include Resource Frequency: Uitgeschakeld
Include Variant Information: Ingeschakeld

Uitvoer:

De calculator genereert een gerichte prompt met procesflowgegevens:

Dataset Overzicht:

1.847 inkooporders
1 oktober - 31 december 2024
Gemiddelde duur: 8,5 dagen

Tijd tussen activiteiten:

Submit Request naar First Approval: Gemiddeld 3,2 dagen (knelpunt vastgesteld)
First Approval naar Second Approval: Gemiddeld 1,1 dagen
Second Approval naar PO Creation: Gemiddeld 0,8 dagen
PO Creation naar Vendor Confirmation: Gemiddeld 2,4 dagen

Duur Histogram:

0-3 dagen: 412 cases (22%)
3-7 dagen: 628 cases (34%)
7-14 dagen: 521 cases (28%)
14+ dagen: 286 cases (16%)

Procesvarianten:

Standaardgoedkeuringspad (65%): gemiddeld 7,2 dagen
Versneld pad (20%): gemiddeld 3,1 dagen
Escalatiepad (15%): gemiddeld 15,8 dagen

Geschatte tokens: 2.100 tokens (67% reductie van volledige data)

Inzichten: Door Attribute Breakdown en Resource Frequency secties uit te schakelen verlaagt u het tokenverbruik met 67% terwijl volledige analyse van de procesflow behouden blijft. De AI kan nog steeds identificeren dat de vertraging van 3,2 dagen tussen Submit Request en First Approval het belangrijkste knelpunt is en dat escalatiecases meer dan twee keer zo lang duren als standaardcases. Deze selectieve deelmethode verlaagt LLM API-kosten van ongeveer $0,062 naar $0,021 per query (uitgaande van $0,01 per 1.000 tokens), waardoor AI-geassisteerde analyse kosteneffectiever wordt voor organisaties die duizenden queries per maand verwerken.

Voorbeeld 4: Beheer van tokenbudget en kostenraming

Scenario: Als systeembeheerder moet u het tokenverbruik en geschatte kosten begrijpen voor verschillende datadelingconfiguraties voordat AI-mogelijkheden organisatiebreed worden ingeschakeld.

Instellingen:

Data Level: Level 4 (Alle Data)
Alle secties: Ingeschakeld

Uitvoer:

De calculator geeft uitgebreide tokenmetrics:

Sectieoverzicht:

Activiteiten en Attributen: 1.240 tokens (3.100 karakters)
Attribute Breakdown: 2.341 tokens (5.852 karakters)
Tijd tussen Activiteiten: 892 tokens (2.230 karakters)
Duur Histogram: 324 tokens (810 karakters)
Datasetinformatie: 187 tokens (468 karakters)
Start- en Eindfrequenties: 156 tokens (390 karakters)
Resource Frequentie: 412 tokens (1.030 karakters)
Variant Informatie: 621 tokens (1.552 karakters)

Totaalstatistieken:

Totaal aantal karakters: 15.432
Totaal aantal woorden: 3.124
Geschatte tokens: 6.173 tokens
Capaciteit gebruikt: 4,8% van 128K token venster
Geschatte kosten per query: $0,062 (bij $0,01 per 1K tokens)

Inzichten: De tokengebruik-analyse toont dat Attribute Breakdown de duurste sectie is met 2.341 tokens, goed voor 38% van het totale budget. Indien kostenreductie gewenst is, zou het uitschakelen van deze sectie het tokenverbruik met 38% verminderen terwijl procesflowanalyse behouden blijft. De prompt van 6.173 tokens gebruikt minder dan 5% van moderne LLM-contextvensters (128K tokens voor GPT-4 of Claude), waardoor er voldoende ruimte is voor gespreksgeschiedenis en complexe multi-turn interacties. Bij geschatte $0,062 per query met huidige OpenAI-tarieven, zou een organisatie die 1.000 AI-queries per maand verwacht ongeveer $62 maandelijks moeten budgetteren voor LLM API-kosten, exclusief reactietokens.

Voorbeeld 5: Problemen met AI-assistentantwoord oplossen

Scenario: Gebruikers melden dat de AI-assistent geen vragen kan beantwoorden over de verdeling van werklast over resources. U moet verifiëren welke data de AI tot zijn beschikking heeft en het probleem identificeren.

Instellingen:

Data Level: Level 4 (Alle Data)
Include Resource Frequency: Uitgeschakeld (dit is het probleem)
Alle andere secties: Ingeschakeld

Uitvoer:

Wanneer de calculator draait zonder resourcefrequentiegegevens, bevat de gegenereerde prompt:

Resource Informatie:

"Er zijn geen resources geselecteerd voor deze dataset."

Inzichten: De diagnostische output maakt duidelijk waarom de AI geen resource-gerelateerde vragen kan beantwoorden - de optie Include Resource Frequency is uitgeschakeld. Zelfs op Level 4 (Alle Data) moeten individuele secties expliciet worden ingeschakeld om met de AI te worden gedeeld. Na het inschakelen van Include Resource Frequency genereert de calculator uitgebreide resource statistieken waarin blijkt dat Jane Smith 42% van alle cases afhandelt terwijl andere resources gemiddeld slechts 12% verwerken, wat de workload-ongelijkheid verklaart waar gebruikers over vragen stelden. Dit benadrukt dat de Data Level instelling de privacygrens beheert, terwijl de individuele secties bepalen welke specifieke analyses binnen dat privacyniveau aan de AI beschikbaar worden gesteld.

Voorbeeld 6: AI-data delen monitoren in gereguleerde sectoren

Scenario: Uw gezondheidszorgorganisatie gebruikt mindzieStudio voor analyse van patiëntbehandelprocessen. Compliance vereist dat geen patiënt-identificeerbare informatie of specifieke casusdata wordt gedeeld met externe AI-diensten, maar u wilt AI-assistentie inschakelen voor geaggregeerde procesanalyse die de efficiëntie van patiëntenzorg kan verbeteren.

Instellingen:

Data Level: Level 3 (Activiteiten, Attributen en Berekende Waarden)
Include Activities and Attributes: Ingeschakeld
Include Attribute Breakdown: Uitgeschakeld (voorkomt delen van specifieke attribuutwaarden)
Include Time Between Activities: Ingeschakeld
Include Duration Histogram: Ingeschakeld
Include Dataset Information: Ingeschakeld
Include Start and End Frequencies: Ingeschakeld
Include Resource Frequency: Uitgeschakeld (voorkomt delen van namen van zorgverleners)
Include Variant Information: Ingeschakeld

Uitvoer:

De calculator genereert een compliancevriendelijke prompt:

Datasetsamenvatting:

845 behandeltrajecten
1 januari - 31 maart 2025
Gemiddelde duur: 4,2 dagen

Procesflow:

Patient Registration naar Initial Assessment: Gemiddeld 2,1 uur
Initial Assessment naar Treatment Plan: Gemiddeld 8,4 uur
Treatment Plan naar Treatment Start: Gemiddeld 14,2 uur

Variantanalyse:

Standaard behandelpad (72%): gemiddeld 3,8 dagen
Complex zorgpad (18%): gemiddeld 7,2 dagen
Spoedversnellingspad (10%): gemiddeld 1,5 dagen

Geen patiëntnamen, casusidentificaties of resourcenamen zijn opgenomen in de prompt.

Inzichten: Deze configuratie stelt de AI in staat vast te stellen dat de vertraging van 14,2 uur tussen Treatment Plan en Treatment Start een significante bottleneck in de patiëntenzorg vertegenwoordigt, mogelijk met uitstel van behandeling als gevolg. De AI kan aanbevelen zich te richten op verbetering van deze specifieke overgang zonder ooit patiënt-identificeerbare informatie te ontvangen. Door te opereren op Level 3 met Attribute Breakdown en Resource Frequency uitgeschakeld, voldoet de organisatie aan privacyregels in de gezondheidszorg en profiteert toch van AI-gedreven procesanalyse. De AI kan suggereren "Focus op het verminderen van de 14-uur vertraging tussen behandelplanning en behandelingsstart" zonder te weten welke patiënten vertragingen ervaren hebben of betrokken zorgverleners, wat betrouwbare procesverbetering mogelijk maakt met behoud van patiëntvertrouwelijkheid.

Output

De LLM Prompts calculator genereert een gestructureerde output bedoeld voor verwerking door AI-assistenten en Large Language Models:

Berichtsecties: De calculator organiseert gegevens in meerdere benoemde secties, elk met eigen statistieken. Elke sectie bevat metadata over woordenaantal, aantal karakters en geschat tokenverbruik. Deze modulaire structuur stelt de AI in staat te begrijpen welk type informatie uit welke analyse komt.

Uitgebreide statistieken: Onderaan de output toont de calculator overzichtsmaten inclusief totaal aantal woorden, totaal aantal karakters en geschatte tokenaantallen. Deze metrics helpen beheerders bij het inschatten van capaciteitsbehoeften en API-kosten voor integratie met commerciële LLM-diensten.

Tokenraming: De calculator schat tokenverbruik in op basis van een ratio van 2,5 karakters per token, wat empirisch nauwkeurig is voor Engels tekstmateriaal gemengd met JSON-datastructuren. Deze schatting helpt organisaties bij het budgetteren van LLM API-kosten en het waarborgen dat prompts passen binnen de contextvensterlimieten van hun gekozen AI-service (doorgaans 128.000 tokens voor moderne modellen zoals GPT-4 of Claude).

JSON-geformatteerde tabellen: Alle datasecties zijn geformatteerd als JSON-structuren die LLM’s eenvoudig kunnen parsen en begrijpen. Dit gestructureerde formaat stelt de AI in staat activiteitsfrequenties, duurstatistieken, variantinformatie en andere procesmetrics nauwkeurig en eenduidig te interpreteren.

Capaciteitsindicatoren: Voor secties met grote databundels (resources, varianten, activiteitsparen) beperkt de calculator automatisch de output tot de top 100 items en voegt een toelichting toe. Dit voorkomt dat de LLM overweldigt raakt door enorme hoeveelheden detail terwijl de focus op de belangrijkste proceselementen blijft.

Privacymeldingen: Wanneer Data Level is ingesteld op Level 0 of Level 1, genereert de calculator een bericht met de tekst "The settings do not allow to share any data with the Copilot" in plaats van processtatistieken. Dit maakt voor beheerders en AI-systemen duidelijk waarom er geen data beschikbaar is.

Sectiespecifieke inhoud: Afhankelijk van Data Level en ingeschakelde secties kan de output activiteiten- en attribuutnamen bevatten (Level 2+), waardeverdelingen van attributen (Level 3+), tijd tussen activiteiten (Level 3+), duurhistogrammen (Level 3+), datasetsamenvattingen (Level 3+), proces start- en eindpatronen (Level 3+), resource workloadverdelingen (Level 3+) en variantprestatiegegevens (Level 3+).

Interactieve integratie: Hoewel de output van deze calculator is ontworpen voor AI-verwerking, verschijnt het resultaat in het standaard calculator outputformaat van mindzieStudio. Beheerders kunnen de gegenereerde prompts beoordelen om precies te begrijpen welke informatie wordt gedeeld met LLM-diensten en de naleving van databeheerbeleid verifiëren.

Deze documentatie maakt deel uit van het mindzie Studio process mining platform.