Invites LLM

Vue d'ensemble

Le calculateur d'invites LLM génère des résumés complets, prêts pour l'IA, de vos données d'exploration de processus pouvant être exploités par des modèles de langage de grande taille (LLM). Ce calculateur sert de pont de données entre mindzieStudio et les systèmes de chatbot IA, alimentant des fonctionnalités telles que mindzie Copilot.

IMPORTANT : Il s'agit d'un calculateur réservé aux administrateurs, conçu pour l'intégration IA et la fonctionnalité chatbot. Il crée des invites structurées contenant des statistiques de processus, des modèles d'activités et des métriques de performance spécifiquement formatées pour la consommation par des assistants IA. Les utilisateurs réguliers interagissent avec les capacités IA via l'interface mindzie Copilot plutôt qu'en utilisant directement ce calculateur.

Ce calculateur contrôle intelligemment le partage des données à travers cinq niveaux de confidentialité, garantissant que vous contrôlez quelles informations sont partagées avec les services LLM externes, tout en permettant une analyse en langage naturel de vos données de processus.

Utilisations courantes

Alimenter des assistants chatbot IA qui répondent à des questions en langage naturel sur vos données de processus
Permettre aux utilisateurs de poser des questions comme « Quelle activité cause le plus de retards ? » et obtenir des analyses générées par IA
Fournir un contexte aux modèles de langage de grande taille pour l'analyse automatisée des processus et des recommandations
Générer des résumés complets des jeux de données optimisés pour la consommation et l'interprétation par l'IA
Contrôler la confidentialité en limitant les données de processus partagées avec des services LLM externes
Supporter différents niveaux de confiance pour les services IA sur site versus basés dans le cloud

Paramètres

Niveau de données : Contrôle la quantité de données de processus partagées avec le LLM. C’est le principal contrôle de confidentialité.

Niveau 0 (Désactivé) – Désactive complètement les capacités IA. Aucune donnée partagée avec les services LLM.
Niveau 1 (Pas de données) – L’IA peut répondre à des questions génériques d’exploration de processus mais n’a pas accès à votre jeu de données.
Niveau 2 (Noms d’activités et d’attributs) – Partage uniquement les noms de colonnes et les types de données. L’IA comprend la structure de votre jeu de données mais pas les valeurs.
Niveau 3 (Activités, attributs et valeurs calculées) – Partage des statistiques agrégées comme les durées et fréquences. Pas de données brutes de cas.
Niveau 4 (Toutes les données) – Profil statistique complet incluant toutes les métriques calculées. Capacité IA maximale. Note : Les enregistrements bruts de cas ne sont jamais partagés à aucun niveau.

Inclure activités et attributs : Quand activé, partage les noms d’activités avec les nombres et pourcentages de cas, plus les listes complètes des attributs de cas et d’événement avec types de données. Actif aux niveaux de données 2, 3 et 4. Ceci aide l’IA à comprendre quelles activités et attributs existent dans votre processus.

Inclure répartition des attributs : Quand activé, fournit des distributions détaillées des valeurs pour les attributs catégoriels, montrant comptes et pourcentages pour chaque valeur. Actif aux niveaux 3 et 4. Les attributs avec plus de 100 catégories sont automatiquement ignorés pour éviter de surcharger l’IA avec trop de détails.

Inclure temps entre activités : Quand activé, partage les données de performance des paires d’activités incluant le temps entre activités, compte de cas, pourcentages et durées moyennes. Limité aux 100 meilleures paires d’activités. Actif aux niveaux 3 et 4. Ceci aide l’IA à identifier les goulets d’étranglement et retards dans votre processus.

Inclure histogramme de durée : Quand activé, fournit la distribution des durées de cas organisée en plages. Actif aux niveaux 3 et 4. Ceci aide l’IA à comprendre les durées typiques versus les cas aberrants dans votre processus.

Inclure infos jeu de données : Quand activé, partage les statistiques globales du jeu de données incluant dates de début et fin, nombres de cas, nombres d’événements, statistiques de durée et comptage des attributs. Actif aux niveaux 3 et 4. Ceci donne à l’IA une vue d’ensemble de la portée et des caractéristiques de votre jeu de données.

Inclure fréquences de début et fin : Quand activé, montre avec quelles activités les cas commencent et finissent, avec pourcentages. Actif aux niveaux 3 et 4. Ceci aide l’IA à comprendre les points d’entrée et de sortie du processus et à identifier les motifs courants de départ et de fin.

Inclure fréquence des ressources : Quand activé, fournit les pourcentages de cas par ressource, limité aux 100 meilleures ressources. Actif aux niveaux 3 et 4. Inclu seulement si une colonne Ressource existe dans votre jeu de données. Ceci aide l’IA à identifier la répartition de la charge de travail et les potentiels goulets d’étranglement liés aux ressources.

Inclure infos variantes : Quand activé, fournit les statistiques des variantes de processus incluant séquences de variantes, pourcentages de cas et durées moyennes par variante. Limité aux 100 meilleures variantes. Actif aux niveaux 3 et 4. Ceci aide l’IA à comprendre quels chemins de processus sont les plus fréquents et leur performance relative.

Texte préfixe : Texte optionnel à préfixer à l’invite générée. Peut être utilisé pour ajouter un contexte ou des instructions personnalisés avant les sections principales de données. Actuellement stocké mais pas utilisé activement dans le calcul principal.

Texte suffixe : Texte optionnel à ajouter en suffixe à l’invite générée. Peut être utilisé pour ajouter un contexte ou des instructions personnalisés après les sections principales de données. Actuellement stocké mais pas utilisé activement dans le calcul principal.

Exemples

Exemple 1 : Activation de l’analyse de processus assistée par IA

Scénario : Vous souhaitez activer l’assistant IA mindzie Copilot pour répondre à des questions en langage naturel sur votre processus commande-à-encaissement. Vous faites confiance au fournisseur de service LLM et souhaitez partager des statistiques de processus complètes pour maximiser les capacités analytiques de l’IA.

Paramètres :

Niveau de données : Niveau 4 (Toutes les données)
Inclure activités et attributs : Activé
Inclure répartition des attributs : Activé
Inclure temps entre activités : Activé
Inclure histogramme de durée : Activé
Inclure infos jeu de données : Activé
Inclure fréquences de début et fin : Activé
Inclure fréquence des ressources : Activé
Inclure infos variantes : Activé

Sortie :

Le calculateur génère une invite complète contenant :

Informations sur le jeu de données :

2 456 cas couvrant du 1er octobre au 31 décembre 2024
Durée moyenne des cas : 8,5 jours
18 activités uniques
15 attributs de cas et 12 attributs d’événements

Statistiques d’activités :

Create Order : 100 % des cas
Check Inventory : 98 % des cas
Ship : 95 % des cas
Invoice : 94 % des cas
Payment : 89 % des cas

Temps entre activités (montrant des retards) :

Invoice à Payment : Moyenne 4,2 jours
Check Inventory à Ship : Moyenne 3,1 jours
Create Order à Check Inventory : Moyenne 1,8 jours

Analyse des variantes :

Variante principale (32 % des cas) : Create Order, Check Inventory, Ship, Invoice, Payment – moyenne de 3,2 jours
Seconde variante (28 % des cas) : Create Order, Check Inventory, Backorder, Ship, Invoice, Payment – moyenne de 8,5 jours

Répartition des ressources :

Équipe traitement des commandes : 45 % des cas
Équipe entrepôt : 38 % des cas
Équipe finance : 35 % des cas

Tokens estimés : 6 200 tokens (4,8 % de la capacité LLM 128K)

Aperçu : Avec toutes les sections de données activées, l’assistant IA dispose d’un contexte complet sur votre processus commande-à-encaissement. Les utilisateurs peuvent poser des questions comme « Pourquoi certaines commandes prennent-elles deux fois plus de temps que d’autres ? » et l’IA peut identifier que la seconde variante inclut une étape de backorder qui ajoute en moyenne 5,3 jours. L’IA identifie que le retard de 4,2 jours entre Invoice et Payment représente près de la moitié de la durée moyenne du cas, suggérant la collecte de paiements comme opportunité d’amélioration. Le nombre de tokens de 6 200 ne représente que 5 % de la capacité des LLM modernes, laissant une marge ample pour l’historique des conversations et des questions complexes.

Exemple 2 : Partage des métadonnées avec respect de la confidentialité

Scénario : Votre politique d’entreprise exige que les données sensibles de processus ne soient pas partagées avec des services LLM basés sur le cloud externes. Cependant, vous souhaitez activer une assistance IA basique qui guide les utilisateurs sur l’utilisation des fonctionnalités mindzieStudio en comprenant la structure de votre jeu de données sans voir les valeurs réelles.

Paramètres :

Niveau de données : Niveau 2 (Noms d’activités et d’attributs)
Inclure activités et attributs : Activé
Toutes les autres sections : Désactivées (exclues automatiquement au Niveau 2)

Sortie :

Le calculateur génère une invite minimale contenant :

Noms d’activités :

Create Invoice (2 156 cas – 100 %)
Match PO (2 089 cas – 96,9 %)
Match Receipt (1 867 cas – 86,6 %)
Approve Invoice (2 145 cas – 99,5 %)
Pay Invoice (2 001 cas – 92,8 %)

Attributs de cas :

Invoice_Number (Chaîne)
Vendor_Name (Chaîne)
Invoice_Amount (Décimal)
Currency (Chaîne)
Payment_Terms (Chaîne)
Department (Chaîne)

Attributs d’événement :

Activity (Chaîne)
Timestamp (DateHeure)
Resource (Chaîne)
Approval_Level (Chaîne)

Tokens estimés : 450 tokens

Aperçu : Au Niveau 2, l’IA comprend la structure de votre jeu de données et aide les utilisateurs à naviguer dans les fonctionnalités mindzieStudio. Par exemple, lorsqu’un utilisateur demande « Comment analyser le traitement des factures par fournisseur ? », l’IA voit qu’un attribut Vendor_Name existe et recommande d’utiliser le calculateur Breakdown by Categories avec Vendor_Name comme catégorie. Cependant, l’IA ne peut pas répondre à des questions sur des fournisseurs spécifiques ou des statistiques réelles de traitement car aucune valeur ni métrique calculée n’est partagée. Cette approche respectueuse de la confidentialité permet un guidage utile tout en maintenant la confidentialité des données et la conformité aux politiques strictes de gouvernance des données.

Exemple 3 : Partage sélectif des données pour la performance

Scénario : Vous souhaitez activer une analyse IA centrée sur le flux de processus et l’identification des goulets d’étranglement, mais réduire la consommation de tokens pour diminuer les coûts API LLM et améliorer les temps de réponse. Vous n’avez pas besoin d’analyse des ressources ou des attributs pour votre cas d’usage actuel.

Paramètres :

Niveau de données : Niveau 3 (Activités, attributs et valeurs calculées)
Inclure activités et attributs : Activé
Inclure répartition des attributs : Désactivé
Inclure temps entre activités : Activé
Inclure histogramme de durée : Activé
Inclure infos jeu de données : Activé
Inclure fréquences de début et fin : Activé
Inclure fréquence des ressources : Désactivé
Inclure infos variantes : Activé

Sortie :

Le calculateur génère une invite ciblée contenant des données de flux de processus :

Aperçu du jeu de données :

1 847 bons de commande
1er octobre – 31 décembre 2024
Durée moyenne : 8,5 jours

Temps entre activités :

Soumission de demande à première approbation : Moyenne 3,2 jours (goulet d’étranglement identifié)
Première à seconde approbation : Moyenne 1,1 jours
Seconde approbation à création PO : Moyenne 0,8 jours
Création PO à confirmation fournisseur : Moyenne 2,4 jours

Histogramme des durées :

0-3 jours : 412 cas (22 %)
3-7 jours : 628 cas (34 %)
7-14 jours : 521 cas (28 %)
14+ jours : 286 cas (16 %)

Variantes de processus :

Chemin d’approbation standard (65 %) : moyenne 7,2 jours
Chemin accéléré (20 %) : moyenne 3,1 jours
Chemin d’escalade (15 %) : moyenne 15,8 jours

Tokens estimés : 2 100 tokens (réduction de 67 % par rapport aux données complètes)

Aperçu : En désactivant les sections Répartition des attributs et Fréquence des ressources, vous réduisez la consommation de tokens de 67 % tout en maintenant une capacité complète d’analyse du flux de processus. L’IA peut toujours identifier que le délai entre la soumission et la première approbation de 3,2 jours est le principal goulet d’étranglement, et que les cas d’escalade prennent plus du double de temps que les cas standard. Cette approche de partage sélectif réduit les coûts API LLM passant d’environ 0,062 $par requête à 0,021$ par requête (en supposant 0,01 $ par 1 000 tokens), rendant l’analyse assistée par IA plus rentable pour les organisations traitant des milliers de requêtes mensuelles.

Exemple 4 : Gestion du budget de tokens et estimation des coûts

Scénario : En tant qu’administrateur système, vous devez comprendre la consommation de tokens et les coûts estimés pour différentes configurations de partage de données avant d’activer les fonctionnalités IA à l’échelle de l’organisation.

Paramètres :

Niveau de données : Niveau 4 (Toutes les données)
Toutes les sections : Activées

Sortie :

Le calculateur fournit des métriques complètes de tokens :

Répartition par section :

Activités et attributs : 1 240 tokens (3 100 caractères)
Répartition des attributs : 2 341 tokens (5 852 caractères)
Temps entre activités : 892 tokens (2 230 caractères)
Histogramme de durée : 324 tokens (810 caractères)
Informations sur le jeu de données : 187 tokens (468 caractères)
Fréquences de début et fin : 156 tokens (390 caractères)
Fréquence des ressources : 412 tokens (1 030 caractères)
Informations sur variantes : 621 tokens (1 552 caractères)

Statistiques totales :

Total caractères : 15 432
Total mots : 3 124
Tokens estimés : 6 173 tokens
Capacité utilisée : 4,8 % de la fenêtre 128K tokens
Coût estimé par requête : 0,062 $(à 0,01$ par 1K tokens)

Aperçu : L’analyse de la consommation de tokens révèle que la section Répartition des attributs est la plus coûteuse avec 2 341 tokens, consommant 38 % du budget total. Si une réduction des coûts est nécessaire, désactiver cette seule section réduirait la consommation de tokens de 38 % tout en conservant l’analyse du flux de processus. L’invite de 6 173 tokens utilise moins de 5 % des fenêtres contextuelles des LLM modernes (128K tokens pour GPT-4 ou Claude), laissant une large capacité pour l’historique de conversation et les interactions multi-tours complexes. Avec un coût estimé de 0,062 $par requête selon la tarification actuelle d’OpenAI, une organisation prévoyant 1 000 requêtes IA par mois devra budgéter environ 62$ par mois pour les coûts API LLM, hors tokens de réponse.

Exemple 5 : Dépannage des réponses de l’assistant IA

Scénario : Les utilisateurs signalent que l’assistant IA ne peut pas répondre aux questions sur la répartition de la charge de travail des ressources. Vous devez vérifier à quelles données l’IA a accès et identifier le problème.

Paramètres :

Niveau de données : Niveau 4 (Toutes les données)
Inclure fréquence des ressources : Désactivé (c’est le problème)
Toutes les autres sections : Activées

Sortie :

Lorsque le calculateur fonctionne sans données de fréquence des ressources, l’invite générée contient :

Informations sur les ressources :

« Il n’y a aucune ressource sélectionnée pour ce jeu de données. »

Aperçu : La sortie de diagnostic révèle pourquoi l’IA ne peut pas répondre aux questions liées aux ressources – le basculement Inclure fréquence des ressources est désactivé. Même au Niveau 4 (Toutes les données), les sections individuelles doivent être explicitement activées pour être partagées avec l’IA. Après avoir activé l’option Inclure fréquence des ressources, le calculateur génère des statistiques de ressources complètes montrant que Jane Smith gère 42 % de tous les cas tandis que les autres ressources tournent autour de 12 %, expliquant le déséquilibre de charge dont les utilisateurs se plaignaient. Cela souligne que le paramètre Niveau de données contrôle la limite de confidentialité, tandis que les basculements des sections individuelles contrôlent quelles analyses spécifiques sont accessibles à l’IA dans ce niveau de confidentialité.

Exemple 6 : Surveillance du partage de données IA dans les secteurs régulés

Scénario : Votre organisation de santé utilise mindzieStudio pour analyser les processus de traitement des patients. La conformité exige qu’aucune information pouvant identifier un patient ni données spécifiques de cas ne soient partagées avec des services IA externes, mais vous souhaitez activer une assistance IA pour une analyse agrégée des processus qui pourrait améliorer l’efficacité des soins.

Paramètres :

Niveau de données : Niveau 3 (Activités, attributs et valeurs calculées)
Inclure activités et attributs : Activé
Inclure répartition des attributs : Désactivé (évite de partager des valeurs spécifiques d’attribut)
Inclure temps entre activités : Activé
Inclure histogramme de durée : Activé
Inclure infos jeu de données : Activé
Inclure fréquences de début et fin : Activé
Inclure fréquence des ressources : Désactivé (évite de partager les noms des cliniciens)
Inclure infos variantes : Activé

Sortie :

Le calculateur génère une invite compatible conformité :

Résumé du jeu de données :

845 épisodes de traitement
1er janvier – 31 mars 2025
Durée moyenne : 4,2 jours

Flux de processus :

Enregistrement patient à première évaluation : Moyenne 2,1 heures
Première évaluation au plan de traitement : Moyenne 8,4 heures
Plan de traitement au démarrage du traitement : Moyenne 14,2 heures

Analyse des variantes :

Chemin de traitement standard (72 %) : moyenne 3,8 jours
Chemin de soins complexes (18 %) : moyenne 7,2 jours
Chemin d’urgence accéléré (10 %) : moyenne 1,5 jours

Aucun nom de patient, identifiant de cas ou nom de ressource n’est inclus dans l’invite.

Aperçu : Cette configuration permet à l’IA d’identifier que le délai de 14,2 heures entre plan de traitement et démarrage du traitement représente un goulet d’étranglement significatif dans les soins aux patients, pouvant retarder l’initiation des traitements. L’IA peut recommander de concentrer les efforts d’amélioration sur cette transition spécifique sans jamais recevoir d’informations identifiantes sur les patients. En fonctionnant au Niveau 3 avec Répartition des attributs et Fréquence des ressources désactivés, l’organisation respecte les réglementations sur la confidentialité des données de santé tout en bénéficiant de l’analyse de processus assistée par IA. L’IA peut suggérer « Se concentrer sur la réduction du délai de 14 heures entre planification et démarrage du traitement » sans savoir quels patients ont subi ce retard ni quels cliniciens étaient impliqués, permettant une amélioration basée sur des preuves tout en préservant la confidentialité des patients.

Sortie

Le calculateur d’invites LLM génère une sortie structurée conçue pour la consommation par des assistants IA et des modèles de langage de grande taille :

Sections de message : Le calculateur organise les données en plusieurs sections nommées, chacune avec ses propres statistiques. Chaque section inclut des métadonnées sur le nombre de mots, le nombre de caractères et la consommation estimée de tokens. Cette structure modulaire permet à l’IA de comprendre quel type d’information provient de quelle analyse.

Statistiques globales : En bas de la sortie, le calculateur affiche des métriques agrégées comprenant le nombre total de mots, le nombre total de caractères et le nombre estimé de tokens. Ces métriques aident les administrateurs à comprendre les besoins en capacité et à estimer les coûts API lors de l’intégration avec des services LLM commerciaux.

Estimation des tokens : Le calculateur estime la consommation de tokens en utilisant un ratio de 2,5 caractères par token, ratio empiriquement précis pour le texte en anglais mélangé avec des structures JSON. Cette estimation aide les organisations à budgéter les coûts API LLM et à s’assurer que les invites tiennent dans les limites de la fenêtre contextuelle du service IA choisi (typiquement 128 000 tokens pour des modèles modernes tels que GPT-4 ou Claude).

Tables formatées JSON : Toutes les sections de données sont formatées en structures JSON que les LLM peuvent facilement parser et comprendre. Ce format structuré permet à l’IA d’interpréter avec précision les fréquences d’activités, les statistiques de durée, les informations sur les variantes et autres métriques de processus sans ambiguïté.

Indicateurs de capacité : Pour les sections avec de gros volumes de données (ressources, variantes, paires d’activités), le calculateur limite automatiquement la sortie aux 100 meilleurs éléments et inclut une note expliquant cette limitation. Cela empêche de surcharger le LLM d’informations excessives tout en se concentrant sur les éléments de processus les plus significatifs.

Messages de statut de confidentialité : Lorsque le Niveau de données est défini sur Niveau 0 ou Niveau 1, le calculateur génère un message indiquant « Les paramètres ne permettent pas de partager des données avec le Copilot » au lieu des statistiques de processus. Cela clarifie auprès des administrateurs et des systèmes IA pourquoi aucune donnée n’est disponible.

Contenu spécifique aux sections : Selon le Niveau de données et les sections activées, la sortie peut inclure les noms d’activités et d’attributs (Niveau 2+), les distributions des valeurs d’attribut (Niveau 3+), le temps entre activités (Niveau 3+), les histogrammes de durée (Niveau 3+), les statistiques résumées du jeu de données (Niveau 3+), les motifs de début et fin de processus (Niveau 3+), la répartition de la charge de travail des ressources (Niveau 3+), et les métriques de performance des variantes (Niveau 3+).

Intégration interactive : Bien que la sortie de ce calculateur soit conçue pour la consommation IA, les résultats apparaissent dans le format standard de sortie des calculateurs mindzieStudio. Les administrateurs peuvent examiner les invites générées pour comprendre exactement quelles informations sont partagées avec les services LLM et vérifier la conformité avec les politiques de gouvernance des données.

Cette documentation fait partie de la plateforme d’exploration de processus mindzie Studio.