Prompts para LLM

Visión general

El calculador de Prompts para LLM genera resúmenes integrales, listos para IA, de tus datos de minería de procesos que pueden ser consumidos por Modelos de Lenguaje Extenso (LLMs). Este calculador actúa como puente de datos entre mindzieStudio y sistemas de chatbots de IA, impulsando funciones como mindzie Copilot.

IMPORTANTE: Este es un calculador solo para administradores diseñado para la integración con IA y la funcionalidad de chatbot. Crea prompts estructurados que contienen estadísticas de procesos, patrones de actividad y métricas de rendimiento específicamente formateados para el consumo por asistentes de IA. Los usuarios regulares interactúan con las capacidades de IA a través de la interfaz mindzie Copilot en lugar de usar este calculador directamente.

Este calculador controla inteligentemente el intercambio de datos mediante cinco niveles de privacidad, asegurando que mantengas el control sobre qué información se comparte con servicios LLM externos mientras se habilita el análisis en lenguaje natural de tus datos de proceso.

Usos comunes

Impulsar asistentes de chatbot de IA que responden preguntas en lenguaje natural sobre tus datos de proceso
Permitir a los usuarios hacer preguntas como "¿Qué actividad causa más demoras?" y obtener insights generados por IA
Proporcionar contexto a Modelos de Lenguaje Extenso para análisis automáticos de procesos y recomendaciones
Generar resúmenes completos de conjuntos de datos optimizados para el consumo e interpretación por IA
Controlar la privacidad limitando qué datos de proceso se comparten con servicios LLM externos
Soportar diferentes niveles de confianza para servicios de IA en local vs. en la nube

Configuraciones

Nivel de Datos: Controla cuánto dato de proceso se comparte con el LLM. Este es el control principal de privacidad.

Nivel 0 (Apagado) - Deshabilita completamente las capacidades de IA. No se comparte ningún dato con servicios LLM.
Nivel 1 (Sin Datos) - La IA puede responder preguntas genéricas sobre minería de procesos pero no tiene acceso a tu conjunto de datos.
Nivel 2 (Nombres de Actividades y Atributos) - Solo se comparten nombres de columnas y tipos de datos. La IA entiende la estructura de tu conjunto de datos pero no los valores.
Nivel 3 (Actividades, Atributos y Valores Calculados) - Comparte estadísticas agregadas como duraciones y frecuencias. No se comparte datos brutos de casos.
Nivel 4 (Todos los Datos) - Perfil estadístico completo que incluye todas las métricas calculadas. Capacidad máxima de IA. Nota: no se comparten registros brutos de casos en ningún nivel.

Incluir Actividades y Atributos: Cuando está habilitado, comparte nombres de actividades con conteos y porcentajes de casos, además de listas completas de atributos de casos y eventos con tipos de datos. Activo en niveles de datos 2, 3 y 4. Esto ayuda a la IA a entender qué actividades y atributos existen en tu proceso.

Incluir Desglose de Atributos: Cuando está habilitado, proporciona distribuciones detalladas de valores para atributos categóricos, mostrando conteos y porcentajes por cada valor. Activo en niveles de datos 3 y 4. Atributos con más de 100 categorías se omiten automáticamente para evitar saturar a la IA con demasiado detalle.

Incluir Tiempo entre Actividades: Cuando está habilitado, comparte datos de desempeño por pares de actividades incluyendo tiempo entre actividades, conteos de casos, porcentajes y duraciones medias. Limitado a los 100 principales pares de actividades. Activo en niveles de datos 3 y 4. Esto ayuda a la IA a identificar cuellos de botella y demoras en tu proceso.

Incluir Histograma de Duración: Cuando está habilitado, provee la distribución de duraciones de casos organizadas en rangos. Activo en niveles de datos 3 y 4. Esto ayuda a la IA a entender duraciones típicas vs. casos atípicos en tu proceso.

Incluir Información del Conjunto de Datos: Cuando está habilitado, comparte estadísticas generales del conjunto de datos incluyendo tiempos de inicio y fin, conteos de casos, conteos de eventos, estadísticas de duración y conteos de atributos. Activo en niveles de datos 3 y 4. Esto da a la IA una vista general del alcance y características del conjunto de datos.

Incluir Frecuencias de Inicio y Fin: Cuando está habilitado, muestra con qué actividades comienzan y terminan los casos, junto con porcentajes. Activo en niveles de datos 3 y 4. Esto ayuda a la IA a entender puntos de entrada y salida del proceso e identificar patrones comunes de inicio y fin.

Incluir Frecuencia de Recursos: Cuando está habilitado, provee porcentajes de casos por cada recurso, limitado a los 100 principales recursos. Activo en niveles de datos 3 y 4. Sólo se incluye si existe una columna Recurso en tu conjunto de datos. Esto ayuda a la IA a identificar distribución de carga de trabajo y posibles cuellos de botella de recursos.

Incluir Información de Variantes: Cuando está habilitado, provee estadísticas de variantes de proceso incluyendo secuencias de variantes, porcentajes de casos y duraciones medias por cada variante. Limitado a las 100 principales variantes. Activo en niveles de datos 3 y 4. Esto ayuda a la IA a entender cuáles rutas de proceso son más comunes y su rendimiento relativo.

Texto Prefijo: Texto opcional que se añade al inicio del prompt generado. Puede usarse para agregar contexto o instrucciones personalizadas antes de las secciones principales de datos. Actualmente se almacena pero no se usa activamente en el cálculo principal.

Texto Sufijo: Texto opcional que se añade al final del prompt generado. Puede usarse para agregar contexto o instrucciones personalizadas después de las secciones principales de datos. Actualmente se almacena pero no se usa activamente en el cálculo principal.

Ejemplos

Ejemplo 1: Habilitando análisis de proceso impulsado por IA

Escenario: Deseas habilitar el asistente IA mindzie Copilot para responder preguntas en lenguaje natural sobre tu proceso de orden a cobro. Confías en el proveedor del servicio LLM y quieres compartir estadísticas de proceso completas para maximizar las capacidades analíticas de la IA.

Configuración:

Nivel de Datos: Nivel 4 (Todos los Datos)
Incluir Actividades y Atributos: Habilitado
Incluir Desglose de Atributos: Habilitado
Incluir Tiempo entre Actividades: Habilitado
Incluir Histograma de Duración: Habilitado
Incluir Información del Conjunto de Datos: Habilitado
Incluir Frecuencias de Inicio y Fin: Habilitado
Incluir Frecuencia de Recursos: Habilitado
Incluir Información de Variantes: Habilitado

Salida:

El calculador genera un prompt completo conteniendo:

Información del Conjunto de Datos:

2,456 casos desde 1 de octubre hasta 31 de diciembre de 2024
Duración media de casos: 8.5 días
18 actividades únicas
15 atributos de caso y 12 atributos de evento

Estadísticas de Actividades:

Crear Orden: 100% de los casos
Verificar Inventario: 98% de los casos
Enviar: 95% de los casos
Facturar: 94% de los casos
Pago: 89% de los casos

Tiempo entre Actividades (mostrando demoras):

Facturar a Pago: Media 4.2 días
Verificar Inventario a Enviar: Media 3.1 días
Crear Orden a Verificar Inventario: Media 1.8 días

Análisis de Variantes:

Variante principal (32% de los casos): Crear Orden, Verificar Inventario, Enviar, Facturar, Pago - 3.2 días promedio
Segunda variante (28% de los casos): Crear Orden, Verificar Inventario, Pedido pendiente, Enviar, Facturar, Pago - 8.5 días promedio

Distribución de Recursos:

Equipo de Procesamiento de Órdenes: 45% de los casos
Equipo de Almacén: 38% de los casos
Equipo de Finanzas: 35% de los casos

Tokens estimados: 6,200 tokens (4.8% de la capacidad LLM de 128K)

Insights: Con todas las secciones de datos habilitadas, el asistente IA tiene contexto completo sobre tu proceso de orden a cobro. Los usuarios ahora pueden preguntar "¿Por qué algunas órdenes tardan el doble que otras?" y la IA puede identificar que la segunda variante incluye un paso de pedido pendiente que añade 5.3 días en promedio. La IA puede detectar que la demora de Factura a Pago de 4.2 días representa casi la mitad de la duración media del caso, sugiriendo la cobranza como oportunidad de mejora. El conteo de tokens de 6,200 representa solo el 5% de la capacidad de los LLM modernos, dejando amplio espacio para historial de conversación y preguntas complejas.

Ejemplo 2: Compartición de metadatos con conciencia de privacidad

Escenario: La política de tu empresa requiere que datos sensibles de procesos no se compartan con servicios LLM externos basados en la nube. Sin embargo, quieres habilitar asistencia básica de IA que pueda guiar a usuarios sobre cómo usar las funciones mindzieStudio basándose en la estructura del conjunto de datos sin ver valores reales.

Configuración:

Nivel de Datos: Nivel 2 (Nombres de Actividades y Atributos)
Incluir Actividades y Atributos: Habilitado
Todas las demás secciones: Deshabilitadas (excluidas automáticamente en Nivel 2)

Salida:

El calculador genera un prompt mínimo conteniendo:

Nombres de Actividades:

Crear Factura (2,156 casos - 100%)
Emparejar PO (2,089 casos - 96.9%)
Emparejar Recibo (1,867 casos - 86.6%)
Aprobar Factura (2,145 casos - 99.5%)
Pagar Factura (2,001 casos - 92.8%)

Atributos de Caso:

Invoice_Number (String)
Vendor_Name (String)
Invoice_Amount (Decimal)
Currency (String)
Payment_Terms (String)
Department (String)

Atributos de Evento:

Activity (String)
Timestamp (DateTime)
Resource (String)
Approval_Level (String)

Tokens estimados: 450 tokens

Insights: En Nivel 2, la IA puede entender la estructura del conjunto de datos y ayudar a los usuarios a navegar funciones de mindzieStudio. Por ejemplo, cuando un usuario pregunta "¿Cómo puedo analizar el procesamiento de facturas por proveedor?", la IA puede ver que existe un atributo Vendor_Name y recomendar usar el calculador Desglose por Categorías con Vendor_Name como categoría. Sin embargo, la IA no puede responder preguntas sobre proveedores específicos ni estadísticas de procesamiento reales porque no se comparten valores ni métricas calculadas. Este enfoque consciente de la privacidad permite orientación útil mientras mantiene la confidencialidad de los datos y cumple políticas estrictas de gobernanza de datos.

Ejemplo 3: Compartición selectiva de datos para rendimiento

Escenario: Deseas habilitar análisis IA enfocado en flujo de proceso e identificación de cuellos de botella, pero quieres minimizar el uso de tokens para reducir costos API de LLM y mejorar tiempos de respuesta. No necesitas análisis de recursos ni atributos para tu caso actual.

Configuración:

Nivel de Datos: Nivel 3 (Actividades, Atributos y Valores Calculados)
Incluir Actividades y Atributos: Habilitado
Incluir Desglose de Atributos: Deshabilitado
Incluir Tiempo entre Actividades: Habilitado
Incluir Histograma de Duración: Habilitado
Incluir Información del Conjunto de Datos: Habilitado
Incluir Frecuencias de Inicio y Fin: Habilitado
Incluir Frecuencia de Recursos: Deshabilitado
Incluir Información de Variantes: Habilitado

Salida:

El calculador genera un prompt enfocado conteniendo datos del flujo de proceso:

Resumen del Conjunto de Datos:

1,847 órdenes de compra
1 de octubre a 31 de diciembre de 2024
Duración media: 8.5 días

Tiempo entre Actividades:

Enviar Solicitud a Primera Aprobación: Media 3.2 días (cuello de botella identificado)
Primera Aprobación a Segunda Aprobación: Media 1.1 días
Segunda Aprobación a Creación de PO: Media 0.8 días
Creación de PO a Confirmación de Proveedor: Media 2.4 días

Histograma de Duración:

0-3 días: 412 casos (22%)
3-7 días: 628 casos (34%)
7-14 días: 521 casos (28%)
Más de 14 días: 286 casos (16%)

Variantes del Proceso:

Ruta de aprobación estándar (65%): 7.2 días promedio
Ruta acelerada (20%): 3.1 días promedio
Ruta de escalación (15%): 15.8 días promedio

Tokens estimados: 2,100 tokens (reducción del 67% respecto a datos completos)

Insights: Al deshabilitar las secciones de Desglose de Atributos y Frecuencia de Recursos, reduces el consumo de tokens un 67% mientras mantienes plena capacidad para análisis del flujo de proceso. La IA aún puede identificar que la demora de Envío a Primera Aprobación de 3.2 días es el cuello de botella principal, y que los casos de escalación tardan más del doble que los estándar. Este enfoque selectivo reduce costos API de LLM de aproximadamente $0.062 por consulta a $0.021 por consulta (asumiendo $0.01 por 1,000 tokens), haciendo el análisis asistido por IA más rentable para organizaciones que procesan miles de consultas mensuales.

Ejemplo 4: Gestión del presupuesto de tokens y estimación de costos

Escenario: Como administrador del sistema, necesitas entender el consumo de tokens y costos estimados para diferentes configuraciones de compartición de datos antes de habilitar funciones de IA para toda la organización.

Configuración:

Nivel de Datos: Nivel 4 (Todos los Datos)
Todas las secciones: Habilitadas

Salida:

El calculador provee métricas completas de tokens:

Desglose de Secciones:

Actividades y Atributos: 1,240 tokens (3,100 caracteres)
Desglose de Atributos: 2,341 tokens (5,852 caracteres)
Tiempo entre Actividades: 892 tokens (2,230 caracteres)
Histograma de Duración: 324 tokens (810 caracteres)
Información del Conjunto de Datos: 187 tokens (468 caracteres)
Frecuencias de Inicio y Fin: 156 tokens (390 caracteres)
Frecuencia de Recursos: 412 tokens (1,030 caracteres)
Información de Variantes: 621 tokens (1,552 caracteres)

Estadísticas Totales:

Caracteres totales: 15,432
Palabras totales: 3,124
Tokens estimados: 6,173 tokens
Capacidad usada: 4.8% de ventana de 128K tokens
Costo estimado por consulta: $0.062 (a $0.01 por 1K tokens)

Insights: El análisis de uso de tokens revela que el Desglose de Atributos es la sección más costosa con 2,341 tokens, consumiendo el 38% del presupuesto total. Si se requiere reducción de costos, deshabilitar esta sola sección cortaría el uso de tokens en un 38% manteniendo capacidades de análisis de flujo de proceso. El prompt de 6,173 tokens usa menos del 5% de las ventanas de contexto de LLM modernos (128K tokens para GPT-4 o Claude), dejando amplia capacidad para historial de conversación e interacciones multi-turno complejas. Con un costo estimado de $0.062 por consulta con la tarifa actual de OpenAI, una organización que espere 1,000 consultas IA mensuales debería presupuestar aproximadamente $62 mensuales para costos de API de LLM, sin incluir tokens de respuesta.

Ejemplo 5: Solución de problemas en respuestas del asistente IA

Escenario: Los usuarios reportan que el asistente IA no puede responder preguntas sobre la distribución de carga de trabajo por recurso. Necesitas verificar qué datos tiene acceso la IA y identificar el problema.

Configuración:

Nivel de Datos: Nivel 4 (Todos los Datos)
Incluir Frecuencia de Recursos: Deshabilitado (este es el problema)
Todas las demás secciones: Habilitadas

Salida:

Cuando el calculador se ejecuta sin datos de frecuencia de recursos, el prompt generado contiene:

Información de Recursos:

"No hay recursos seleccionados para este conjunto de datos."

Insights: La salida diagnóstica revela por qué la IA no puede responder preguntas relacionadas con recursos: la opción Incluir Frecuencia de Recursos está deshabilitada. Incluso en Nivel 4 (Todos los Datos), las secciones individuales deben estar explícitamente habilitadas para compartirse con la IA. Tras habilitar la opción Incluir Frecuencia de Recursos, el calculador genera estadísticas completas de recursos mostrando que Jane Smith maneja el 42% de todos los casos mientras otros recursos promedian solo 12%, explicando el desequilibrio en la carga de trabajo que preguntaban los usuarios. Esto destaca que la configuración de Nivel de Datos controla el límite de privacidad, mientras los interruptores individuales de sección controlan qué análisis específicos están disponibles para la IA dentro de ese nivel de privacidad.

Ejemplo 6: Monitoreo del intercambio de datos con IA en industrias reguladas

Escenario: Tu organización de salud usa mindzieStudio para analizar procesos de tratamiento de pacientes. El cumplimiento requiere que no se comparta información identificable de pacientes ni datos específicos de casos con servicios de IA externos, pero quieres habilitar asistencia IA para análisis agregados de proceso que puedan mejorar la eficiencia del cuidado.

Configuración:

Nivel de Datos: Nivel 3 (Actividades, Atributos y Valores Calculados)
Incluir Actividades y Atributos: Habilitado
Incluir Desglose de Atributos: Deshabilitado (evita compartir valores específicos de atributos)
Incluir Tiempo entre Actividades: Habilitado
Incluir Histograma de Duración: Habilitado
Incluir Información del Conjunto de Datos: Habilitado
Incluir Frecuencias de Inicio y Fin: Habilitado
Incluir Frecuencia de Recursos: Deshabilitado (evita compartir nombres de clínicas)
Incluir Información de Variantes: Habilitado

Salida:

El calculador genera un prompt compatible con cumplimiento:

Resumen del Conjunto de Datos:

845 episodios de tratamiento
1 de enero a 31 de marzo de 2025
Duración media: 4.2 días

Flujo del Proceso:

Registro de Paciente a Evaluación Inicial: Media 2.1 horas
Evaluación Inicial a Plan de Tratamiento: Media 8.4 horas
Plan de Tratamiento a Inicio de Tratamiento: Media 14.2 horas

Análisis de Variantes:

Ruta estándar de tratamiento (72%): 3.8 días promedio
Ruta de cuidado complejo (18%): 7.2 días promedio
Ruta acelerada de emergencia (10%): 1.5 días promedio

No se incluyen nombres de pacientes, identificadores de casos ni nombres de recursos en el prompt.

Insights: Esta configuración permite a la IA identificar que la demora de Plan de Tratamiento a Inicio de Tratamiento de 14.2 horas representa un cuello de botella significativo en la atención, potencialmente retrasando el inicio de tratamiento. La IA puede recomendar centrar esfuerzos de mejora en esta transición específica sin recibir jamás información identificable del paciente. Al operar en Nivel 3 con Desglose de Atributos y Frecuencia de Recursos deshabilitados, la organización cumple regulaciones de privacidad de datos sanitarios mientras se beneficia del análisis de procesos potenciado por IA. La IA puede sugerir "Enfocarse en reducir la demora de 14 horas entre planificación y inicio de tratamiento" sin conocer qué pacientes específicos experimentaron demoras ni qué clínicos estuvieron involucrados, permitiendo mejoras basadas en evidencia manteniendo la confidencialidad del paciente.

Salida

El calculador de Prompts para LLM genera una salida estructurada diseñada para el consumo de asistentes de IA y Modelos de Lenguaje Extenso:

Secciones del Mensaje: El calculador organiza los datos en múltiples secciones nombradas, cada una con sus propias estadísticas. Cada sección incluye metadatos sobre conteo de palabras, conteo de caracteres y estimación de consumo de tokens. Esta estructura modular permite a la IA entender qué tipo de información proviene de qué análisis.

Estadísticas Completeras: Al final de la salida, el calculador muestra métricas agregadas incluyendo conteo total de palabras, conteo total de caracteres y conteo estimado de tokens. Estas métricas ayudan a los administradores a entender los requerimientos de capacidad y a estimar costos API al integrar con servicios comerciales LLM.

Estimación de Tokens: El calculador estima el consumo de tokens usando una razón de 2.5 caracteres por token, que es empíricamente precisa para texto en inglés mezclado con estructuras de datos JSON. Esta estimación ayuda a las organizaciones a presupuestar costos de API LLM y asegurar que los prompts caben dentro de los límites de la ventana de contexto del servicio AI escogido (típicamente 128,000 tokens para modelos modernos como GPT-4 o Claude).

Tablas Formateadas en JSON: Todas las secciones de datos están formateadas como estructuras JSON que los LLMs pueden parsear y entender fácilmente. Este formato estructurado permite a la IA interpretar con precisión frecuencias de actividad, estadísticas de duración, información de variantes y otras métricas de proceso sin ambigüedad.

Indicadores de Capacidad: Para secciones con grandes volúmenes de datos (recursos, variantes, pares de actividades), el calculador limita automáticamente la salida a los 100 ítems principales e incluye una nota explicando la limitación. Esto previene que se sobrecargue al LLM con demasiado detalle mientras se enfoca en los elementos de proceso más significativos.

Mensajes de Estado de Privacidad: Cuando el Nivel de Datos está configurado en Nivel 0 o Nivel 1, el calculador genera un mensaje que dice "La configuración no permite compartir ningún dato con el Copilot" en lugar de estadísticas de proceso. Esto aclara tanto a administradores como a sistemas IA por qué no hay datos disponibles.

Contenido Específico por Sección: Dependiendo del Nivel de Datos y las secciones habilitadas, la salida puede incluir nombres de actividades y atributos (Nivel 2+), distribuciones de valores de atributos (Nivel 3+), tiempo entre actividades (Nivel 3+), histogramas de duración (Nivel 3+), estadísticas resumen del conjunto de datos (Nivel 3+), patrones de inicio y fin del proceso (Nivel 3+), distribución de carga de recursos (Nivel 3+), y métricas de desempeño de variantes (Nivel 3+).

Integración Interactiva: Aunque la salida de este calculador está diseñada para consumo de IA, los resultados aparecen en el formato estándar de salida de calculadores de mindzieStudio. Los administradores pueden revisar los prompts generados para entender exactamente qué información se está compartiendo con los servicios LLM y verificar el cumplimiento con políticas de gobernanza de datos.

Esta documentación es parte de la plataforma de minería de procesos mindzie Studio.