LLMプロンプト

概要

LLMプロンプト計算機は、大規模言語モデル（LLM）が利用できる、プロセスマイニングデータの包括的でAI対応の要約を生成します。この計算機は、mindzieStudioとAIチャットボットシステム間のデータブリッジとして機能し、mindzie Copilotのような機能を支えます。

重要：これはAI統合およびチャットボット機能向けに設計された管理者専用の計算機です。 プロセス統計、活動パターン、パフォーマンス指標を含む構造化されたプロンプトを作成し、AIアシスタントが消費しやすい形式にフォーマットします。通常のユーザーはこの計算機を直接使用せず、mindzie Copilotインターフェースを通じてAI機能を利用します。

この計算機は5つのプライバシーレベルによってデータ共有を賢く制御し、外部のLLMサービスにどの情報を共有するかを管理しながら、プロセスデータの自然言語分析を可能にします。

主な用途

プロセスデータについての自然言語の質問に回答するAIチャットボットアシスタントの強化
「どの活動が最も遅延を引き起こしているか？」などの質問を可能にし、AI生成の洞察を提供
自動化されたプロセス分析と推奨のために大規模言語モデルへコンテキストを提供
AIが消費・解釈しやすい包括的なデータセット要約の生成
プライバシーを制御し、外部LLMサービスへ共有するプロセスデータを制限
オンプレミスとクラウドベースのAIサービスに対する異なる信頼レベルのサポート

設定

Data Level: LLMに共有するプロセスデータの量を制御します。これが主なプライバシー制御です。

Level 0 (Off) - AI機能を完全に無効化。LLMサービスとはデータ共有なし。
Level 1 (No Data) - AIは一般的なプロセスマイニング質問に回答可能だが、データセットにはアクセスできない。
Level 2 (Activity and Attribute Names) - 列名とデータタイプのみ共有。AIはデータ構造を理解できるが値は不明。
Level 3 (Activities, Attributes, and Calculated Values) - 継続時間や頻度などの集約統計を共有。生のケースデータは含まない。
Level 4 (All Data) - 計算された全指標を含む完全な統計プロファイル。最大限のAI機能。ただし生のケースレコードはどのレベルでも共有されません。

Include Activities and Attributes: 有効にすると、活動名とケース数および割合、さらにケース属性とイベント属性の完全なリストとデータタイプを共有します。データレベル2、3、4で有効。AIがどの活動と属性がプロセスに存在するか理解するのに役立ちます。

Include Attribute Breakdown: 有効にすると、カテゴリカル属性の値分布を詳細に示し、各値の件数と割合を提供します。データレベル3、4で有効。100以上のカテゴリーを持つ属性は自動的にスキップされ、AIが過剰な詳細に圧倒されないようにします。

Include Time Between Activities: 有効にすると、活動ペアのパフォーマンスデータを共有し、活動間時間、ケース数、割合、平均継続時間を含みます。上位100の活動ペアに限定。データレベル3、4で有効。AIがボトルネックや遅延を特定するのに役立ちます。

Include Duration Histogram: 有効にすると、ケースの継続時間の分布をバケットごとに提供します。データレベル3、4で有効。AIが典型的なケース継続時間と異常値を理解するのに役立ちます。

Include Dataset Information: 有効にすると、データセット全体の統計（開始・終了日時、ケース数、イベント数、継続時間統計、属性数）を共有します。データレベル3、4で有効。AIがデータセットの全体像と特徴を把握できます。

Include Start and End Frequencies: 有効にすると、ケースの開始および終了活動とその割合を示します。データレベル3、4で有効。AIがプロセスの開始点と終了点を理解し、共通の開始・終了パターンを識別するのに役立ちます。

Include Resource Frequency: 有効にすると、リソースごとのケース割合を提供し、上位100のリソースに限定されます。データセットにResource列が存在する場合のみ含まれます。データレベル3、4で有効。AIが負荷分散やリソースのボトルネックを特定するのに役立ちます。

Include Variant Information: 有効にすると、プロセスバリアント統計を提供し、バリアントのシーケンス、ケース割合、各バリアントの平均継続時間を含みます。上位100のバリアントに限定。データレベル3、4で有効。AIが最も一般的なプロセス経路とその相対的なパフォーマンスを理解できます。

Prefix Text: 生成されるプロンプトの先頭に付加する任意のテキスト。メインのデータセクションの前にカスタムの文脈や指示を追加可能。現在は保存されるがメイン計算では使用されていません。

Postfix Text: 生成されるプロンプトの末尾に付加する任意のテキスト。メインのデータセクションの後にカスタムの文脈や指示を追加可能。現在は保存されるがメイン計算では使用されていません。

例

例1：AIによるプロセス分析の有効化

シナリオ: mindzie Copilot AIアシスタントを使い、注文から入金までのプロセスに関する自然言語の質問に回答させたい。LLMサービス提供者を信頼し、包括的なプロセス統計を共有してAIの分析能力を最大化したい。

設定:

Data Level: Level 4 (All Data)
Include Activities and Attributes: 有効
Include Attribute Breakdown: 有効
Include Time Between Activities: 有効
Include Duration Histogram: 有効
Include Dataset Information: 有効
Include Start and End Frequencies: 有効
Include Resource Frequency: 有効
Include Variant Information: 有効

出力:

計算機は以下を含む包括的なプロンプトを生成：

データセット情報：

2024年10月1日～12月31日の2,456件のケース
平均ケース継続時間：8.5日
ユニークな活動18件
ケース属性15件、イベント属性12件

活動統計：

発注：全ケースの100%
在庫確認：98%
出荷：95%
請求：94%
支払：89%

活動間時間（遅延を表示）：

請求～支払：平均4.2日
在庫確認～出荷：平均3.1日
発注～在庫確認：平均1.8日

バリアント分析：

最上位バリアント（32%のケース）：発注、在庫確認、出荷、請求、支払 - 平均3.2日
第二バリアント（28%のケース）：発注、在庫確認、バックオーダー、出荷、請求、支払 - 平均8.5日

リソース分布：

注文処理チーム：45%
倉庫チーム：38%
財務チーム：35%

推定トークン数：6,200トークン（128K LLM容量の4.8%）

洞察: すべてのデータセクションを有効にしたことで、AIアシスタントは注文から入金までのプロセスに関する包括的なコンテキストを持ちます。ユーザーは「なぜ一部の注文は他より2倍時間がかかるのか？」などの質問が可能で、AIは第二バリアントにバックオーダーステップがあり平均5.3日追加されていることを特定します。また、請求から支払の遅延4.2日が平均継続時間のほぼ半分を占めていることにより、支払回収への改善余地を指摘できます。6,200トークンは最新のLLM容量のわずか5%であり、会話履歴や複雑な質問に十分な余裕があります。

例2：プライバシーを考慮したメタデータ共有

シナリオ: 会社の方針で、機密性の高いプロセスデータを外部のクラウドベースLLMサービスと共有できません。ただし、実際の値を見ずにデータセット構造を理解し、mindzieStudio機能の利用方法をユーザーに案内できる基本的なAI支援を有効化したい。

設定:

Data Level: Level 2 (Activity and Attribute Names)
Include Activities and Attributes: 有効
その他のセクション：無効（Level 2で自動的に除外）

出力:

計算機は最小限のプロンプトを生成：

活動名：

請求作成（2,156件 - 100%）
注文照合（2,089件 - 96.9%）
受領照合（1,867件 - 86.6%）
請求承認（2,145件 - 99.5%）
請求支払（2,001件 - 92.8%）

ケース属性：

Invoice_Number（文字列）
Vendor_Name（文字列）
Invoice_Amount（小数）
Currency（文字列）
Payment_Terms（文字列）
Department（文字列）

イベント属性：

Activity（文字列）
Timestamp（日付時刻）
Resource（文字列）
Approval_Level（文字列）

推定トークン数：450トークン

洞察: Level 2でAIはデータセット構造を理解し、mindzieStudio機能のナビゲートを支援可能です。例えば「ベンダー別の請求処理をどう分析するか？」という質問に対して、Vendor_Name属性の存在を認識し、Breakdown by Categories計算機でVendor_Nameをカテゴリに使用することを推奨できます。ただし具体的なベンダーや処理統計に関する質問には答えられません。プライバシーに配慮したアプローチとして、データの機密性を維持しつつ有益なサポートを実現しています。

例3：パフォーマンス重視の選択的データ共有

シナリオ: プロセスフローとボトルネック特定に焦点を当てたAI分析を有効化したいが、LLM APIコストを抑え応答時間を改善するためにトークン消費を最小化したい。現状リソースや属性分析は不要。

設定:

Data Level: Level 3 (Activities, Attributes, and Calculated Values)
Include Activities and Attributes: 有効
Include Attribute Breakdown: 無効
Include Time Between Activities: 有効
Include Duration Histogram: 有効
Include Dataset Information: 有効
Include Start and End Frequencies: 有効
Include Resource Frequency: 無効
Include Variant Information: 有効

出力:

計算機はプロセスフローに特化したプロンプトを生成：

データセット概要：

1,847件の購買注文
2024年10月1日～12月31日
平均継続時間：8.5日

活動間時間：

申請〜初回承認：平均3.2日（ボトルネック識別）
初回承認〜二次承認：平均1.1日
二次承認〜発注作成：平均0.8日
発注作成〜ベンダー確認：平均2.4日

継続時間ヒストグラム：

0～3日：412件（22%）
3～7日：628件（34%）
7～14日：521件（28%）
14日以上：286件（16%）

プロセスバリアント：

標準承認パス（65%）：平均7.2日
迅速承認パス（20%）：平均3.1日
エスカレーションパス（15%）：平均15.8日

推定トークン数：2,100トークン（全データから67%削減）

洞察: Attribute BreakdownとResource Frequencyを無効にすることで、トークン消費を67%削減しつつ、プロセスフロー分析の能力は維持できます。AIは申請～初回承認の3.2日の遅延が主要なボトルネックであることや、エスカレーションケースは標準ケースの2倍以上の時間がかかることを特定可能です。この選択的共有はLLM APIコストを大幅に削減し、数千件のクエリ月間処理をより経済的にします。

例4：トークン予算管理とコスト見積もり

シナリオ: システム管理者として、AI機能を全社導入前に異なるデータ共有設定のトークン消費と概算コストを把握したい。

設定:

Data Level: Level 4 (All Data)
全セクション：有効

出力:

計算機は詳細なトークン指標を提供：

セクション別内訳：

活動および属性：1,240トークン（3,100文字）
属性詳細分解：2,341トークン（5,852文字）
活動間時間：892トークン（2,230文字）
継続時間ヒストグラム：324トークン（810文字）
データセット情報：187トークン（468文字）
開始・終了頻度：156トークン（390文字）
リソース頻度：412トークン（1,030文字）
バリアント情報：621トークン（1,552文字）

集計：

総文字数：15,432
総単語数：3,124
推定トークン数：6,173トークン
使用容量：128Kトークンの4.8%
推定クエリコスト：$0.062（1Kトークンあたり$0.01）

洞察: 属性詳細分解が最もトークン消費が多く2,341トークンで総予算の38%を占めます。コスト削減が必要な場合、このセクションを無効にすると38%の削減が可能で、プロセスフロー分析は維持されます。6,173トークンはGPT-4やClaudeの128Kトークンコンテキストウィンドウの5%未満であり、会話履歴や複雑な多段対話に十分な容量です。OpenAI価格で見積もると、月に1,000件のAIクエリを処理する組織は約$62のAPI費用を予算化すべきです（応答トークンは含まず）。

例5：AIアシスタント回答のトラブルシューティング

シナリオ: ユーザーから、AIアシスタントがリソースの負荷分散に関する質問に答えられない報告がある。AIがアクセスしているデータを確認し、問題を特定する必要がある。

設定:

Data Level: Level 4 (All Data)
Include Resource Frequency: 無効（これが問題）
その他のセクション：有効

出力:

リソース頻度データなしで計算機を実行すると、生成されたプロンプトに以下が含まれる：

リソース情報：

「このデータセットにはリソースが選択されていません。」

洞察: 診断出力により、AIがリソース関連質問に答えられない理由が判明。Include Resource Frequencyトグルが無効になっているためです。Level 4（All Data）でも、特定の分析セクションは明示的に有効化しなければAIに共有されません。Include Resource Frequencyを有効にすると、計算機はJane Smithが42%を担当し他リソースが平均12%であるという包括的なリソース統計を生成し、ユーザーの質問に対応可能になります。これはData Level設定がプライバシー境界を制御し、個別のセクショントグルがそのプライバシーレベル内でAIに提供する分析を制御していることを示します。

例6：規制産業におけるAIデータ共有の監視

シナリオ: 医療機関がmindzieStudioを患者治療プロセス分析に使用。コンプライアンス上、患者特定情報や特定ケースデータは外部AIサービスと共有できない。しかし、集約されたプロセス分析による患者ケア効率改善のためにAI支援を有効化したい。

設定:

Data Level: Level 3 (Activities, Attributes, and Calculated Values)
Include Activities and Attributes: 有効
Include Attribute Breakdown: 無効（特定属性値の共有回避）
Include Time Between Activities: 有効
Include Duration Histogram: 有効
Include Dataset Information: 有効
Include Start and End Frequencies: 有効
Include Resource Frequency: 無効（医師名共有回避）
Include Variant Information: 有効

出力:

計算機はコンプライアンスに優しいプロンプトを生成：

データセット概要：

845件の治療エピソード
2025年1月1日～3月31日
平均継続時間：4.2日

プロセスフロー：

患者登録～初回評価：平均2.1時間
初回評価～治療計画：平均8.4時間
治療計画～治療開始：平均14.2時間

バリアント分析：

標準治療経路（72%）：平均3.8日
複雑治療経路（18%）：平均7.2日
緊急加速経路（10%）：平均1.5日

患者名、ケースID、リソース名はプロンプトに含まれていません。

洞察: この設定により、AIは治療計画から治療開始への14.2時間の遅延が患者ケアの重大なボトルネックであることを特定し、治療開始の遅れを減らす改善施策を推奨できます。一方、患者個人の情報や担当医師の情報は一切受け取らないため、患者の機密性を維持しつつ証拠に基づいたプロセス改善が可能です。Attribute BreakdownおよびResource Frequencyを無効にしてLevel 3で運用することで、医療データプライバシー規制に準拠しつつAIパワードのプロセス分析が実現します。

出力

LLMプロンプト計算機は、AIアシスタントや大規模言語モデルが消費するために設計された構造化された出力を生成します。

メッセージセクション: 計算機は複数の名前付きセクションにデータを整理し、それぞれに単語数、文字数、推定トークン消費量のメタデータを含みます。このモジュラー構造により、AIはどのタイプの情報がどの分析由来かを理解できます。

包括的統計: 出力の最下部には、総単語数、総文字数、推定トークン数等の集計指標が表示されます。これにより管理者は容量要件を把握し、商用LLMサービスとの統合時のAPIコストを見積もれます。

トークン推定: 計算機は1トークンあたり2.5文字の比率でトークン消費を推定します。これは英語テキストとJSONデータ構造の混在に対して経験的に正確な数値であり、組織がLLM APIコストを予算化し、プロンプトが選択したAIサービスのコンテキストウィンドウ制限（通常はGPT-4やClaudeの128,000トークン）に収まることを保証します。

JSON形式のテーブル: すべてのデータセクションはJSON構造としてフォーマットされており、LLMが活動頻度、継続時間統計、バリアント情報、その他プロセスメトリクスを明確に解釈できます。

容量インジケーター: 大量データのあるセクション（リソース、バリアント、活動ペア）は自動的に上位100件に制限され、制限の理由を示す注釈が含まれます。これによりLLMを過剰な詳細で圧倒せず、最重要プロセス要素に集中できます。

プライバシーステータスメッセージ: Data LevelがLevel 0またはLevel 1の場合、計算機は「The settings do not allow to share any data with the Copilot」というメッセージを生成し、プロセス統計は含まれません。これにより管理者とAIシステム双方にデータ非共有の理由が明示されます。

セクション別内容: Data Levelおよび有効化セクションに応じて、出力には活動名・属性名（Level 2+）、属性値分布（Level 3+）、活動間時間（Level 3+）、継続時間ヒストグラム（Level 3+）、データセット概要統計（Level 3+）、プロセス開始・終了パターン（Level 3+）、リソース負荷分布（Level 3+）、バリアント性能指標（Level 3+）が含まれます。

インタラクティブ統合: この計算機の出力はAI消費向けに設計されていますが、結果はmindzieStudioの標準計算機出力フォーマットで表示されます。管理者は生成されたプロンプトをレビューし、LLMサービスと共有される情報の内容を正確に把握し、データガバナンスポリシーの遵守を確認できます。

このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。