決定木
概要
Decision Tree 計算機は、AI駆動の統計解析を活用して特定のプロセス挙動の根本原因を特定します。この強力な計算機は、ターゲットとなる結果が得られたケース群とすべてのケース群を比較し、その結果と最も強く相関する属性値を発見します。リスク比、可能性スコア、分数説明指標を自動的に計算し、説明力に基づいて潜在的な根本原因をランキングします。
これはアウトカムをフィルターで定義し、その後自動的にデータを解析して行動の要因を発見するAI駆動型計算機です。
主な用途
- 支払遅延の要因特定
- 手戻りや繰り返し作業の根本原因理解
- ケースエスカレーションの要因発見
- コンプライアンス違反を引き起こすパターン解析
- ケースの長期化要因の調査
- 品質問題とその要因の調査
- 顧客苦情パターンの理解
設定
結果の定義
フィルター数: ターゲットとなる結果を定義する既存のフィルター数。0に設定すると下記のフィルターリストで結果を定義します。
フィルターリスト: フィルター数が0の場合、解析したい行動を示すケースを選択するフィルターを定義します。例:「手戻りがあるケース」や「30日以上かかったケース」など。
入力設定
入力カラム名: 潜在的な根本原因として解析するケース属性を手動で指定します。
自動入力: 有効にすると、データ型と基数に基づいて適切な列を自動選択します。
解析閾値
最小パーセント: 属性値が考慮されるために必要なケースの最小割合(デフォルト: ケース全体の0.1%)。
最小ケース数: 属性値が考慮されるための必要最低限のケース数(デフォルト: 3件)。
発現確率増加閾値: 根本原因として報告されるために必要な最小リスク比(デフォルト: 1.01、1%増加を意味)。
説明済みパーセント閾値: 属性値を持つ結果ケースの最小割合(デフォルト: 1%)。
最大根本原因数: 返される根本原因の最大数(デフォルト: 20件)。
例
支払遅延の原因特定
シナリオ: なぜ一部の請求書は期日遅れで支払われ、他は期日通りに支払われるのかを理解したい。
設定手順:
- 「支払遅延」を定義するフィルターを作成(例:支払日 > 期日)
- このフィルターを結果としてDecision Tree計算機に設定
- 解析属性を選択:ベンダー、部署、請求金額、支払条件
- 解析を実行
出力:
計算機は以下のような結果を生成します:
| 属性 | 値 | 値を持つケース割合 | 結果の発現確率 | リスク比 | 説明済み割合 |
|---|---|---|---|---|---|
| ベンダーカテゴリ | 国際 | 全ケースの15% | 45%が遅延 | 3.2倍 | 遅延支払の35% |
| 請求金額 | > 50,000ドル | 全ケースの8% | 38%が遅延 | 2.7倍 | 遅延支払の18% |
| 部署 | 調達B | 全ケースの12% | 32%が遅延 | 2.3倍 | 遅延支払の22% |
解釈:
- 国際ベンダーは基準より3.2倍遅延の可能性が高い
- **遅延支払の35%**は国際ベンダーに関係している
- 高額請求書や特定部署もリスク上昇を示す
洞察: 解析により、特に高額請求の国際ベンダーに対して異なる支払プロセスの必要性が示されました。決定木は最も効果的なプロセス改善を優先順位付けするのに役立ちます。
指標の理解
リスク比(発現確率増加)
リスク比は属性値が存在するときの結果発現確率を、存在しない場合と比較します:
Risk Ratio = P(Outcome | Value Present) / P(Outcome | Value Absent)
- リスク比 = 1.0: 属性値は影響なし
- リスク比 = 2.0: その値を持つケースは2倍結果が起きやすい
- リスク比 = 0.5: その値を持つケースは結果が起きる確率が半分
説明済み割合
説明済み割合は、結果を持つケースのうち属性値を持つケースの割合を示します:
Fraction Explained = (Cases with Outcome AND Value) / (Total Cases with Outcome)
これは優先度付けに役立ちます。リスク比が高いが説明済み割合が低い根本原因は、問題の一部だけに影響します。
優先度ランキング
根本原因は以下の組み合わせにより「高」「中」「低」優先度に分類されます:
- 発現確率増加(リスク比)
- 説明済み割合
- 統計的有意性(ケース数)
表示モード
文形式ビュー
各根本原因の人間が読みやすい説明を表示:
"ベンダーカテゴリ = 国際のケースは支払遅延となる可能性が3.2倍高い。この属性は全遅延支払の35%を説明しています。"
統計グリッド
計算された全指標を並べ、詳細解析用にソート可能な表で表示。
結果発現確率ビュー
最もリスク比の高い属性値に注目し、結果の発生確率が劇的に増加する要因を強調。
結果ケース数ビュー
最も多くのケースに影響する属性値に注目し、改善効果が最も広範囲に及ぶ要因を強調。
動作の仕組み
- 頻度計算: 全ケースおよび結果ケースにおける各属性値の発生頻度をカウント
- 確率比較: 各値について、属性値がある場合とない場合の結果確率を計算
- リスク比算出: これら確率の比を算出
- 説明済み割合計算: 結果ケースに占める各値の割合を計算
- 閾値フィルタ: 設定値未満の結果を除外
- ランキング: 説明力(リスク比と説明済み割合の組み合わせ)でソート
ベストプラクティス
適切な結果の定義
- 具体的に設定する: 「7日以上遅延」などの方が「遅延支払」より良い
- 十分なケース数を確保: 統計的に意味あるサンプル数が必要
- 異なる定義でテストし根本原因の変化を確認
入力カラムの選択
- カテゴリ属性を含める(ベンダー、部署、状態など)
- 数値属性は区切りを付けて離散化(金額帯、期間区分など)
- 一意値が多すぎる列は除外(IDや自由記述など)
- まず自動選択を使い、その後結果を見て調整
結果の解釈
- 高いリスク比かつ高い説明済み割合の組み合わせを探す
- ビジネス文脈を考慮:特定された根本原因は実行可能か?
- 実施前に業務専門家と結果を検証
- ドリルダウン機能で基になるケースを詳査
出力
計算機は複数の出力形式を提供:
- 決定木テーブル: 説明力でランク付けされたすべての根本原因
- 結果発現確率テーブル: 最も高いリスク比の値とケースの詳細表示
- 結果ケース数テーブル: ケース数で影響が大きい値とドリルダウン機能
- チャットテキスト: プレゼン用の人間読みやすい要約
インタラクティブ機能:
- 行をクリックして基になるケースを表示
- 指標ごとにソート可能
- 解析結果のエクスポート
- 根本原因から推奨施策を作成
このドキュメントは mindzie Studio プロセスマイニングプラットフォームの一部です。