予測値
概要
予測値エンリッチメントは、高度な回帰技術を使用して、プロセスデータの過去のパターンに基づき数値属性値を予測します。この強力な統計オペレーターは、結果が判明している完了済みのケースを解析し、進行中または新規ケースの値を推定する予測モデルを構築します。入力属性と従属変数の関係を調査することで、パターンを特定し、将来の値に関するデータ駆動型の予測を行います。
このエンリッチメントは、プロセスマイニングでの予測や計画に特に有用です。組織は、完了前にプロセスの結果を予測し、初期指標に基づく財務影響を推定し、将来の値に基づく先手の意思決定を行うことができます。エンリッチメントは設定可能な集約関数と過去のケース分析を使用して、単なる予測だけでなく信頼度スコアも提供します。これにより、各予測の信頼性を理解できます。また、最小値制約やフォールバック計算などの複雑なシナリオにも対応し、過去データが限られている場合でも堅牢な予測を可能にします。
主な利用例
- 注文特性や顧客所在地に基づく配送時間の予測
- 初期購買注文詳細から最終請求金額の推定
- 原材料やプロセスパラメーターに基づく生産量の予測
- 初期の顧客対応指標から顧客満足度スコアの予測
- 初期マイルストーンに基づくプロジェクト完了日の推定
- プロセス属性に基づくリソース消費量の予測
- 生産ラインパラメーターから品質スコアの予測
設定
新規属性名: 予測値を格納する新しい属性の名前を指定します。この属性には各ケースの数値予測値が格納されます。「Predicted_Delivery_Days」や「Estimated_Final_Cost」など、何を予測しているかが明確な説明的な名前を選択してください。
アルゴリズム名(任意): 予測アルゴリズムのカスタム名を指定します。この名前は予測値および信頼度スコアと並んで記録され、どの方法で予測が行われたかを追跡します。異なる予測設定を試す際や、複数の予測エンリッチメントを適用する場合に便利です。
入力属性名: 予測のためにケースをグループ化するために使用する1つ以上の文字列属性を選択します。これらの属性で値が一致するケース同士が類似ケースとして予測に使用されます。例として、「Customer_Region」と「Product_Category」を選択すると、同じ地域と製品カテゴリの過去ケースに基づく予測が行われます。何も選択しない場合、従属変数を持つすべてのケースが予測に使用されます。
従属属性名: 予測したい数値属性を選択します。これは整数または小数の数値フィールドで、完了済みのケースには存在し、進行中ケースでは欠如している場合があります。エンリッチメントはこの属性の過去値を解析し、まだ利用できないケースの予測を行います。
最小値属性名(任意): 予測の下限値を提供する数値属性を選択します。指定すると、予測値はこの値を下回ることはありません。「予測配送時間は現在の経過時間より短くできない」や「推定費用は材料費以下にはならない」といったビジネスルールに役立ちます。従属属性とは異なる属性でなければなりません。
フィルター(任意): 予測モデル構築に使用する過去ケースを制限するためのフィルターを適用します。異常値を除外したり、最近のデータに集中させたり、高品質なケースのみを使用する場合に有効です。例えば、過去6か月以内のケースのみを使用したり、データ品質問題のあるケースを除外したりします。
集約関数: 過去の値を結合して予測値を算出する統計関数を選択します:
- 平均: 過去値の平均を使用(デフォルト。全観測値のバランスを取る)
- 中央値: 中間値を使用(異常値に強い)
- 最大: 過去値の最高値を使用(上限に保守的)
- 最小: 過去値の最低値を使用(下限に保守的)
最小ケース数: 予測を行うのに必要な過去ケースの最小数を設定します。デフォルトは2です。マッチするケース数がこの数に満たない場合、最小値の制約によるフォールバックがなければ予測は実行されません。値を大きくすると予測の信頼性は高まりますが、予測件数は減少します。
最大ケース数: 予測に使用する最近のケースの最大数を設定します。デフォルトは10です。エンリッチメントはこの上限までの最新ケースを使用し、古い過去データより現在のパターンを反映した予測を実現します。値を小さくすると最近の変化により敏感な予測が可能です。
最小値定数: 最小値制約を使用する場合、最小値に加算する定数です。デフォルトは0です。例えば、最小値が100で定数が10の場合、フォールバック予測は110になります。過去データが不足している場合でもビジネス要件を満たす予測を可能にします。
最小値係数: 最小値制約を使用する場合、フォールバック計算で最小値に乗算する係数です。デフォルトは1.0です。例えば、最小値が100で係数が1.2の場合、フォールバックは120になります。最小閾値に比例した調整が可能です。
例
例1: Eコマースでの配送時間予測
シナリオ: オンライン小売業者が、顧客所在地と配送方法を考慮して過去の配送パターンに基づき新規注文の配送時間を予測し、正確な顧客期待値を設定したい。
設定:
- 新規属性名: Predicted_Delivery_Days
- アルゴリズム名: Regional_Shipping_Model
- 入力属性名: Customer_Region, Shipping_Method
- 従属属性名: Actual_Delivery_Days
- 最小値属性名: Current_Days_In_Transit
- フィルター: Order_Date > 30 days ago
- 集約関数: Average
- 最小ケース数: 5
- 最大ケース数: 20
- 最小値定数: 1
- 最小値係数: 1.1
出力: 3つの新しいケース属性が作成されます:
- Predicted_Delivery_Days: 配送推定日数(例:5.3日)
- Predicted_Delivery_Days - Confidence: 0から1の信頼度スコア(例:0.75)
- Predicted_Delivery_Days - Algorithm: 使用されたアルゴリズム(「Regional_Shipping_Model」またはフォールバックの場合は「Fixed」)
Region_Westの新規注文がExpress_Shippingを利用する場合、類似の過去注文15件が平均3.2日であったため、予測は3.2日、信頼度は0.75となりました。
洞察: 予測は現実的な配送期待値の設定、遅延が予想される注文の特定、約束配送時間と予測を比較した配送方法の最適化に役立ちます。
例2: 調達における請求金額予測
シナリオ: 調達部門が初期購買申請の詳細を基に最終請求金額を予測し、予算計画を改善しコストオーバーランの早期識別を行いたい。
設定:
- 新規属性名: Predicted_Invoice_Amount
- 入力属性名: Vendor_Name, Material_Category
- 従属属性名: Final_Invoice_Amount
- 最小値属性名: Initial_PO_Amount
- 集約関数: Median
- 最小ケース数: 3
- 最大ケース数: 15
- 最小値定数: 0
- 最小値係数: 1.05
出力: 予測属性は推定最終請求金額を示します。Vendor_Aからの原材料10,000ドルの新規注文の場合:
- Predicted_Invoice_Amount: 10,750ドル(購買注文額より7.5%高い過去中央値に基づく)
- 信頼度: 0.6(過去9件のケース使用)
- アルゴリズム: 中央値ベース予測
洞察: 予算管理の先手対応、継続的に超過するベンダーの早期発見、財務計画の精度向上に貢献します。
例3: 製造品質スコアの推定
シナリオ: 製造工場が現行生産中の製品の品質スコアを初期プロセスパラメーターに基づき予測し、品質問題への早期介入を可能にしたい。
設定:
- 新規属性名: Predicted_Quality_Score
- 入力属性名: Production_Line, Product_Type, Shift
- 従属属性名: Final_Quality_Score
- フィルター: Production_Date > 60 days ago AND Quality_Score IS NOT NULL
- 集約関数: Average
- 最小ケース数: 10
- 最大ケース数: 30
出力: 現在Day_ShiftでLine_Aで製造中のProduct_Type_Xの製品について:
- Predicted_Quality_Score: 92.5(0~100スケール)
- 信頼度: 0.87(類似する過去26ケース基準)
- アルゴリズム: 標準予測
洞察: 品質チームが低予測スコア製品の検査に集中し、プロセスパラメーターを事前調整し、品質関連の手戻りコストを削減できます。
例4: 医療における患者滞在期間予測
シナリオ: 病院が入院診断と初期評価データに基づき患者の滞在期間を予測し、ベッド管理と資源配分を最適化したい。
設定:
- 新規属性名: Predicted_LOS_Days
- 入力属性名: Admission_Diagnosis, Patient_Age_Group, Admission_Type
- 従属属性名: Actual_LOS_Days
- 最小値属性名: Current_LOS_Days
- 集約関数: Median
- 最小ケース数: 8
- 最大ケース数: 25
- 最小値定数: 1
- 最小値係数: 1.0
出力: 肺炎の緊急入院高齢患者(現在2日目)について:
- Predicted_LOS_Days: 7日(類似ケースの中央値)
- 信頼度: 0.72
- アルゴリズム: 最小ケース未満の場合は"Fixed"として現在滞在日数+1日を表示
洞察: ベッド容量計画の改善、延長滞在の可能性がある患者の早期発見、退院計画の効率化に役立ちます。
例5: 建設におけるプロジェクトコスト予測
シナリオ: 建設会社が初期プロジェクト特性に基づき最終プロジェクト費用を予測し、入札の精度を高め、コスト超過のリスクを早期に特定したい。
設定:
- 新規属性名: Predicted_Total_Cost
- 入力属性名: Project_Type, Client_Industry, Project_Region
- 従属属性名: Final_Project_Cost
- 最小値属性名: Current_Spent_Amount
- フィルター: Project_Start_Date > 365 days ago
- 集約関数: Average
- 最小ケース数: 4
- 最大ケース数: 12
- 最小値定数: 50000
- 最小値係数: 1.15
出力: Region_Northの小売クライアント向け新規商業建築プロジェクトで、既に200万ドル支出済みの場合:
- Predicted_Total_Cost: 3,500,000ドル(類似過去8プロジェクト基準)
- 信頼度: 0.67
- アルゴリズム: 使用メソッド表示
過去データが不足する場合はフォールバックを使用:2,000,000 × 1.15 + 50,000 = 2,350,000ドル
洞察: 正確なコスト予測によりプロジェクト収益性を向上、予算超過の早期対応を可能にし、競争力のある現実的な入札戦略をサポートします。
出力
Predict Value エンリッチメントは、包括的な予測情報を提供するために連携する3つの関連するケース属性を作成します:
主予測属性: 「新規属性名」設定に基づいた名前を持ち、この属性に予測された数値が格納されます。データ型は常にDouble(小数値)で、正確な予測値を扱います。値は過去のパターンまたは最小値制約に基づき算出されます。
信頼度スコア属性: 自動的に "[新規属性名] - Confidence" の名前で作成され、0から1までの信頼度スコアを持ちます。値が大きいほど利用された過去ケース数が多く、予測の信頼性が高いことを示します。信頼度は「(使用されたケース数) / (最大ケース数 + 1)」で計算されます。
アルゴリズム追跡属性: 自動的に "[新規属性名] - Algorithm" の名前で作成される文字列属性で、各予測に使用された方法を記録します。通常予測には指定されたカスタムアルゴリズム名が入り、最小値に基づくフォールバック計算の場合は「Fixed」と表示されます。
これらの属性はmindzieStudioの他機能とシームレスに連携します。高信頼度予測のフィルターや、実測値との比較計算機、予測精度パターンの可視化にご利用ください。
関連項目
- 属性値のカテゴリ分け - 連続予測値をカテゴリにグループ化
- 代表ケース属性 - 最頻値を用いる代替手法
- Python - 機械学習によるカスタム予測モデル作成
- 加算 - 複数の予測の組み合わせや調整の加算
- 乗算 - 予測へのスケーリング係数適用
このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。