データセレクター

概要

Data Selector計算機は、別の計算機の出力から特定の列を選択し、必要に応じて結果をソートおよび制限するデータ後処理ツールです。この計算機は、関連する列を選択し、データを並べ替え、上位N行のみ表示することで、焦点を絞ったデータビューを作成するために不可欠です。

ほとんどの計算機がプロセスデータを直接解析するのに対し、Data Selectorは他の計算機の出力テーブルを処理するため、ダッシュボード、レポート、エクスポート用に分析結果を洗練させるのに最適です。

主な用途

  • ステークホルダーへのメール配信やエクスポート用に特定のデータサブセットを準備する
  • 複雑な分析から主要指標のみを表示する簡素化されたダッシュボードビューを作成する
  • 大規模分析結果から上位N件の結果を選択し並べ替える(例:最遅の上位10件)
  • 不要な詳細を削除して関連する列にレポートを集中させる
  • 包括的な分析結果を経営層向けの要約に変換する
  • 複数の計算機を連結し、各段階で特定の出力を選択してデータパイプラインを作成する

設定

Source Calculator: 出力を利用したい計算機ブロックを選択します。この計算機は現在のノートブックで既に実行されている必要があります。

Source Table: ソース計算機が複数の結果テーブルを生成する場合、どのテーブルを使用するか選択します。多くの計算機は単一テーブル(インデックス0)を生成しますが、一部の計算機は異なる情報を持つ複数テーブルを返します。

Columns to Include: ソーステーブルの中から出力に含める列を選択します。複数列選択可能で、指定した順に表示されます。列名はソース計算機の出力と完全に一致する必要があります。

Sort Column: 結果を並べ替える列をオプションで選択します。指定しなければデータはソース計算機の出力順を維持します。

Sort Direction: 並べ替えが有効な場合、以下のいずれかを選びます:

  • 昇順: 小さい順(A-Z, 0-9, 古い順)
  • 降順: 大きい順(Z-A, 9-0, 新しい順)

Maximum Rows: 出力に含める最大行数を指定します。0または空欄は制限なしを意味します。並べ替えと組み合わせることで「上位N」結果(例:所要時間で降順ソートした上位20件)を選択できます。

例1: 経営層レポート向け最遅10件の購買注文

状況: Case Duration計算機が2,500件の購買注文を分析しましたが、経営層向けのダッシュボードには即時注目すべき最遅10件だけを表示したい。

設定:

  • Source Calculator: "Purchase Order Duration Analysis"
  • Source Table: 0(主結果テーブル)
  • Columns to Include: ["Case ID", "Supplier Name", "Duration", "Total Value"]
  • Sort Column: Duration
  • Sort Direction: 降順
  • Maximum Rows: 10

出力:

正確に4列10行の焦点を絞った表を表示します:

Case ID Supplier Name Duration Total Value
PO-2024-8821 Acme Manufacturing 47.3 days $125,400
PO-2024-9156 Global Supplies Inc 42.8 days $89,200
PO-2024-7633 TechParts Ltd 38.5 days $156,800
... ... ... ...

洞察: 必要な列のみを選択し10行に制限することで、2,500行のデータに圧倒されずに問題のある購買注文を強調した実用的なダッシュボードを作成しました。所要時間での並べ替えにより、最も緊急性の高い案件が最初に表示されます。Total Value列には遅延の財務影響も示されます。

例2: メール配信用週間アクティビティサマリー

状況: 45種類のアクティビティの詳細統計を生成する週間頻度分析を実施。プロセスオーナーには上位15の最頻アクティビティのみ、簡略化した指標でメール送信したい。

設定:

  • Source Calculator: "Weekly Activity Frequency Report"
  • Source Table: 0
  • Columns to Include: ["Activity Name", "Event Count", "Percentage of Total Events"]
  • Sort Column: Event Count
  • Sort Direction: 降順
  • Maximum Rows: 15

出力:

メールに最適なシンプルな表:

Activity Name Event Count Percentage of Total Events
Create Purchase Requisition 1,847 18.2%
Manager Approval 1,823 17.9%
Vendor Selection 1,792 17.6%
... ... ...

洞察: 「First Occurrence」「Last Occurrence」などメールを煩雑にする列を除外し、プロセスを支配する主要アクティビティの必須指標だけを保持。受信者は上位3アクティビティが全体イベントの半数以上を占めることが即座に把握できます。

例3: 顧客分析ダッシュボードの簡略化

状況: Breakdown by Categories計算機が12指標で顧客を分析したが、ダッシュボードウィジェットは上位20顧客の5列しか表示できない。

設定:

  • Source Calculator: "Customer Performance Analysis"
  • Source Table: 0
  • Columns to Include: ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
  • Sort Column: Total Revenue
  • Sort Direction: 降順
  • Maximum Rows: 20

出力:

ダッシュボード対応の焦点を絞った表:

Customer Name Case Count Average Duration Total Revenue On-Time Percentage
MegaCorp Industries 487 8.2 days $4,850,000 92%
TechStart Solutions 356 7.5 days $3,240,000 95%
Global Systems Inc 298 9.1 days $2,870,000 88%
... ... ... ... ...

洞察: 包括的な12列分析をダッシュボード用の5列に変換し、ステークホルダーが知るべき収益規模、受注数、処理時間、納期遵守率を明確に表示。収益で並べ替えることで重要顧客を一目で把握可能。

例4: バリアント分析 - 頻度上位バリアント

状況: バリアント分析により284のユニークなプロセスバリアントを特定。事例数の80%を占める上位25バリアントに改善重点を絞りたい。

設定:

  • Source Calculator: "Process Variant Analysis"
  • Source Table: 0
  • Columns to Include: ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
  • Sort Column: Frequency
  • Sort Direction: 降順
  • Maximum Rows: 25

出力:

Variant ID Frequency Cumulative Percentage Average Duration Contains Rework
VAR-001 1,245 24.8% 6.2 days No
VAR-002 876 42.2% 8.5 days Yes
VAR-003 623 54.6% 5.8 days No
... ... ... ... ...

洞察: 上位25バリアントでプロセスの核心を形成し、累積パーセンテージ列でこれらに注力することで大多数のケースをカバー可能。再作業を含むバリアントを示す「Contains Rework」列が改善優先度の判断に役立つ。

例5: トレンド用日付範囲分析

状況: rate-over-time計算機で90日間のデイリースタティスティクスを生成。行数制限なし、キー指標のみを時系列で表示してトレンド分析を完成させたい。

設定:

  • Source Calculator: "90-Day Completion Rate Analysis"
  • Source Table: 0
  • Columns to Include: ["Date", "Cases Completed", "Completion Rate"]
  • Sort Column: Date
  • Sort Direction: 昇順
  • Maximum Rows: 0(制限なし)

出力:

すべての90行を時系列順に表示:

Date Cases Completed Completion Rate
2024-10-01 23 87.4%
2024-10-02 28 91.2%
2024-10-03 31 89.7%
... ... ...

洞察: 日付で昇順に並べ替え、行制限なしで時系列の完全なデータを保持。基本的なトレンド表示に不要な「標準偏差」「最小/最大」などの列を除外し、グラフ作成ツールで使いやすいきれいなデータに簡素化。

例6: 複数テーブルソース選択

状況: Conformance Checkerが2つのテーブルを返す。テーブル0は集計統計、テーブル1は詳細違反一覧。詳細違反テーブルからレポート作成したい。

設定:

  • Source Calculator: "Standard Process Conformance Check"
  • Source Table: 1(詳細テーブル、集計ではない)
  • Columns to Include: ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
  • Sort Column: Violation Type
  • Sort Direction: 昇順
  • Maximum Rows: 100

出力:

Case ID Violation Type Activity Name Timestamp
CS-1234 Missing Required Step Invoice Approval 2024-11-15 14:22
CS-5678 Missing Required Step Purchase Approval 2024-11-16 09:15
CS-9012 Out of Sequence Goods Receipt 2024-11-16 11:45
... ... ... ...

洞察: デフォルトのテーブル0ではなくテーブル1を選択することで詳細な違反データにアクセス。違反種別で並べ替え、類似問題をグループ化してパターン把握が容易に。100行の制限でレポートを管理しやすくしつつ主要な違反をカバー。

出力

Data Selector計算機は、指定した列を指定順に正確に含むテーブルを表示します。テーブル構造は動的で、列選択によって決まります。

出力の特徴

列構造: 「Columns to Include」で選択した列のみが表示されます。列名、データ型、書式はソース計算機のものが保持されます。

行数: Maximum Rows設定によって決まります:

  • Maximum Rows=0または空欄 → ソーステーブルの全行
  • Maximum Rows>0 → 指定数まで(ソースの行数が少なければそれに合わせる)

行順: 並べ替え設定で決まります:

  • ソート列なし → ソース計算機の順序を維持
  • ソート列あり → ソート列と方向に従って行を並べ替え

インタラクティブ機能

行をクリック: 多くの場合、行をクリックすると元のケースや詳細をドリルダウン表示可能で、ソース計算機と同様の操作が可能です。

エクスポート機能: 洗練された出力はExcelやCSVファイルにエクスポートでき、mindzieプラットフォームにアクセスできないステークホルダーとの共有に最適です。

メール連携: 自動メール配信と組み合わせて、プロセスオーナーや経営層に焦点を絞ったデータサブセットを定期的に送信する用途が一般的です。

ダッシュボードウィジェット: 簡素で焦点の絞られた出力は、限られたスペースのダッシュボードウィジェットに埋め込むのに最適です。

利用のヒント

  • Data Selectorを実行する前に必ずソース計算機が正常に完了していることを確認してください
  • 計算機設定のプレビュー機能を使い、利用可能な列を事前に確認しましょう
  • 列名は大文字小文字を区別します。ソースの表記と完全に一致させる必要があります
  • 並べ替えと行数制限を組み合わせる場合、まず並べ替えが行われ、その後行数制限が適用されます(「上位N」選択が可能)
  • ソース計算機に結果がなかったりエラーの場合、Data Selectorは空のテーブルを出力します
  • 複数のData Selector計算機を順に使うことでデータを段階的に絞り込むことができます

よくあるパターン

ダッシュボードパターン: 複雑な計算機 → Data Selector(主要列、上位N行を選択)→ ダッシュボードウィジェット

メールパターン: 分析計算機 → Data Selector(実用的なデータに集中)→ 自動メール配信

エクスポートパターン: 包括的な分析 → Data Selector(外部ステークホルダー向けに簡素化)→ Excelエクスポート

パイプラインパターン: 計算機A → Data Selector 1(絞り込み)→ 計算機B(さらなる分析)→ Data Selector 2(最終出力)

Data Selectorは、包括的な詳細分析ではなく、焦点を絞った実用的な情報を必要とするステークホルダーに分析結果を提示する際に特に価値があります。詳細なプロセスマイニング分析と明確な意思決定支援レポートの橋渡し役となります。


このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。