データセレクター

概要

Data Selector（データセレクター）計算機は、他の計算機の出力から特定の列を抽出し、必要に応じて結果を並べ替え、行数を制限できるデータ後処理ツールです。この計算機は、関連する列を選択しデータを並べ替え、上位N行のみを表示することで、注目すべきデータビューを作成するのに不可欠です。

ほとんどの計算機がプロセスデータを直接分析するのに対し、Data Selectorは他の計算機の出力テーブルを扱うため、ダッシュボードやレポート、エクスポート用の分析結果精査に最適です。

主な用途

ステークホルダー向けのメール送信またはエクスポート用の特定データ部分セットを用意する
複雑な分析から重要指標のみを表示する簡潔なダッシュボードビューを作る
大量の分析結果から上位Nの結果を選択・並べ替える（例：遅延度合いが上位10のケース）
不要な詳細を除外し、レポートを関連列に絞る
包括的な分析結果を経営層向けにわかりやすく要約する
複数の計算機を連結し、各段階で特定の出力を選択してデータパイプラインを作成する

設定

Source Calculator: 出力を利用する計算機ブロックを選択します。この計算機は現在のノートブックで既に実行されている必要があります。

Source Table: ソース計算機が複数の結果テーブルを生成する場合に使用するテーブルを選択します。ほとんどの計算機は単一のテーブル（インデックス0）を生成しますが、一部は異なる種類の情報を含む複数テーブルを返します。

Columns to Include: 出力に含めるソーステーブルの列を選択します。複数列を選択可能で、指定した順序で表示されます。列名はソース計算機の出力と完全に一致している必要があります。

Sort Column: 結果を並べ替える列を任意で指定します。指定しない場合、データはソース計算機の出力順のままになります。

Sort Direction: 並べ替えを有効にした場合、以下のいずれかを選択します：

昇順: 小さい順（A-Z、0-9、古い順）
降順: 大きい順（Z-A、9-0、新しい順）

Maximum Rows: 出力に含める最大行数を指定します。0または空欄で制限なしとなります。並べ替えと組み合わせることで、「トップN」結果の抽出が可能です（例：降順で並べ替えた遅延上位20ケースなど）。

例

例1: 経営レポート向け最も遅い10件の購買注文

シナリオ: Case Duration計算機が2,500件の購買注文を分析しましたが、経営ダッシュボードには遅延が最も大きい10件のみを表示したい。

設定:

Source Calculator: "Purchase Order Duration Analysis"
Source Table: 0（主結果テーブル）
Columns to Include: ["Case ID", "Supplier Name", "Duration", "Total Value"]
Sort Column: Duration
Sort Direction: 降順
Maximum Rows: 10

出力:

厳選4列10行のフォーカスされた表を表示：

Case ID	Supplier Name	Duration	Total Value
PO-2024-8821	Acme Manufacturing	47.3 days	$125,400
PO-2024-9156	Global Supplies Inc	42.8 days	$89,200
PO-2024-7633	TechParts Ltd	38.5 days	$156,800
...	...	...	...

洞察: 必要な列のみ選択し10行に制限することで、2,500件の煩雑なデータに煩わされることなく問題のあるケースを強調したダッシュボードが作成できました。Durationの降順並べ替えにより、最も緊急のケースが先頭に表示されます。Total Value列の追加で遅延の財務影響もわかります。

例2: メール配信用週間アクティビティ概要

シナリオ: 45種類の異なるアクティビティに関する詳細統計を生成する週間頻度分析を実施。プロセス所有者へ最も頻度の高い15アクティビティのみを簡潔な指標でメール送信したい。

設定:

Source Calculator: "Weekly Activity Frequency Report"
Source Table: 0
Columns to Include: ["Activity Name", "Event Count", "Percentage of Total Events"]
Sort Column: Event Count
Sort Direction: 降順
Maximum Rows: 15

出力:

メール送信用にシンプルでフォーカスされた表：

Activity Name	Event Count	Percentage of Total Events
Create Purchase Requisition	1,847	18.2%
Manager Approval	1,823	17.9%
Vendor Selection	1,792	17.6%
...	...	...

洞察: 「First Occurrence」や「Last Occurrence」等の煩雑な列を除外し、プロセスの主要活動を示す必要指標のみを保持しました。受信者は上位3つのアクティビティがプロセスイベントの半数以上を占めることを即座に把握できます。

例3: 顧客分析ダッシュボードの簡略化

シナリオ: Breakdown by Categories計算機は12種類の指標で顧客を分析しましたが、ダッシュボードウィジェットにはトップ20顧客の5列だけ表示するスペースがあります。

設定:

Source Calculator: "Customer Performance Analysis"
Source Table: 0
Columns to Include: ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
Sort Column: Total Revenue
Sort Direction: 降順
Maximum Rows: 20

出力:

ダッシュボード向けの集約表：

Customer Name	Case Count	Average Duration	Total Revenue	On-Time Percentage
MegaCorp Industries	487	8.2 days	$4,850,000	92%
TechStart Solutions	356	7.5 days	$3,240,000	95%
Global Systems Inc	298	9.1 days	$2,870,000	88%
...	...	...	...	...

洞察: 12列にわたる分析を5列に絞り、主要顧客の売上高、注文数、平均処理時間、納期遵守率を表示。売上高で降順並び替えし、重要な顧客がすぐわかるようにしています。

例4: バリアント分析 - 発生頻度上位バリアント

シナリオ: バリアント分析で284種類のユニークなプロセスバリアントを特定しました。ケースの約80％を占める上位25の一般的なバリアントに改善注力したい。

設定:

Source Calculator: "Process Variant Analysis"
Source Table: 0
Columns to Include: ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
Sort Column: Frequency
Sort Direction: 降順
Maximum Rows: 25

出力:

Variant ID	Frequency	Cumulative Percentage	Average Duration	Contains Rework
VAR-001	1,245	24.8%	6.2 days	No
VAR-002	876	42.2%	8.5 days	Yes
VAR-003	623	54.6%	5.8 days	No
...	...	...	...	...

洞察: 上位25バリアントがプロセスのコアを形成し、累積比率で大部分のケースをカバーしていることが示されています。「Contains Rework」列で再作業を含むバリアントが即座に分かり、改善優先度付けに役立ちます。

例5: トレンド分析のための期間指定分析

シナリオ: Rate-over-time計算機が90日間のデイリースタティスティクスを生成しました。行数制限なしで日時順に主要指標のみを表示し、完全なトレンド分析に使いたい。

設定:

Source Calculator: "90-Day Completion Rate Analysis"
Source Table: 0
Columns to Include: ["Date", "Cases Completed", "Completion Rate"]
Sort Column: Date
Sort Direction: 昇順
Maximum Rows: 0（制限なし）

出力:

90行すべてを日時順で表示：

Date	Cases Completed	Completion Rate
2024-10-01	23	87.4%
2024-10-02	28	91.2%
2024-10-03	31	89.7%
...	...	...

洞察: 日付の昇順で並べ替え、行制限なしにより完全な時系列データを保持。「標準偏差」や「最小/最大」などの統計列を除外し、基本トレンド視覚化に適した清潔なデータに簡略化しています。

例6: 複数テーブルのソース選択

シナリオ: Conformance checkerが2つのテーブルを返します。テーブル0は概要統計、テーブル1は詳細な違反一覧です。詳細違反テーブルからレポートを作成します。

設定:

Source Calculator: "Standard Process Conformance Check"
Source Table: 1（詳細テーブル）
Columns to Include: ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
Sort Column: Violation Type
Sort Direction: 昇順
Maximum Rows: 100

出力:

Case ID	Violation Type	Activity Name	Timestamp
CS-1234	Missing Required Step	Invoice Approval	2024-11-15 14:22
CS-5678	Missing Required Step	Purchase Approval	2024-11-16 09:15
CS-9012	Out of Sequence	Goods Receipt	2024-11-16 11:45
...	...	...	...

洞察: デフォルトのテーブル0ではなく1を選択することで、概要でなく詳細な違反データにアクセスできます。違反タイプで昇順に並べ替え、類似問題をグループ化しパターン発見を容易にしています。100行制限で管理しやすい報告書になっています。

出力

Data Selectorは、選択した正確な列を指定の順序で表示するテーブルを出力します。テーブル構造は列選択によって動的に変わります。

出力の特長

列構成: 「Columns to Include」で選択した列のみが出力に表示され、元のデータ型やフォーマットも保持されます。

行数: Maximum Rows設定に従います：

Maximum Rows = 0または空欄の場合：ソーステーブルの全行
Maximum Rows > 0の場合：指定行数まで（ソースが行数不足ならそれ以下）

行順: 並べ替え設定に依存します：

並べ替え列未指定：ソース計算機と同じ順序
並べ替え列指定：指定列・方向で並べ替えられた順序

インタラクティブ機能

行のクリック: 多くの場合、行をクリックすると元のケースや詳細情報をドリルダウン表示できます。

エクスポート機能: 洗練された出力をExcelやCSVにエクスポート可能。mindzieプラットフォーム非利用者と共有するのに便利です。

メール連携: 自動メール配送に活用され、プロセス所有者や経営層へフォーカスされたデータを定期送信できます。

ダッシュボードウィジェット: スペースが限られるダッシュボードに埋め込むのに最適なシンプルで集約された出力です。

使用のヒント

Data Selector実行前にソース計算機が正常に実行されていることを確認する
計算機設定のプレビュー機能でソースの利用可能列を確認する
列名は大文字小文字を区別しソースの表記と完全一致させる
並べ替えと行制限併用時は、先に並べ替え適用後に行数制限（上位N抽出）される
ソース計算機に結果なしまたはエラーがある場合、Data Selectorは空のテーブルを出力
複数のData Selectorを連続使用し段階的にデータ絞り込みが可能

よくあるパターン

ダッシュボードパターン: 複雑な計算機 -> Data Selector（重要列・上位N） -> ダッシュボードウィジェット

メールパターン: 分析計算機 -> Data Selector（実行可能データに絞り込み） -> 自動メール配信

エクスポートパターン: 包括的分析 -> Data Selector（外部向け簡略化） -> Excelエクスポート

パイプラインパターン: 計算機A -> Data Selector 1（絞り込み） -> 計算機B（追加分析） -> Data Selector 2（最終出力）

Data Selectorは、詳細なプロセスマイニング分析と明確で意思決定に使いやすいレポーティングの橋渡し役として、ステークホルダーに焦点を絞った実用的情報を提示する必要がある場合に特に有用です。

このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。