バリアント頻度

概要

バリアント頻度フィルターは、データセット内で各プロセスバリアントがどの程度頻繁に発生するかに基づいてケースを選択します。合計ケースの割合として最小および最大の頻度閾値を設定することで、一般的なパターン(高頻度バリアント)または稀なパターン(低頻度バリアント)に焦点を当てることができます。このケースレベルのフィルターは、すべてのケースをプロセスバリアントごとにグループ化し、各バリアントに従うケース数をカウントし、指定した範囲内にあるバリアントのみを保持します。

プロセスバリアントは、プロセスを通じてケースが辿るユニークな活動のシーケンスを表しています。バリアント頻度でフィルタリングすることで、標準的なワークフローを隔離したり、例外的な経路を特定したり、統計的に重要でないパターンを分析から除外したりできます。

一般的な使用例

  • 標準プロセスに集中: 最も一般的なバリアントのみを表示して、典型的なプロセスフローと標準操作手順を理解します。
  • 例外的なケースの特定: 稀にしか発生しないバリアントを隔離し、異常なプロセス経路、例外、または潜在的な問題を検出します。
  • ノイズの除去: ごく稀なバリアントを分析から除去し、統計的に重要でない外れ値や一過性ケースを排除します。
  • プロセスの標準化: 標準化されたバリアントに従うケース数と非標準の経路を比較分析します。
  • コンプライアンス分析: 非常に一般的でないプロセス経路を辿るケースを探し、不遵守行動の可能性を示します。
  • パフォーマンス最適化: 最も頻繁なバリアントに焦点を当て、プロセス改善の最大効果を狙います。

設定

Minimum Percent: 最小頻度閾値を小数のパーセンテージ(0.0~1.0)で指定します。この割合より少ないケースで発生するバリアントは除外されます。0以上であり、Maximum Percent以下でなければなりません。

Maximum Percent: 最大頻度閾値を小数のパーセンテージ(0.0~1.0)で指定します。この割合より多いケースで発生するバリアントは除外されます。1.0以下であり、Minimum Percent以上でなければなりません。

注意: パーセンテージは小数表記です。例えば、10%の場合は0.1、5%の場合は0.05、100%の場合は1.0を使用します。

例 1: 一般的なプロセスバリアントの分析

シナリオ: 最も頻繁に発生するプロセス経路に焦点を当て、標準的な運用を理解したい。10%以上のケースで発生するバリアントのみを表示したい。

設定:

  • Minimum Percent: 0.1
  • Maximum Percent: 1.0

結果: フィルターは、全ケースのうち10%以上で発生するバリアントに属するケースのみを保持します。もし合計1,000ケースある場合、100件以上のケースが含まれるバリアントのみが対象になります。

インサイト: これにより、メインのプロセスフローに集中し、あまり一般的でないバリエーションを除外します。高頻度バリアントに注目することで、標準操作手順を特定し、最も影響の大きいワークフローに改善を集中できます。

例 2: 稀で例外的なバリアントの特定

シナリオ: 例外、エラー、非標準ワークフローを検出するため、ケースのごく一部でしか発生しない異常な経路を特定したい。

設定:

  • Minimum Percent: 0.0
  • Maximum Percent: 0.05

結果: フィルターは、全ケースの5%以下で発生するバリアントに属するケースのみを保持します。1,000ケースがある場合は50件以下のケースで発生するバリアントに限定されます。

インサイト: 稀なバリアントは例外、エラー、回避策、特別取り扱いの手順などを示すことが多いです。これらのケースを分析すると、以下を明らかにできます:

  • 調査が必要なプロセス逸脱
  • コンプライアンス問題や未承認の手順
  • システムエラーやデータ品質問題
  • 例外処理の標準化の機会

例 3: 極端な外れ値の除外

シナリオ: 最も一般的なパターンと最も稀な一過性ケースの両方を除外し、中間のバリアントに焦点を当ててプロセスの適度な変動を分析したい。

設定:

  • Minimum Percent: 0.05
  • Maximum Percent: 0.25

結果: フィルターは、5%から25%の範囲内で発生するバリアントに属するケースのみを保持します。これにより、支配的なバリアントと統計的な外れ値の両方が除外されます。

インサイト: この範囲により、ケースの中程度の層でのプロセス変動を理解できます。これらのバリアントは統計的に有意ですが標準プロセスの一部ではなく、以下を示します:

  • 二次的な標準プロセス
  • 季節的または条件付きのワークフロー
  • 定期的に発生するが主流ではないプロセスの選択肢

例 4: プロセス最適化のための高頻度バリアントの抽出

シナリオ: 全ケースの20%以上を占める上位バリアントに集中し、改善が大部分の作業負荷に影響を及ぼすようにしたい。

設定:

  • Minimum Percent: 0.2
  • Maximum Percent: 1.0

結果: フィルターは、全ケースの20%以上で発生するバリアントに属するケースのみを保持します。1,000ケース中200件以上のバリアントが含まれます。

インサイト: 高頻度バリアントに注目することで、

  • プロセス改善の効果が最大になる
  • 分析の統計的意義が高まる
  • リソースを最も一般的なワークフローに割り当てられる
  • 標準化の取り組みを適切なプロセスに集中できる

出力

フィルターは、指定した頻度範囲に含まれるプロセスバリアントを持つケースのみを含む新しいデータセットを返します。各ケースは元のすべてのイベントと属性を保持します。バリアントの構造と活動のシーケンスは変更されず、条件を満たすバリアントのケースのみが保持されます。

指定した頻度範囲に該当するバリアントがない場合は、空の結果セットが返されます。

技術的注意点

  • フィルター種別: ケースレベルのフィルター(個々のイベントではなくケース全体を除外)
  • グルーピングロジック: ケースをバリアントでグループ化し、発生数をカウント後、頻度閾値を適用
  • 頻度計算: パーセンテージ閾値を総ケース数に基づく絶対数に変換
  • 範囲の包含: 最小値・最大値ともに含む
  • 検証: Minimum PercentがMaximum Percentを超えないこと、および両者が0.0から1.0の範囲内であることを確認

このドキュメントはmindzieStudioプロセスマイニングプラットフォームの一部です。