非稼働期間からのデータ削除
概要
Remove Data from Underactive Periods フィルターは、低活動期間を特定して削除することで、プロセスログの開始部分と終了部分を自動的にトリミングします。このインテリジェントなケースレベルのフィルターは、日毎のイベント頻度を計算し、平均活動レベルを算出し、指定した閾値を下回る「ウォームアップ」や「クールダウン」期間に該当するケースを削除します。安定した状態でのプロセス運用を分析する際に、起動および停止期間を除去するのに特に有用です。
よくある用途
- プロセスログの開始時のシステムウォームアップ期間を除去
- データ収集期間の終了時のクールダウン期間を排除
- ランプアップ期間を除外し、安定稼働の分析に集中
- フル展開前のパイロットプログラムによるログをクリーンアップ
- システム移行や切替期間の低活動期間を削除
- 正常な運用を表さないデータ収集期間をトリミング
設定
Start Factor: 平均日次イベント数に乗じる係数で、含める初日の閾値を決定します。日々の活動が StartFactor × 平均値を上回る日から含まれます。
End Factor: 平均日次イベント数に乗じる係数で、含める最終日の閾値を決定します。日々の活動が EndFactor × 平均値を上回る日まで含めます。
| 設定名 | 目的 | 一般的な値 | 効果 |
|---|---|---|---|
| Start Factor | 開始部分のトリミングの厳しさを調整 | 0.1 - 0.5 | 小さいほど緩やか、大きいほど厳しくトリミング |
| End Factor | 終了部分のトリミングの厳しさを調整 | 0.1 - 0.5 | 小さいほど緩やか、大きいほど厳しくトリミング |
動作概要:
- ログ全体の1日あたりのイベント数を計算
- 平均(日次平均)イベント数を算出
- 活動が (Start Factor × 平均) を超える最初の日を特定
- 活動が (End Factor × 平均) を超える最後の日を特定
- この期間外に該当するケースをすべて削除
例
例1:システム起動期間の除去
シナリオ: 新しい注文管理システムが1月1日に稼働開始しましたが、最初の2週間はパイロットユーザーのみが使用しておりシステムの検証中でした。この低活動の起動期間を除去し、1月中旬以降の正常稼働に焦点を当てたい場合。
設定:
- Start Factor: 0.3
- End Factor: 0.1
結果:
平均日次イベント数が500の場合、Start Factor=0.3で150イベント(平均の30%)を超える最初の日(1月14日)から開始。1月初旬に20〜80イベントのみの日は除外されます。End Factor=0.1により終了側のトリミングは最小限で、50イベント未満の日だけが除去されます。
考察: パイロット期間を除去して、実際の運用パフォーマンスを反映する分析が可能に。サイクルタイム、バリアント頻度、ボトルネック分析が、システムの完全採用後の安定した操作を示しています。
例2:年末データ収集のクリーンアップ
シナリオ: データ収集は12月31日に終了しましたが、12月下旬にはスタッフの休暇により活動が低下。1月初旬は活動がゆっくりと立ち上がったため、正常な体制期間のみを分析したい場合。
設定:
- Start Factor: 0.2
- End Factor: 0.2
結果:
StartとEndの係数を同じに設定し、両端の低活動期間を削除。平均日次イベント数が800の場合、160イベント未満の日を除外。12月下旬の休日減少(50〜100イベント)と1月のゆっくりした立ち上がりが取り除かれ、完全な体制での期間のみを分析可能。
考察: 季節的な変動や休日の影響を除き、通常運用の能力を反映した分析に。平均ケース期間やリソース利用率などが、骨格スタッフ期間による偏りなしに示されます。
例3:成熟システム稼働の分析
シナリオ: 長期間稼働中のシステムの分析で、最新数日間の未完了データを除外したい。開始側は厳しくトリムし、終了側は穏やかにしたい場合。
設定:
- Start Factor: 0.5
- End Factor: 0.1
結果:
Start Factor=0.5により平均活動の50%以上の日のみ開始から含め、遅い期間を積極的に除去。End Factor=0.1により、終了側は平均の10%以上あればほぼすべての日を維持。成熟期間をしっかりと押さえつつ最新データも保持。
考察: 厳しい開始トリミングで成熟した稼働期間を保証し、緩やかな終了トリミングでトレンド分析に必要な最新データを残します。過去データが豊富で安定した最近の期間に分析を絞りたい場合に最適。
例4:完全な分析のための保守的トリミング
シナリオ: できるだけ多くのデータを含めつつ、開始と終了の極端な低活動期間のみを除きたい。自然に変動のある活動レベルのプロセスで有効な運用データを失いたくない場合。
設定:
- Start Factor: 0.1
- End Factor: 0.1
結果:
両方の係数を0.1に設定し、平均日次イベント数の10%未満の日のみ除去。例えば平均1000イベントの場合、100イベント未満の日のみトリミング。最も明らかなウォームアップとクールダウンのみを除去し、通常の変動がある期間は保持。
考察: 週末や休日など自然に静かな時間帯もデータ保持されるため、貴重なデータ損失を防げます。活動のばらつきが大きいプロセスや歴史的な完全カバレッジが求められる場合に推奨。
出力
このフィルターはケースレベルで動作し、日付に基づくフィルタリングを行います:
- 活動閾値に基づき最適な開始日と終了日を自動計算
- 計算された期間外に該当するケースをすべて削除
- 活動期間内のケースはすべて変更せず保持
- イベントデータ自体は変更せず、日付によるケースフィルタのみを適用
- 活動計算が不可能な場合は元データを返す
結果として、プロセスマイニング分析がゆがむ可能性のある低活動な起動・停止期間を除いた安定稼働の期間にフォーカスしたデータセットを生成します。
このドキュメントは mindzie Studio プロセスマイニングプラットフォームの一部です。