アクティビティ順序分類

概要

アクティビティ順序分類のエンリッチメントは、イベントログ内のタイムスタンプを自動的に解析し、タイムスタンプの制約によりアクティビティの順序が確実に特定できないケースを検出します。このデータ品質のエンリッチメントは、プロセスマイニングの精度に不可欠です。不確実なアクティビティ順序は、誤ったプロセスモデルの生成、誤解を招くパフォーマンス指標、信頼性の低い適合性検証結果につながる可能性があります。

多くのソースシステムでは、時刻成分なしの日時のみが記録されるか、一括データインポート、バッチ処理、またはタイムスタンプの粒度制限により複数のアクティビティが同一のタイムスタンプを共有します。ケース内のイベントが同一のタイムスタンプ(同じ日付または同じ日時)を持つ場合、これらのアクティビティが実際に発生した順序は曖昧になります。このエンリッチメントはこれらの不確実性パターンを自動的に検出・分類し、プロセス発見結果の信頼性を評価し、順序の推定が誤っている可能性のあるケースを特定できる属性を作成します。

設定は不要で、日付レベルおよび時刻レベルの精度の両方にわたりタイムスタンプの包括的な解析を行い、不確実性パターンを「SameDay」(日付は記録されているが時刻成分なし)、「SameTime」(同一の日時値)、「SameDayAndTime」(ケース内に両パターンが含まれる)として分類します。これにより、イベントログのタイムスタンプ不確実性の範囲と性質を理解し、データ品質要件およびプロセス分析の信頼性について情報に基づいた判断を行えます。

主な用途

  • プロセス発見や適合性検証の前にデータ品質を評価する
  • タイムスタンプの制限によりアクティビティの順序が曖昧なケースを特定する
  • 同一タイムスタンプを共有する一括ロードやバッチ処理イベントを検出する
  • プロセス分析におけるソースシステムのタイムスタンプ粒度が十分か評価する
  • 正確な分析のために手動の順序推定が必要なケースを識別する
  • イベントログ全体のタイムスタンプ不確実性の頻度を測定する
  • 順序不確実性が分析結果に悪影響を及ぼす低品質ケースを除外する

設定

このエンリッチメントには設定不要です。イベントログ内のすべてのタイムスタンプを自動的に分析し、イベントレベルおよびケースレベルでタイムスタンプ不確実性パターンを分類する包括的な属性を作成します。このエンリッチメントをワークフローに追加するだけで、タイムスタンプの品質分析を開始できます。

事例

事例1: 医療機関の患者経過分析

シナリオ: 病院が救急部門の患者フローを分析中、同じ日に複数のアクティビティが時刻成分なしで記録されており、実際の治療や検査の順序が判別できないことに気付きました。

設定: 設定不要 - エンリッチメントが自動的にタイムスタンプ不確実性を検出します。

出力: 次の属性が作成されます。

イベントレベル属性:

  • OrderUncertainty: 順序が確実に決定できないイベントには TRUE
  • OrderUncertaintyCategory: 他イベントと日付が同じだが時刻成分がない場合は "SameDay"

ケースレベル属性:

  • UncertainEventOrder: TRUE(このケースは順序不確実性あり)
  • UncertainEventOrderCount: 8(このケース内で順序不確実なイベントは8件)
  • UncertainEventOrderCategory: "SameDay"

患者ケースのイベント記録例:

  • 2024-03-15 00:00:00 - 患者登録
  • 2024-03-15 00:00:00 - トリアージ評価
  • 2024-03-15 00:00:00 - バイタルサイン確認
  • 2024-03-15 00:00:00 - 医師面談
  • 2024-03-15 14:30:00 - 検査結果受領
  • 2024-03-15 14:30:00 - 治療方針決定
  • 2024-03-15 14:30:00 - 薬剤投与
  • 2024-03-15 18:00:00 - 退院

最初の4つのイベント(すべて00:00:00)は時刻成分がないため「SameDay」不確実性が付与されます。14:30:00の3つのイベントは同一日時を共有するため「SameTime」不確実性が割り当てられます。このケースは両方のパターンを示すため「SameDayAndTime」として分類されます。

洞察: 病院は緊急部門ケースの67%で登録システムの時刻成分欠如に起因する順序不確実性があることを発見しました。これは正確なプロセス発見を行う前に対処すべき重要なデータ品質問題です。完全なタイムスタンプのみのケースを分析対象に絞る、あるいはIT部門と連携してソースシステムのタイムスタンプ粒度を向上させることを検討できます。

事例2: 金融取引処理

シナリオ: 銀行がクレジットカード取引承認プロセスを分析中、バッチ処理された取引で複数のイベントが同一タイムスタンプを共有しており、詐欺チェックや承認判定の実際の順序が判別できません。

設定: 設定不要。

出力: バッチシステムで処理された取引ケース例:

  • 2024-10-15 02:15:33 - 取引受領
  • 2024-10-15 02:15:33 - 不正リスク評価
  • 2024-10-15 02:15:33 - クレジット枠確認
  • 2024-10-15 02:15:33 - マーチャント確認
  • 2024-10-15 02:15:33 - 取引承認
  • 2024-10-15 02:15:34 - 確認送信

イベント属性:

  • 最初の5イベント:OrderUncertainty = TRUE、OrderUncertaintyCategory = "SameTime"
  • 最終イベント:OrderUncertainty = FALSE

ケース属性:

  • UncertainEventOrder: TRUE
  • UncertainEventOrderCount: 5
  • UncertainEventOrderCategory: "SameTime"

洞察: 取引の約40%がバッチ処理されており、重要な不正確認と承認チェックの順序が不確実であることが判明しました。バッチ処理システムに内部シーケンス番号があるか調査したり、取引ログのタイムスタンプ精度向上を検討するきっかけとなります。

事例3: 製造生産ライン分析

シナリオ: 製造会社が生産ワークフローを分析中、品質管理のチェックポイントは日付のみで記録され、機械操作は精密なタイムスタンプを持つため、混在した不確実性パターンが発生しています。

設定: 設定不要。

出力: 生産ケース例:

  • 2024-10-20 08:15:22 - 原材料投入
  • 2024-10-20 08:18:45 - 加工開始
  • 2024-10-20 00:00:00 - 視覚検査
  • 2024-10-20 08:45:12 - 加工完了
  • 2024-10-20 00:00:00 - 寸法検査
  • 2024-10-20 00:00:00 - 品質承認
  • 2024-10-20 09:10:30 - 梱包開始

イベント属性:

  • 視覚検査、寸法検査、品質承認: OrderUncertainty = TRUE、OrderUncertaintyCategory = "SameDay"
  • その他イベント: OrderUncertainty = FALSE

ケース属性:

  • UncertainEventOrder: TRUE
  • UncertainEventOrderCount: 3
  • UncertainEventOrderCategory: "SameDay"

洞察: 手動の品質管理システムは日付のみ記録する一方で、自動化機械操作は精密な時刻を記録しているため、品質チェックの実施順序が判別できません。品質管理のログ記録のアップグレードや、不確実性を考慮したプロセス分析の調整を優先できます。

事例4: Eコマース注文処理

シナリオ: オンライン小売店が注文処理ワークフローを分析中、倉庫管理システムのイベントが高速スキャンにより同一タイムスタンプを多数持ち、真の順序を特定できません。

設定: 設定不要。

出力: 迅速な注文処理のケース例:

  • 2024-10-21 10:23:45 - 注文受領
  • 2024-10-21 10:24:18 - 在庫割当
  • 2024-10-21 10:24:18 - ピックリスト生成
  • 2024-10-21 10:24:18 - 商品ピック
  • 2024-10-21 10:24:18 - 品質確認
  • 2024-10-21 10:24:18 - 梱包完了
  • 2024-10-21 10:25:03 - 送り状作成

イベント属性:

  • 10:24:18 の5イベント: OrderUncertainty = TRUE、OrderUncertaintyCategory = "SameTime"

ケース属性:

  • UncertainEventOrder: TRUE
  • UncertainEventOrderCount: 5
  • UncertainEventOrderCategory: "SameTime"

洞察: 倉庫の作業が非常に高速で、多くの処理が同一1秒内に実施されているため、タイムスタンプの粒度が不足していることが判明。注文の約25%で倉庫業務の順序が不確実です。倉庫管理システムへのサブ秒精度や同秒イベントのシーケンス番号追加を検討します。

事例5: ITサービスデスクのチケット解決

シナリオ: IT部門がサポートチケット解決プロセスを分析中、ステータスの一括更新や自動処理が同一タイムスタンプを共有し、トラブルシューティングの実際の順序が不確定です。

設定: 設定不要。

出力: サポートチケットケース例:

  • 2024-10-18 09:15:00 - チケット作成
  • 2024-10-18 09:15:00 - 自動割当
  • 2024-10-18 09:15:00 - 優先度設定
  • 2024-10-18 09:15:00 - SLAタイマー開始
  • 2024-10-18 10:30:22 - 技術者割当
  • 2024-10-18 00:00:00 - 初期調査
  • 2024-10-18 00:00:00 - 根本原因特定
  • 2024-10-18 00:00:00 - 解決策適用
  • 2024-10-18 14:45:10 - チケット終了

イベント属性:

  • 最初の4イベント: OrderUncertainty = TRUE、OrderUncertaintyCategory = "SameTime"
  • 中盤の3イベント: OrderUncertainty = TRUE、OrderUncertaintyCategory = "SameDay"

ケース属性:

  • UncertainEventOrder: TRUE
  • UncertainEventOrderCount: 7
  • UncertainEventOrderCategory: "SameDayAndTime"

洞察: 自動化されたチケット作成は同一タイムスタンプを共有し、手動調査は日付のみで記録されており、55%のチケットで混合した不確実性パターンが発生。これによりプロセスマイニング結果の順序誤りが予想されます。ITサービス管理システムのタイムスタンプ粒度改善をベンダーと協議し、信頼性の高い発見結果を目指します。

出力

アクティビティ順序分類のエンリッチメントは、イベントレベルおよびケースレベルの両方で包括的な属性を作成し、プロセスデータのタイムスタンプ不確実性を詳細に分析可能にします。

イベントレベル属性:

OrderUncertainty(ブール): この特定イベントが同一ケース内の他のイベントと比較して順序が不確実かどうかを示します。少なくとも1つの他のイベントと同じタイムスタンプ(日付のみまたは日時両方)を共有し、順序が曖昧な場合は TRUE、ケース内で一意のタイムスタンプの場合は FALSE。

OrderUncertaintyCategory(テキスト): このイベントのタイムスタンプ不確実性の種類を分類します:

  • "SameDay": 他のイベントと日付は同じだが時刻成分がなく、ソースシステムが日付のみ記録している場合
  • "SameTime": 他のイベントと完全に同一の日時を持ち、同時実行かタイムスタンプ粒度不足を示す場合
  • "SameDayAndTime": 両方のパターンが見られる場合(初期は SameDay とし、その後 SameTime も該当)

ケースレベル属性:

UncertainEventOrder(ブール): このケースが順序不確実なイベントを含むかを示す。ケース内に少なくとも1件の重複タイムスタンプに起因する順序不確実なイベントがあれば TRUE、すべてのイベントが一意な場合は FALSE。

UncertainEventOrderCount(整数): このケース内で順序不確実なイベントの総数。不確実イベントが2件のケースは、同じタイムスタンプの多数イベントを含むケースよりも問題度が低いと判断できます。

UncertainEventOrderCategory(テキスト): ケース全体のタイムスタンプ不確実性のパターンをまとめたもの:

  • "SameDay": 日付レベルのみの不確実性(同一日付だが時刻成分なしのイベントあり)
  • "SameTime": 時刻レベルのみの不確実性(完全に同一の日時を持つイベントあり)
  • "SameDayAndTime": 両方の不確実性パターンを含む

データ型詳細:

  • ブール属性は TRUE/FALSE で表現され、「equals TRUE」や「equals FALSE」の条件でフィルタに利用可能
  • 整数属性は範囲フィルタや計算に使い、不確実性の頻度を測定可能
  • テキスト属性はグループ化およびフィルタを行い、不確実性パターンごとの分析に活用可能

分析への活用: これらの属性を用いて、不確実な順序を持つケースをデータセットから除外したり、タイムスタンプ不確実性に影響されるケースの割合を示す指標を作成したり、最もタイムスタンプ品質が低いソースシステムやプロセスを特定したりできます。これに基づき、プロセスマイニングの結果に影響するデータ品質課題の優先改善を行えます。属性は mindzieStudio の適合性検証、プロセス発見、パフォーマンス分析機能とスムーズに連携します。

関連情報

  • Allowed Case End Activities - 順序の信頼性が必要な適合性エンリッチメント
  • Allowed Case Start Activities - 最初のイベントタイムスタンプ不確実性に影響される適合性エンリッチメント
  • Duration Between Two Activities - アクティビティ順が不確実な場合に信頼性の低くなるパフォーマンスエンリッチメント
  • Freeze Log Time - 一貫性向上のためにタイムスタンプを正規化するデータクリーンアップエンリッチメント

このドキュメントは mindzie Studio プロセスマイニングプラットフォームの一部です。