同時発生ペア

概要

Same Time Pairs計算機は、時間的順序を信頼して判定できない問題のあるタイムスタンプデータを持つアクティビティペアを特定します。この専門的なデータ品質計算機は、プロセスデータを解析して、イベントがまったく同時刻に発生しているか、あるいは一方のイベントが日時なしの日付のみで記録されているのに対し、同じ日に別のイベントが具体的な時間を持つアクティビティペアを検出します。これらのタイムスタンプの問題により、どのアクティビティが本当に先に起こったのかを判断できず、プロセスの流れの分析や適合性チェックに影響を及ぼす可能性があります。

主な用途

  • プロセス分析を行う前にイベントのタイムスタンプのデータ品質問題を検出する
  • 同一タイムスタンプで記録されることが多いアクティビティを特定する
  • 日付のみのタイムスタンプと日時付きのタイムスタンプが矛盾するケースを見つける
  • レガシーシステムからのデータ移行後のインポート品質を検証する
  • プロセスマイニング分析における時間的順序の信頼性を評価する
  • 最も問題のあるアクティビティペアを特定し、データクリーンアップの優先順位を決める

設定

この計算機には設定は必要ありません。自動的にプロセスデータ内のすべてのアクティビティペアを分析し、時間的順序に問題のあるペアを特定します。

例1:請求処理データのデータ品質問題を特定する

状況: レガシーERPシステムから請求処理データをインポートした後、プロセスマイニング分析に使用するにはタイムスタンプデータが信頼できるか確認したい。あるアクティビティは完全なタイムスタンプでログされ、別のアクティビティは日付のみで記録されている。

設定:

  • 設定不要 - 計算機は自動実行される

出力:

下記の列を持つテーブルが生成されます:

  • Activity Pair: 「Activity1 -> Activity2」の形式でアクティビティペアを表示
  • Activity 1: ペアの最初のアクティビティ
  • Activity 2: ペアの2番目のアクティビティ
  • Known Order Pair Count: 時間的順序が確実に判定できる(時刻まで異なるタイムスタンプがある)データ内のこのアクティビティペアの出現回数

テーブルにはタイムスタンプに問題があるアクティビティペアのみ表示されます。結果にペアが表示されない場合、そのペアの全てのインスタンスに信頼できる時間的順序があります。

考察:

「Invoice Received -> Invoice Approved」がKnown Order Pair Count 247で現れます。これは、このアクティビティペアの247件は順序が明確ですが、計算機がこのペアを検出した理由は:

  • 両方のアクティビティがまったく同じタイムスタンプ(同時刻に記録)されたケースがある
  • 片方は日付のみで、もう一方は同じ日付で日付と時間が記録されているケースがある

つまり、ほとんどの場合は問題ありませんが、請求書が受領された後か承認された後かを判断できないケースがあり、これは調査が必要な重大なデータ品質問題であることを示しています。

例2:バルクインポートのデータ品質評価

状況: レガシーシステムからの大量データロードを実行し、多くのイベントが移行中に同じタイムスタンプで割り当てられた疑いがある。

設定:

  • 設定不要 - 計算機は自動実行される

出力:

計算機は以下のような高いKnown Order Pair Countを持ちながらも問題ありとされるアクティビティペアを示します:

Activity Pair Known Order Pair Count
Order Created -> Order Validated 1,523
Order Validated -> Inventory Check 892
Inventory Check -> Shipping Scheduled 456

考察:

これらのペアが結果にあるということは、多数のインスタンスで正しい時間的順序がありますが、同時にタイムスタンプ競合のあるインスタンスも存在することを示します。これは以下の可能性を示唆しています:

  • バルクインポートで一部イベントにデフォルトの深夜タイムスタンプが割り当てられた
  • 特定のアクティビティがバッチ処理され、同時に記録された
  • 移行中にデータ検証ルールが一貫して適用されなかった

これら問題のあるペアの事例を調査し、それが:

  • 合法的な同時実行(珍しいがあり得る)
  • システムクロックの同期問題
  • 修正が必要なデータ移行由来の問題

かどうかを判断すべきです。

例3:リアルタイムプロセスデータの検証

状況: 製造プロセスをリアルタイムにログしている。プロセス制御システムが全アクティビティに適切なタイムスタンプをつけているか確認したい。

設定:

  • 設定不要 - 計算機は自動実行される

出力:

計算機は以下のような非常に低いKnown Order Pair Countを持つ少数の問題あるペアのみを示します:

Activity Pair Known Order Pair Count
Quality Check -> Package 3
Package -> Label 1

考察:

問題のあるペアがごく少数かつカウントが低い結果は肯定的です。これは:

  • 大多数のアクティビティペアに信頼できる時間的順序がある
  • リアルタイムログシステムが正しく機能している
  • 合計4件(3 + 1)のみタイムスタンプ問題がある
  • これら少数のケースは正当な同時実行や軽微なシステムエラーである可能性が高い

プロセスデータが詳細な時間解析、プロセスマイニング、適合性チェックに適していると確信できます。

出力

計算機は時間的順序に問題のあるアクティビティペアのみを表示する単一のテーブルを生成します。テーブルには以下が含まれます:

  • Activity Pair列: 2つのアクティビティ間の方向性関係(Activity1 -> Activity2)を表示
  • 個別アクティビティ列: フィルタリングや分析のために各アクティビティを別々に表示
  • Known Order Pair Count: このペアが信頼できる時間的順序で出現した回数を示し、問題の深刻度を理解するのに役立つ

出力はインタラクティブで、アクティビティペアをクリックすると、時間的順序の問題を引き起こしている具体的なケースに掘り下げられます。

重要な注意点:

  • タイムスタンプ問題が一度も起きないアクティビティペアはこの出力に表示されません
  • Known Order Pair Countが高いほど、頻繁に発生するペアに問題があることを示します
  • 空の結果テーブルはプロセス内すべてのアクティビティペアに信頼できる時間的順序があることを意味します

このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。