ログ内のケース複製

概要

ログ内のケース複製エンリッチメントは、既存のケースを物理的にコピーしてイベントログ内に複製します。これは、テスト目的向けに特化した管理者専用ツールであり、ケースIDを変更してケースを複製することで、データセットを迅速に拡大可能です。複製された各ケースは、元のすべてのイベントと属性を保持しつつ、元のケースと区別するために新しいユニークな識別子が割り当てられます。

このエンリッチメントは、プロセスマイニング分析やフィルター、ダッシュボードが大規模なデータセットでどのように動作するかをテストしたい場合や、トレーニング・デモ用の合成データを作成したい場合に特に有用です。

注意: 本エンリッチメントは、データ容量に与える大きな影響と、運用分析ではなくテスト・開発シナリオを目的としているため、管理者のみが使用可能です。

主な用途

  • 小規模テストデータセットを拡大して運用規模のデータ量をシミュレートする
  • ダッシュボードや計算機のパフォーマンス評価のためのストレステストシナリオを作成する
  • 大量のケース数でフィルターの動作をテストするためにデータを複製する
  • トレーニング用に十分なボリュームのデモ用データセットを準備する
  • データ負荷増加時のシステム性能と応答時間をテストする
  • エンリッチメントや計算が大規模データセットに正しく対応しているか検証する

設定

コピー数: それぞれのケースをいくつ複製するか指定します。例えば、「5」に設定すると、元のケースごとに5つのコピーが作成され、合計ケース数は6倍(元のケース1つ+コピー5つ)になります。デフォルトは1で、データセットが2倍になります。

パフォーマンステスト用のデータセット拡張

シナリオ: 100ケースのプロセスログがあり、本番展開前にダッシュボードが1,000ケースでどのように動作するかテストしたい。

設定:

  • コピー数: 9

変更前: | Case ID | Activity | Timestamp | |---------|----------|-----------| | PO-001 | Create Order | 2024-01-15 09:00 | | PO-001 | Approve Order | 2024-01-15 10:00 | | PO-002 | Create Order | 2024-01-15 11:00 | | PO-002 | Approve Order | 2024-01-15 12:00 |

変更後(PO-001のコピーを表示): | Case ID | Activity | Timestamp | |---------|----------|-----------| | PO-001 | Create Order | 2024-01-15 09:00 | | PO-001 | Approve Order | 2024-01-15 10:00 | | PO-001_2 | Create Order | 2024-01-15 09:00 | | PO-001_2 | Approve Order | 2024-01-15 10:00 | | PO-001_3 | Create Order | 2024-01-15 09:00 | | ... | ... | ... | | PO-001_10 | Create Order | 2024-01-15 09:00 | | PO-001_10 | Approve Order | 2024-01-15 10:00 |

結果: 元の100ケースデータセットが1,000ケースに拡張され、規模に応じたパフォーマンステストが可能に。

知見: ケースを複製後、計算機のパフォーマンスボトルネックを特定し、本番環境でのデータ量に対応するために最適化が必要な可視化も把握できます。

動作の仕組み

  1. ケースの反復: エンリッチメントはイベントログ内のすべてのケースを順に処理します
  2. ケース複製: 各元のケースごとに指定された数のコピーを作成します
  3. ID生成: 各コピーには元のIDに "_n"(nはコピー番号で2から開始)を付加し、ユニークなケースIDを割り当てます
  4. イベントのコピー: 元のケースのすべてのイベントを複製し、タイムスタンプやイベント属性を保持します
  5. 属性の維持: 計算列を除くケースレベルのすべての属性を新しいケースにコピーします
  6. ログの確定: 拡張されたケースおよびイベントテーブルでイベントログを確定します

出力

エンリッチメントはイベントログを以下のように変更します:

  • 新規ケース: (NumberOfCopies × 元のケース数)のケースが追加されます
  • ケースID: 新規ケースは「OriginalCaseId_n」という形式のIDを持ち、nはコピー番号(2、3、4…)
  • イベント: 新規ケースは元のケースのすべてのイベントを正確に複製します
  • 属性: 複製されたケースとイベントで、すべてのケースおよびイベント属性が保持されます

重要な注意点:

  • 新しい属性は作成されません
  • 元のケースは変更されません
  • 計算列はコピーされず(データに基づき再計算されます)
  • 非表示列は新規イベントにコピーされません

ベストプラクティス

  • 開発またはテスト環境でのみ使用してください
  • データ量に注意してください - 大量データの複製は処理時間を大幅に増加させます
  • テスト後はエンリッチメントを削除するか、ノートブックの別コピーを保存してください
  • 重複データパターンが計算指標に与える影響を考慮してください

本ドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。