ログ内のケース複製
概要
ログ内のケース複製エンリッチメントは、既存のケースを物理的にコピーしてイベントログ内に複製します。これは、テスト目的向けに特化した管理者専用ツールであり、ケースIDを変更してケースを複製することで、データセットを迅速に拡大可能です。複製された各ケースは、元のすべてのイベントと属性を保持しつつ、元のケースと区別するために新しいユニークな識別子が割り当てられます。
このエンリッチメントは、プロセスマイニング分析やフィルター、ダッシュボードが大規模なデータセットでどのように動作するかをテストしたい場合や、トレーニング・デモ用の合成データを作成したい場合に特に有用です。
注意: 本エンリッチメントは、データ容量に与える大きな影響と、運用分析ではなくテスト・開発シナリオを目的としているため、管理者のみが使用可能です。
主な用途
- 小規模テストデータセットを拡大して運用規模のデータ量をシミュレートする
- ダッシュボードや計算機のパフォーマンス評価のためのストレステストシナリオを作成する
- 大量のケース数でフィルターの動作をテストするためにデータを複製する
- トレーニング用に十分なボリュームのデモ用データセットを準備する
- データ負荷増加時のシステム性能と応答時間をテストする
- エンリッチメントや計算が大規模データセットに正しく対応しているか検証する
設定
コピー数: それぞれのケースをいくつ複製するか指定します。例えば、「5」に設定すると、元のケースごとに5つのコピーが作成され、合計ケース数は6倍(元のケース1つ+コピー5つ)になります。デフォルトは1で、データセットが2倍になります。
例
パフォーマンステスト用のデータセット拡張
シナリオ: 100ケースのプロセスログがあり、本番展開前にダッシュボードが1,000ケースでどのように動作するかテストしたい。
設定:
- コピー数: 9
変更前: | Case ID | Activity | Timestamp | |---------|----------|-----------| | PO-001 | Create Order | 2024-01-15 09:00 | | PO-001 | Approve Order | 2024-01-15 10:00 | | PO-002 | Create Order | 2024-01-15 11:00 | | PO-002 | Approve Order | 2024-01-15 12:00 |
変更後(PO-001のコピーを表示): | Case ID | Activity | Timestamp | |---------|----------|-----------| | PO-001 | Create Order | 2024-01-15 09:00 | | PO-001 | Approve Order | 2024-01-15 10:00 | | PO-001_2 | Create Order | 2024-01-15 09:00 | | PO-001_2 | Approve Order | 2024-01-15 10:00 | | PO-001_3 | Create Order | 2024-01-15 09:00 | | ... | ... | ... | | PO-001_10 | Create Order | 2024-01-15 09:00 | | PO-001_10 | Approve Order | 2024-01-15 10:00 |
結果: 元の100ケースデータセットが1,000ケースに拡張され、規模に応じたパフォーマンステストが可能に。
知見: ケースを複製後、計算機のパフォーマンスボトルネックを特定し、本番環境でのデータ量に対応するために最適化が必要な可視化も把握できます。
動作の仕組み
- ケースの反復: エンリッチメントはイベントログ内のすべてのケースを順に処理します
- ケース複製: 各元のケースごとに指定された数のコピーを作成します
- ID生成: 各コピーには元のIDに "_n"(nはコピー番号で2から開始)を付加し、ユニークなケースIDを割り当てます
- イベントのコピー: 元のケースのすべてのイベントを複製し、タイムスタンプやイベント属性を保持します
- 属性の維持: 計算列を除くケースレベルのすべての属性を新しいケースにコピーします
- ログの確定: 拡張されたケースおよびイベントテーブルでイベントログを確定します
出力
エンリッチメントはイベントログを以下のように変更します:
- 新規ケース: (NumberOfCopies × 元のケース数)のケースが追加されます
- ケースID: 新規ケースは「OriginalCaseId_n」という形式のIDを持ち、nはコピー番号(2、3、4…)
- イベント: 新規ケースは元のケースのすべてのイベントを正確に複製します
- 属性: 複製されたケースとイベントで、すべてのケースおよびイベント属性が保持されます
重要な注意点:
- 新しい属性は作成されません
- 元のケースは変更されません
- 計算列はコピーされず(データに基づき再計算されます)
- 非表示列は新規イベントにコピーされません
ベストプラクティス
- 開発またはテスト環境でのみ使用してください
- データ量に注意してください - 大量データの複製は処理時間を大幅に増加させます
- テスト後はエンリッチメントを削除するか、ノートブックの別コピーを保存してください
- 重複データパターンが計算指標に与える影響を考慮してください
本ドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。