重複ケース
概要
Duplicate Cases計算ツールは、選択された属性において同一の値を持つケースを特定します。この強力なデータ品質ツールは、重複エントリ、システムエラー、プロセスデータのデータ整合性問題を見つけるのに役立ちます。
一般的な使用例
- 複数回入力されたケースの検出
- システムエラーによる重複ケースの特定
- 二重支払いの可能性の検出
- 重複した注文や請求書の発見
- データ移行の整合性検証
設定
Column Names: 重複ケースを判別するために使用する属性のリストを選択します。選択したすべての属性で同一の値を持つケースが重複としてフラグされます。
Max Rows: 出力に表示する最大行数を指定します。
例
潜在的な重複請求書の特定
シナリオ: 同じベンダー、金額、日付で複数回入力されている可能性のある請求書を特定したい。
設定:
- Column Names: Vendor Name, Invoice Amount, Invoice Date
- Max Rows: 100
出力:
計算ツールは2つの表示オプションを提供します:
Duplicate Cases View(デフォルト):
- 選択した属性のユニークな組み合わせごとに1行表示
- 最後の列に、その組み合わせに一致するケース数を表示
- カウントが1より大きいものは潜在的な重複
Expanded View(右上のドロップダウンから選択):
- 一致する属性値ごとにグループ化されたすべての個別ケースを表示
- 設定で指定されていない追加の属性も表示
- 同じグループ内でも他の属性が異なるケースが存在することを明示(例:金額が一致していても異なるInvoice ID)
洞察:
Expanded Viewは特に有用で、選択した属性に基づいて「重複」としてグループ化されたケースが、実際には他の列で異なる値を持つ正当な別ケースである可能性を示します。例えば:
- 同じベンダー、金額、日付でも異なる請求書(Invoice IDを確認)
- 正当な重複支払いとデータ入力ミスの区別
- システム生成の重複レコードと実際の業務上の重複との差別化
これにより、修正が必要な真の重複と正当な類似ケースを判別できます。
このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。