重複ケース

概要

Duplicate Cases計算ツールは、選択された属性において同一の値を持つケースを特定します。この強力なデータ品質ツールは、重複エントリ、システムエラー、プロセスデータのデータ整合性問題を見つけるのに役立ちます。

一般的な使用例

  • 複数回入力されたケースの検出
  • システムエラーによる重複ケースの特定
  • 二重支払いの可能性の検出
  • 重複した注文や請求書の発見
  • データ移行の整合性検証

設定

Column Names: 重複ケースを判別するために使用する属性のリストを選択します。選択したすべての属性で同一の値を持つケースが重複としてフラグされます。

Max Rows: 出力に表示する最大行数を指定します。

潜在的な重複請求書の特定

シナリオ: 同じベンダー、金額、日付で複数回入力されている可能性のある請求書を特定したい。

設定:

  • Column Names: Vendor Name, Invoice Amount, Invoice Date
  • Max Rows: 100

出力:

計算ツールは2つの表示オプションを提供します:

  1. Duplicate Cases View(デフォルト):

    • 選択した属性のユニークな組み合わせごとに1行表示
    • 最後の列に、その組み合わせに一致するケース数を表示
    • カウントが1より大きいものは潜在的な重複
  2. Expanded View(右上のドロップダウンから選択):

    • 一致する属性値ごとにグループ化されたすべての個別ケースを表示
    • 設定で指定されていない追加の属性も表示
    • 同じグループ内でも他の属性が異なるケースが存在することを明示(例:金額が一致していても異なるInvoice ID)

洞察:

Expanded Viewは特に有用で、選択した属性に基づいて「重複」としてグループ化されたケースが、実際には他の列で異なる値を持つ正当な別ケースである可能性を示します。例えば:

  • 同じベンダー、金額、日付でも異なる請求書(Invoice IDを確認)
  • 正当な重複支払いとデータ入力ミスの区別
  • システム生成の重複レコードと実際の業務上の重複との差別化

これにより、修正が必要な真の重複と正当な類似ケースを判別できます。


このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。