重複ケース

概要

Duplicate Cases計算ツールは、選択された属性において同一の値を持つケースを特定します。この強力なデータ品質ツールは、重複エントリ、システムエラー、プロセスデータのデータ整合性問題を見つけるのに役立ちます。

Column Names: 重複ケースを判別するために使用する属性のリストを選択します。選択したすべての属性で同一の値を持つケースが重複としてフラグされます。

Max Rows: 出力に表示する最大行数を指定します。

シナリオ: 同じベンダー、金額、日付で複数回入力されている可能性のある請求書を特定したい。

設定:

出力:

計算ツールは2つの表示オプションを提供します：

Duplicate Cases View（デフォルト）:
- 選択した属性のユニークな組み合わせごとに1行表示
- 最後の列に、その組み合わせに一致するケース数を表示
- カウントが1より大きいものは潜在的な重複
Expanded View（右上のドロップダウンから選択）:
- 一致する属性値ごとにグループ化されたすべての個別ケースを表示
- 設定で指定されていない追加の属性も表示
- 同じグループ内でも他の属性が異なるケースが存在することを明示（例：金額が一致していても異なるInvoice ID）

洞察:

Expanded Viewは特に有用で、選択した属性に基づいて「重複」としてグループ化されたケースが、実際には他の列で異なる値を持つ正当な別ケースである可能性を示します。例えば：

これにより、修正が必要な真の重複と正当な類似ケースを判別できます。

このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。