属性のコピー
概要
Copy Attributeエンリッチメントは、既存の属性を新しい名前で複製し、元のデータを保持しながら変換を行ったり、変更前にバックアップコピーを作成したり、異なる解析目的のために同じデータの複数バージョンを確立したりすることを可能にします。この基本的なデータ操作オペレーターは、ケース属性およびイベント属性の両方とシームレスに機能し、属性レベルを自動検出して、適切な場所にコピーを作成します。
プロセスマイニングにおいて、属性をコピーする能力はデータの保護、属性のバージョン管理、および後続の変換のための作業コピーの作成に不可欠です。Copy Attributeエンリッチメントは、ソース属性のデータ型、表示形式、およびすべての値を含む完全な複製を行います。フィルターと組み合わせることで、特定のケースに対してのみ属性値を選択的にコピーし、フィルター条件に合致しないケースには新しい属性を空白のままにすることが可能です。この選択的コピー機能により、データのセグメンテーション、条件付きデータ準備、および異なる解析シナリオ用の属性バリアント作成が特に価値あるものになります。
エンリッチメントはテキスト、数値、ブール値、日時のすべての属性タイプを賢く処理し、ソース属性の正確なデータ型とフォーマットを保持します。この型の保持により、下流の計算、フィルター、可視化がコピーされた属性で元の属性とまったく同様に機能し、分析ワークフロー全体でデータの整合性を維持できます。
よくある用途
- 変換やエンリッチメント適用前に属性のバックアップコピーを作成する
- 元の値を保持しつつ、比較分析用に修正バージョンを作成する
- 異なる分析コンテキスト(週次 vs 月次報告)用に属性を複製する
- データ品質改善反復用に作業コピーの属性を作成する
- 条件付き更新適用前にベースラインバージョンの属性を確立する
- フィルター条件に基づいて属性を選択的にコピーし、セグメント分析を行う
- ビジネス・技術向けに異なる表示名で属性バリアントを生成する
設定
Column Name: コピーしたいソース属性を選択します。これはデータセット内の任意の既存のケース属性またはイベント属性にできます。エンリッチメントは属性がケースレベルかイベントレベルかを自動検出し、同じレベルにコピーを作成します。テキスト、数値、ブール、日時属性を含むすべてのデータ型に対応し、ソース属性の表示形式とデータ型はコピーで保持されます。
New Attribute Name: 新しいコピー属性の名前を指定します。コピーの目的や元の属性との関係を明確に示す説明的な名前を選択してください。たとえば、変換前のバックアップとして「Original_Amount」、初期値を保持する際には「Baseline_Status」などです。この名前はデータセット内で一意であり、既存の属性と競合してはいけません。
Filter (Optional): コピー値を受け取るケースを制御するためのフィルターを適用します。フィルター指定時は、条件に一致するケースのみ新しい属性に値がコピーされます。一致しないケースでも新しい属性は作成されますが値は空白(null)のままです。この選択的コピーは、特定のプロセスセグメント、期間、ケースカテゴリーに限定した属性バリアント作成に有用です。フィルターはケースレベルで動作し、イベント属性のコピー時も同様です。
事例
事例1:比較用のベースラインステータス作成
シナリオ: 注文処理において、作成時の初期注文ステータスを保持し、現在のステータスと比較しながらプロセスライフサイクルを通じてステータスの変遷を追跡したい場合。
設定:
- Column Name: Order_Status
- New Attribute Name: Initial_Order_Status
- Filter: なし(全ケースにコピー)
出力: ケース属性「Initial_Order_Status」を新規作成し、Order_Statusの値を完全に複製。例えば、
- Order_Status:「Pending Approval」
の場合、「Initial_Order_Status」も「Pending Approval」となります。
分析の段階で、Initial_Order_Statusと現行のOrder_Statusを比較し、ステータス変化のあった注文を特定し、進行パターンや停滞ケース解析に役立ちます。
インサイト: このベースラインコピーにより、変化追跡分析が可能となり、ステータスの進行停滞箇所の特定や、プロセス変化度の測定基準として活用できます。
事例2:通貨換算前の原価値保持
シナリオ: グローバル調達プロセスで、すべての原価を統合報告用に基軸通貨(USD)に換算したいが、監査や照合のために元の通貨での原価値を保持したい場合。
設定:
- Column Name: Invoice_Amount
- New Attribute Name: Original_Invoice_Amount
- Filter: なし
出力: ケース属性「Original_Invoice_Amount」を作成し、Invoice_Amountの値を正確にコピー。例えば、
- Invoice_Amount:45000.00(各種通貨)
- Currency:「EUR」
の場合、Original_Invoice_Amountも45000.00となります。
コピー後、Invoice_Amountに通貨換算エンリッチメントを適用可能で、Original_Invoice_Amountは元のまま維持でき、監査証跡や差異分析に貢献します。
インサイト: この保持方法はデータの系譜を維持し、元データと換算データ間の照合を可能にし、多通貨報告の透明性を高めます。
事例3:地域別バリアント作成による分析便宜化
シナリオ: 複数地域を跨ぐ営業プロセスで、各地域チーム向けに自分たちの地域に該当する販売額のみを含む別のコピー属性を作成し、地域別分析を簡素化したい場合。
設定:
- Column Name: Sales_Amount
- New Attribute Name: North_America_Sales
- Filter: Region = "North America"
出力: ケース属性「North_America_Sales」を作成し、北米のケースに対してのみ販売額を含む。例えば北米のケースで、
- Sales_Amount: 125000.00
- Region: "North America"
の場合、North_America_Salesも125000.00となります。
その他地域のケースでは、
- Sales_Amount: 85000.00
- Region: "Europe"
North_America_Salesは空白(null)となります。
インサイト: 選択的コピーにより、地域ごとに異なるダッシュボード・レポートが可能で、一定のフィルター適用が不要となり、地域間差異分析や関係者の焦点絞り込みに役立ちます。
事例4:反復的データ品質向上のための作業コピー作成
シナリオ: カスタマーサービスプロセスで製品カテゴリ名のクレンジングと標準化を行うが、品質保証やクレンジング範囲追跡のために元の生データを保持したい場合。
設定:
- Column Name: Product_Category
- New Attribute Name: Product_Category_Original
- Filter: なし
出力: ケース属性「Product_Category_Original」を作成し、Product_Categoryの値を完全複製。例えば、
- Product_Category: "Laptop Computer - 15in"
「Product_Category_Original」も同様に "Laptop Computer - 15in" となります。
コピー後、Product_Categoryに対して置換、グルーピング、標準化エンリッチメントを適用可能で、以下を実施可能:
- クレンジング前後の比較によりデータ品質向上の評価
- 標準化対象となった生データの代表的なバリエーション特定
- すべてのデータ変換の監査証跡維持
インサイト: 作業コピーにより透明な品質管理プロセスが可能となり、前後比較や変換の追跡性を確保できます。
事例5:トレンド分析用の時点スナップショット作成
シナリオ: プロジェクト管理プロセスにおいて、特定マイルストーンでの完了率をキャプチャし、予測の変遷を分析し、予測精度のパターンを特定したい場合。
設定:
- Column Name: Completion_Percentage
- New Attribute Name: Completion_At_Midpoint
- Filter: Milestone = "Project Midpoint Review"
出力: ケース属性「Completion_At_Midpoint」を作成し、マイルストーンが中間レビューに達したケースの完了率のみを含む。例えば中間地点のケースで、
- Completion_Percentage: 45
- Milestone: "Project Midpoint Review"
ならばCompletion_At_Midpointは45となる。
まだ中間地点でないケースでは、
- Completion_Percentage: 25
- Milestone: "Initial Planning"
Completion_At_Midpointは空白(null)となる。
Completion_Percentageが引き続き更新される中で、中間時点のスナップショットと最終完了率を比較し、予測精度を分析し、中間予測から大きく逸脱したプロジェクトを特定できる。
インサイト: これら時系列スナップショットはプロジェクト全体のトレンド分析を可能にし、段階ごとの予測バイアスを特定、将来の計画精度向上の基準となります。
出力
Copy Attributeエンリッチメントは、ソース属性と同じレベル(ケースまたはイベント)に単一の新しい属性を作成します。新属性はソース属性の正確な複製で、以下を保持します:
- データ型:コピー属性はソースと同じデータ型(テキスト、整数、小数、ブール、日時)を維持
- 表示形式:通貨記号、小数点以下桁数、日付形式などソース属性に適用されている書式がコピーに反映
- 値:ソース属性のすべての非null値が正確に新属性へコピーされる
新属性はデータセット内の元の属性と並んで表示され、mindzieStudioのフィルター、計算機、可視化、後続のエンリッチメントに利用可能です。フィルター未適用時は、すべてのケースまたはイベントに値が存在(ソースの完全性に準ずる)。フィルター適用時は条件に合致するケースまたはイベントのみ値が入り、非該当は属性存在はするがnullとなります。
コピーされた属性はデータセットメタデータ上で派生属性としてマークされ、ソースデータの一部ではなくエンリッチメント処理による作成であることを示します。属性の依存関係は元のソース属性を参照し、監査やデータ変換の理解のためのデータ系譜を維持します。
イベント属性の場合、コピー操作はイベントレベルで行われ、各イベントごとに属性値のコピーがなされます。ケース属性の場合はケースレベルで行われ、単一のケースレベル値が新属性に複製されます。
このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。