属性の連結
概要
属性の連結エンリッチメントは、複数の属性値を単一のテキスト文字列に結合し、結合された値を表す新しい属性を作成します。この強力なテキスト操作オペレーターにより、複合識別子の作成、説明的なラベルの生成、複数のデータフィールドから意味のあるテキスト表現を構築できます。エンリッチメントはケース属性とイベント属性の両方を知的に処理し、選択された元の属性に基づいて新しい連結属性の適切なレベルを自動的に判断します。
プロセスマイニングにおいて、属性値を結合する能力は、ユニークな識別子の作成、人間が読みやすい説明の構築、異なるデータ要素間の関係性の確立に不可欠です。属性の連結エンリッチメントは値の間にパイプ区切り文字(" | ")を使用し、視覚的に明確でありながら可読性を維持します。属性に値がない場合は「No Value」に置換して、一貫したフォーマットを保ち、空のセグメントによる混乱を防ぎます。この手法は、監査トレイルの作成、マッチング操作のための複合キー作成、複数の業務的側面を組み合わせた包括的なケース説明の作成に特に有用です。
一般的な用途
- 複数の識別子フィールド(Order_ID + Line_Number)を結合して複合キーを作成
- カテゴリとサブカテゴリ情報を組み合わせた説明的なラベルの生成
- 姓、名、ミドルネームの属性を結合してフルネームを作成
- 地域、国、市の属性を組み合わせて位置識別子を構築
- ユーザー、タイムスタンプ、アクション属性を統合した監査説明の作成
- ブランド、モデル、バリアント属性を組み合わせて製品説明を作成
- ステータス、優先度、カテゴリフィールドを結合したケースの要約作成
設定
フィルター(任意): 連結属性を適用するケースを制限するためのフィルターを適用します。フィルターを使用すると、フィルター条件に一致したケースにのみ連結が実行されます。特定の部門や期間のケースなど、データの部分集合に対してのみ複合値を作成したい場合に便利です。フィルターはケースレベルで動作し、イベント属性の連結時でも同様です。
新しい属性名: 連結結果を格納する新しい属性の名前を指定します。結合される情報が明確に分かる説明的な名前を選択してください。例えば、製品属性を連結する際は「Full_Product_Description」、位置フィールドの結合に「Complete_Address」を使用します。名前は一意であり、既存の属性名と重複できません。
属性名: 結合したい複数の属性を選択します。エンリッチメントは選択された順序で全ての属性を「 | 」区切りで連結します。文字列型、数値型、論理型のいずれの属性も選択可能です。ケース属性とイベント属性の両方をサポートしますが、通常は意味のある結果のために全属性を同じレベルにすることが推奨されます。数値および論理値は自動的にテキストに変換されて連結されます。
例
例 1: 複合購買注文識別子の作成
シナリオ: 調達プロセスでベンダーコード、購買注文番号、会計年度を結合して、複数システムと期間を跨いだグローバルなユニーク識別子を作成する必要があります。
設定:
- フィルター: なし(全ケース対象)
- 新しい属性名: PO_Composite_ID
- 属性名: Vendor_Code, PO_Number, Fiscal_Year
出力: 新しいケース属性「PO_Composite_ID」を作成し、次のような値を連結します:
- Vendor_Code: "SUPP-0247"
- PO_Number: "PO-2024-8831"
- Fiscal_Year: 2024
PO_Composite_ID は「SUPP-0247 | PO-2024-8831 | 2024」になります。
インサイト: この複合識別子により、システム間の一意な追跡が可能となり、外部データとの照合が簡素化され、すべての重要な識別情報を1つのフィールドで人間が読みやすい形で提供します。
例 2: 完全な顧客住所の構築
シナリオ: 配送プロセスで、配送経路の最適化や配送書類作成のため、複数の住所コンポーネントを1つのフィールドに結合する必要があります。
設定:
- フィルター: なし
- 新しい属性名: Full_Delivery_Address
- 属性名: Street_Address, City, State, Postal_Code, Country
出力: 新しいケース属性「Full_Delivery_Address」を作成し、住所コンポーネントを連結します:
- Street_Address: "123 Main Street"
- City: "Springfield"
- State: "IL"
- Postal_Code: "62701"
- Country: "USA"
Full_Delivery_Address は「123 Main Street | Springfield | IL | 62701 | USA」になります。
インサイト: 完全な住所文字列は地理的な分析を単純化し、地図サービスへの統合を容易にし、配送チームにすべての位置情報を1つの読みやすいフィールドで提供します。
例 3: 製品説明ラベルの作成
シナリオ: 在庫管理プロセスで、ブランド、カテゴリ、モデル、色の属性を結合して検索性と報告を向上させる包括的な製品説明を作成します。
設定:
- フィルター: Category = "Electronics"
- 新しい属性名: Product_Full_Description
- 属性名: Brand, Product_Category, Model_Number, Color, Size
出力: 電子機器アイテム向けに新しいケース属性「Product_Full_Description」を作成します:
- Brand: "TechCorp"
- Product_Category: "Laptop"
- Model_Number: "X500-PRO"
- Color: "Silver"
- Size: "15-inch"
Product_Full_Description は「TechCorp | Laptop | X500-PRO | Silver | 15-inch」になります。
Color 属性が欠落している場合は「TechCorp | Laptop | X500-PRO | No Value | 15-inch」となります。
インサイト: これらの統合された説明は製品の検索性を向上させ、報告でのカテゴリ分けを改善し、顧客サービス担当者へ1つのフィールドで完全な製品情報を提供します。
例 4: 監査トレイル説明の構築
シナリオ: 財務承認プロセスで、承認者名、承認日時、部門、決定内容を結合してコンプライアンス追跡のための包括的な監査エントリーを作成します。
設定:
- フィルター: Process_Step = "Approval"
- 新しい属性名: Approval_Audit_Entry
- 属性名: Approver_Name, Approval_Date, Department, Decision, Amount_Approved
出力: 承認ステップ向けに新しいケース属性「Approval_Audit_Entry」を作成します:
- Approver_Name: "John Smith"
- Approval_Date: "2024-03-15"
- Department: "Finance"
- Decision: "Approved"
- Amount_Approved: 50000
Approval_Audit_Entry は「John Smith | 2024-03-15 | Finance | Approved | 50000」になります。
インサイト: この統合された監査トレイルはコンプライアンス報告を簡素化し、承認パターンの迅速なレビューを可能にし、完全な承認コンテキストを1つの検索可能なフィールドに提供します。
例 5: 位置ベースのサービス識別子の作成
シナリオ: 医療プロセスで、施設、部門、部屋情報を結合して患者のルーティングやリソース配分のためのユニークな位置識別子を作成します。
設定:
- フィルター: なし
- 新しい属性名: Service_Location_ID
- 属性名: Facility_Name, Building, Department, Room_Number
出力: 完全な位置情報で新しいケース属性「Service_Location_ID」を作成します:
- Facility_Name: "Central Medical Center"
- Building: "Tower B"
- Department: "Radiology"
- Room_Number: "B-201"
Service_Location_ID は「Central Medical Center | Tower B | Radiology | B-201」になります。
インサイト: これらの位置識別子は患者の移動を効率化し、場所ごとのリソース計画を改善し、異なる施設エリア間のサービスパターン分析を可能にします。
出力
属性の連結エンリッチメントは、選択された元属性に応じてケースレベルまたはイベントレベルのいずれかに単一の新しい属性を作成します。選択されたすべての属性がケース属性の場合、新しい連結属性はケースレベルに作成されます。いずれかの属性がイベント属性の場合、イベントデータの粒度を保持するためにイベントレベルに新属性が作成されます。
出力属性は常に文字列型で、「 | 」(スペース-パイプ-スペース)で区切られた連結値を含みます。この区切り文字は視覚的な明瞭さを保証し、多くのビジネスデータに自然に含まれにくい文字列です。属性値がnullまたは欠落している場合は、「No Value」で置換され、構造が維持され、どの属性にデータがなかったかが明確となります。
連結値は元のフォーマットを維持します — 数値は数値形式のまま、日付は表示形式を保持し、論理値は「True」または「False」と表示されます。このフォーマットの保持により、連結結果はビジネスユーザーにとって読みやすく意味のあるものとなり、後続処理でもデータの整合性が確保されます。
このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。