空白属性の非表示
概要
Hide Blank Attributes エンリッチメントは、自動データクレンジングオペレーターであり、データセット全体にわたってデータが含まれていないすべての属性(列)を特定して除去します。この強力なクレンジングツールはケースレベルおよびイベントレベルの両方の属性をスキャンし、すべての行がnullまたは空の値である列を自動的に非表示にします。これらの空の列を削除することで、データセットの表示を大幅に簡素化し、分析ツールでの視覚的な煩雑さを減らし、大規模データセットを扱う際のパフォーマンスを向上させます。
このエンリッチメントは、多くのオプションフィールドを含む固定スキーマをエクスポートするエンタープライズシステムからのデータインポート時や、いくつかの属性が時代遅れになる複数の変換を経たデータセットを扱う場合に特に有用です。個別に空の列を特定して手動で削除する方法とは異なり、このエンリッチメントはデータセット全体を一括で包括的にスキャンします。少なくとも一つの非null値を含む列はすべて保持され、潜在的に有用なデータが失われることなく、プロセスマイニング作業領域のクリーンさと使いやすさを最大化します。
主な用途
- ERPシステムからのインポートデータセットのクレンジング(多数の未入力のオプションフィールドを含む場合)
- フィルタリング操作後に完全に空になることがある属性を含むデータセットビューの簡素化
- ケース属性およびイベント属性パネルの視覚的な煩雑さを減らし、意味のあるデータに集中
- 多くの未使用列を含む広いデータセットの処理時にパフォーマンス向上とメモリ使用量削減
- 関連のない空の列を除去してデータセットをエクスポートまたは共有用に準備
- 複数の属性を新しい計算フィールドに集約するデータ変換後のクリーンアップ
- 分析価値を提供しない属性を除去して適合性チェックを効率化
設定
このエンリッチメントは設定を必要とせず自動的に動作します。データセット内のすべての非計算属性かつ非表示でない属性をスキャンし、すべてのケースおよびイベントで完全に空であるもののみを削除(非表示)します。
例
例1:ERPシステムエクスポートのクレンジング
シナリオ: 製造会社がSAPから注文処理データをエクスポートしており、200以上の標準フィールドがあるが、特定の実装では約60のフィールドのみ使用し、140以上の列が完全に空で分析が困難。
エンリッチメント適用前: データセットは215の属性を含む:
- ケース属性:125列(75列空)
- イベント属性:90列(65列空)
- 空列例:Legacy_System_ID、Deprecated_Cost_Center、Old_Warehouse_Code、Custom_Field_1~Custom_Field_50
エンリッチメント適用後: 75の意味のある属性に単純化:
- ケース属性:50列(すべてデータを含む)
- イベント属性:25列(すべてデータを含む)
- 全ての空列が自動的に非表示
結果: 140列の空列が削除され、少なくとも1つの値がある75列はすべて保持された。データセットビューは実際のデータを持つ属性のみに集中し、ナビゲーションと分析が大幅に容易に。
洞察: クレンジング後、アナリストはプロセスマイニングに関連する属性を迅速に特定できた。単純化されたビューにより注文処理は実際には12の主要属性のみが意思決定に関与していることが判明し、以前は数百の空フィールドに埋もれていた。データセットの読み込み時のパフォーマンスはメモリオーバーヘッドが軽減され40%向上。
例2:医療のフィルタリング後クレンジング
シナリオ: 病院が患者治療データセットを緊急部門のケースのみにフィルタリングしており、緊急ケースでは使用しない専門病棟の属性が完全に空になる。
エンリッチメント適用前: 緊急ケースのみのフィルタ後:
- 合計属性数:180
- 入力済み属性:Emergency_Triage_Level、Emergency_Wait_Time、Emergency_Treatment
- 空属性:ICU_Ventilator_Settings、Surgery_Type、Rehabilitation_Plan、Oncology_Stage、および他85の専門部門属性
エンリッチメント適用後:
- 表示属性合計:92
- すべて緊急部門に関連するデータを含む
- 88の空の専門部門属性が非表示
結果: 緊急部門フィルタ適用後に空になったすべての属性が自動的に特定され非表示に。残った属性はすべて緊急ケースに関連。
洞察: クリーンなデータセットにより緊急部門の管理者は特定のKPIに集中でき、無関係なフィールドに気を取られなくなった。分析時間は60%減少し、スタッフは空列のスクロール無しで関連データを迅速に発見。
例3:金融プロセスの統合
シナリオ: 銀行が3つの異なるシステムから請求処理データを統合し、それぞれのシステム固有の属性が他システムのケースでは空となる。
エンリッチメント適用前: 340の属性を含む統合データセット:
- すべてのシステムで使用する共通フィールド:45属性
- システムA固有フィールド:95属性(システムB・Cケースで空)
- システムB固有フィールド:110属性(システムA・Cケースで空)
- システムC固有フィールド:90属性(システムA・Bケースで空)
エンリッチメント適用後: 現在のケース選択に対してデータを含むシステム固有属性および共通45属性のみ表示。
結果: 完全に空の列がすべて削除され、3システムすべてが入力する45の共通フィールドだけが残る。統合データセット全体で空のシステム固有属性は自動的に非表示。
洞察: 異なるシステム構造にもかかわらず、3システム全てが同じ45のコアプロセス属性を捉えていることが判明。これにより銀行は請求処理を標準化し、複雑さを85%削減。
例4:調達データの準備
シナリオ: 小売企業の調達データセットに各種承認レベルや特別取扱コードの属性があるが、多くは高額商品や規制品にのみ使用され、通常の購入では空。
エンリッチメント適用前: 150属性含むデータセット:
- 標準フィールド:PO_Number、Supplier、Amount、Create_Date(常に入力)
- 条件付きフィールド:VP_Approval、Legal_Review、Hazmat_Code、Export_License、Compliance_Check(95% 空)
- レガシーフィールド:Old_Vendor_Code、Previous_System_Ref(移行後100%空)
エンリッチメント適用後: 67の有効属性に簡素化:
- すべての標準調達フィールド保持
- 少なくとも1つ値を含む条件付きフィールド保持
- 完全に空のレガシーフィールド削除
結果: 83の空属性が非表示となり、現在のデータセットで使用されないレガシーや条件付き承認フィールドが除去。残った属性はすべてプロセス分析に貢献。
洞察: クレンジング後、購入のうち5%のみが特別承認を必要とし、残り95%は通常購入であることが判明。単純化ビューにより高複雑ケースを容易に識別可能。
例5:製造品質管理
シナリオ: 自動車部品製造工場が品質管理データをエクスポートしており、数百の測定フィールドがあるが、それぞれの生産ラインは自社パーツに関連する特定の測定のみを使用し、多くのフィールドが空。
エンリッチメント適用前: 450属性の品質データセット:
- 共通フィールド:Part_Number、Production_Line、Timestamp、Pass_Fail(常に入力)
- ライン固有の測定:200以上の測定フィールド(他ラインで空)
- 廃止された測定:50以上の古い品質指標(現在は収集されず)
エンリッチメント適用後: 125属性の関連データセット:
- すべての共通フィールド保持
- データがある測定のみ保持
- 廃止および未使用測定フィールドを非表示化
結果: 325の空の測定列を削除し、125の実品質データ列を保持。各生産ラインで関連測定のみ表示。
洞察: 450の測定可能フィールドがあるにもかかわらず、各ラインは20~30の重要品質指標のみを監視。この洞察をもとに改善プログラムを集中させ、不良率を15%削減。
出力
Hide Blank Attributes エンリッチメントは、データを削除せず既存の列の表示状態を変更します:
非表示の列:
- すべてのケース行がnull/空のケース属性
- すべてのイベント行がnull/空のイベント属性
- 列は非表示としてマークされ、データセットから削除されるわけではない
- 非表示状態は列管理を介して必要に応じて解除可能
保持される列:
- 少なくとも1つの非null値を含むすべての列
- 他のエンリッチメントによって作成された計算列
- すでに非表示にマークされている列(冗長な処理はなし)
- Case IDやActivity名などのシステム列
パフォーマンス影響:
- データセット読み込み時のメモリ使用量削減
- 属性リストやフィルターの描画高速化
- 簡素化された列セットでのクエリパフォーマンス向上
- 共有時のエクスポートファイルがよりクリーン
エンリッチメントの効果はケースおよびイベント属性パネルに即座に反映され、空列は表示されなくなります。これによりプロセス分析のための集中かつ効率的な作業環境が実現します。
参照
- Anonymize - プロセス構造を保持しつつ機密データを非表示に
- Trim Text - テキスト属性の空白を削除
- Text Start - テキスト属性の先頭部分を抽出
- Text End - テキスト属性の末尾部分を抽出
- Group Attribute Values - 類似した属性値を統合
このドキュメントはmindzie Studioプロセスマイニングプラットフォームの一部です。