スタンダードチェッカー
概要
Standard Checker 計算機は、mindzie の標準プロセス定義に対して、あなたのプロセスデータが適合しているかを検証します。すべての必須属性およびアクティビティが正しいデータ型で存在していることを確認し、プロセスデータが分析に適していること、そしてプラットフォームのすべての機能が正しく動作することを保証します。
この計算機は特にデータのオンボーディング、ETL 検証、品質保証のワークフローにおいて、抽出データがmindzieのプロセス固有機能の構造および内容の要件を満たしているかを確認する際に有用です。
主な用途
- 初期ETL設定やデータ抽出後のデータ完全性の検証
- 自動化されたETLパイプラインにおける品質ゲートチェックで要件を満たしているか確認
- 本番展開前に必須属性が存在するかの検証
- 追加の分析機能を可能にする推奨属性の欠落を特定
- データ抽出ロジックやソースシステムの変更の影響評価
- 特定の計算機能や機能が期待通りに動作しない理由のトラブルシューティング
設定
この計算機に設定可能なオプションはありません。プロセスタイプに基づいて自動的に適切な標準に対してデータを検証します。
プロセスタイプ検出: 計算機はデータからプロセスタイプを検出し、それに対応する標準を適用します。サポートされるプロセスタイプは以下の通りです:
- 調達から支払まで(Procure to Pay)
- 買掛金(Accounts Payable)
- 売掛金(Accounts Receivable)
- 受注から現金化まで(Order to Cash)
- サービスチケット(Service Tickets)
標準フィールド:
- タイトル: 計算機出力のオプションのカスタムタイトル
- 説明: ドキュメント用のオプション説明
例
例1: 新規データ抽出の検証
シナリオ: SAPからの調達から支払いプロセスの初回ETLスクリプトを作成し終えたところです。データセットを本番ユーザーへ展開する前に、必須データが正しく抽出されていることを確認したい。
設定:
- タイトル: "P2P データ検証 - 初回抽出"
- 説明: "本番展開前の品質チェック"
出力:
計算機は3つのカテゴリにわたる適合率の概要テーブルを表示します:
カテゴリ 件数 問題件数 適合率
必須属性 42 3 93%
推奨属性 18 8 56%
導出属性 12 0 100%
概要の下にはカテゴリ別に整理された詳細な問題リストが表示されます:
必須の問題 (3件):
- 購買注文金額: ケース属性が見つかりません
- 仕入先名: ケース属性が見つかりません
- 支払日付: イベント属性が見つかりません
推奨の問題 (8件):
- 購買注文カテゴリ: ケース属性が見つかりません
- 承認レベル: ケース属性が見つかりません
- (さらに6つの属性)
洞察: 93%の必須適合率はETLがほとんどの必須データを取得していることを示していますが、3つの重要な属性が不足しています。「購買注文金額」と「仕入先名」は主要な財務分析機能に必要なため必須です。これらを抽出するようETLスクリプトを更新すべきです。
56%の推奨属性適合率は初期展開としては許容範囲ですが、これらを追加するとカテゴリ別の詳細分析や承認ワークフロー分析などの追加機能が利用可能になります。
例2: アップグレード後の検証
シナリオ: ソースERPシステムを最近アップグレードしたため、mindzie連携に支障が出るようなデータ構造の変更がないか確認したい。
設定:
- タイトル: "アップグレード後の検証"
- 説明: "ERPアップグレード後のデータ互換性確認"
出力:
カテゴリ 件数 問題件数 適合率
必須属性 42 0 100%
推奨属性 18 1 94%
導出属性 12 0 100%
推奨の問題 (1件):
- 請求書通貨: 属性の型が不正 (期待値: 文字列, 実際: 数値)
洞察: すべての必須属性が存在しコア機能は問題ありません。しかし、推奨属性の1つである通貨属性の型が文字列から数値に変わっています。これはERPアップグレードの際に通貨コードの格納方法が変わったためと思われます。重大な問題ではありませんが、ETLを更新し数値の通貨コードを標準的な3文字通貨文字列(USD、EUR、GBP)に変換するのが望ましいです。
例3: 機能トラブルシューティング
シナリオ: ユーザーから買掛金プロセスの「三者間照合」計算機が正常に動作していないという報告があります。データ属性が不足している可能性があります。
設定:
- タイトル: "AP 三者間照合前提条件"
- 説明: "高度機能用の欠落属性特定"
出力:
カテゴリ 件数 問題件数 適合率
必須属性 38 0 100%
推奨属性 15 0 100%
導出属性 10 4 60%
導出の問題 (4件):
- 受領物品金額: イベント属性が見つかりません(三者間照合に必要)
- 購買注文明細の照合: 必須属性が不足
- 請求書明細の照合: 必須アクティビティが不足
- GR-IR勘定残高: 必須属性が不足
洞察: 問題は明確です。三者間照合に必要な導出属性が不足しています。これらの導出属性は他の属性やアクティビティに依存していますが抽出されていません。特に「受領物品金額」は請求書金額と照合するための重要なイベント属性です。各問題で参照されている「必須属性」を確認し、どの追加データをソースシステムから抽出すべきか検討してください。
例4: 複数プロセスの比較
シナリオ: 買掛金および売掛金の両プロセスを設定しており、ステークホルダーに提示する前に各データセットの完全性を理解したい。
設定(2回実行 - 各プロセスごとに1回ずつ):
- タイトル: "AP データ完全性"
- タイトル: "AR データ完全性"
出力比較:
買掛金:
必須: 100% 推奨: 85% 導出: 100%
売掛金:
必須: 89% 推奨: 45% 導出: 50%
洞察: 買掛金データはすべてのカテゴリで優れたカバレッジを持ち、本番対応可能な状態です。一方、売掛金は必須属性が複数不足しており(89%適合率)、コア機能の一部が利用できません。売掛金分析開始前に欠落している必須属性の抽出に注力してください。推奨属性および導出属性の低い割合については、ローンチ後に段階的に改善できます。
例5: 自動化された品質ゲート
シナリオ: ETLが毎晩実行されており、データ品質が許容レベルを下回った場合に自動的にアラートを発する仕組みを設定したい。
設定:
- タイトル: "夜間データ品質チェック"
- 説明: "ETLパイプラインの自動検証"
出力:
計算機はプログラム的に評価可能な適合率を提供します:
必須属性率: 0.97 (97%)
推奨属性率: 0.83 (83%)
導出属性率: 1.00 (100%)
洞察: ETLパイプラインに次のルールを設定可能です:
- FAIL:必須属性率が0.95未満(95%未満)の場合にジョブ失敗
- WARN:推奨属性率が0.70未満(70%未満)の場合に関係者に警告
- PASS:すべての閾値を満たした場合に成功
本例では、必須属性率97%が95%の閾値を上回るためジョブは成功します。この方法により、ユーザーに発覚する前にデータ品質問題を即座に検出できます。
出力
計算機は主に2つの出力を生成します:概要統計テーブルと詳細な問題リスト。
概要統計テーブル
必須カウント(数値): プロセスタイプに対して期待される必須属性の総数。これらはプラットフォームのコア機能に不可欠です。
必須の問題(数値): 欠落またはデータ型が不正な必須属性の数。各問題は重大なデータ品質問題を示します。
必須割合(パーセンテージ): 正しく存在している必須属性の割合。小数表記(0.97=97%)で示され、本番展開前に100%を目指すべきです。
推奨カウント(数値): プロセス用に定義された推奨属性の総数。高度な機能や豊富な分析を可能にします。
推奨の問題(数値): 欠落または不正な推奨属性の数。必須問題よりは優先度が低いものの、全機能利用のためには重要です。
推奨割合(パーセンテージ): 正しく存在している推奨属性の割合。80%以上は良好なデータカバレッジを示します。
導出カウント(数値): 他の属性から計算可能な導出属性の総数。通常は計算フィールドや指標です。
導出の問題(数値): 依存関係が欠けているため計算できない導出属性の数(必須属性やアクティビティが不足している)。
導出割合(パーセンテージ): 計算可能な導出属性の割合。問題がある場合は基礎データの不足を示します。
システム名バージョン(テキスト): イベントデータから抽出されたソースシステム名とバージョン。どのERPやシステムバージョンのデータかを追跡するのに有用です。
抽出バージョン(テキスト): ETLまたはデータ抽出プロセスのバージョン。どの抽出ロジックが使われたかを追跡可能。
プロセス名(テキスト): 識別されたプロセスタイプ(例:"Procure to Pay" や "Accounts Payable")。
詳細な問題リスト
計算機はカテゴリごとに別々のリストを表示します:
必須属性の問題: 欠落または型が不正な必須属性をリスト。以下を含む:
- 属性名
- 問題の説明(例:「ケース属性が見つかりません」や「属性の型が不正」)
- 期待されるデータ型と実際のデータ型(型不一致の場合)
推奨属性の問題: 必須問題に類似、推奨属性に関するもの。優先度は低いが追加機能解放のためには対処が推奨される。
導出属性の問題: 計算できない導出属性をリスト。問題例:
- 必須となる基礎属性の欠落
- 必須アクティビティの欠落
- 依存関係定義の設定問題
アクティビティの問題: イベントログ内で期待されるが見つからない標準アクティビティのリスト。標準アクティビティは「購買注文作成」や「請求書承認」のようなプロセス固有の分析を可能にする事前定義イベント。
解釈ガイダンス:
- 必須100%適合: コア機能向けに本番準備完了
- 必須95-99%適合: 軽微なギャップあり、本番前に確認・修正推奨
- 必須95%未満: 重大なギャップあり、ETLの改善が必要
- 推奨80%以上適合: 優れたデータカバレッジ
- 推奨50-80%適合: 良好、時間をかけて改善可能
- 推奨50%未満: 機能制限あり、改善を優先
このドキュメントはmindzie Studioのプロセスマイニングプラットフォームの一部です。