データセット

データ管理API

CSV、ZIPパッケージ、バイナリ形式など複数のファイル形式をサポートし、データセットのアップロード、管理、更新が可能です。

機能

データセット作成

CSV、ZIPパッケージ、またはバイナリファイルから新しいデータセットを作成します。

データセット作成

データインポート

プロセスマイニング分析のために列マッピングを行いデータをインポートします。

データインポート

データセット更新

既存のデータセットに新しいデータを追加し、設定を保持します。

データセット更新

ファイル形式

サポートされているファイル形式とデータ構造。

ファイル形式を見る

利用可能なエンドポイント

接続テスト

GET /api/{tenantId}/{projectId}/dataset/unauthorized-ping - 公開接続テスト（認証不要）
GET /api/{tenantId}/{projectId}/dataset/ping - 認証済み接続テスト

データセット操作

GET /api/{tenantId}/{projectId}/dataset - プロジェクト内の全データセットを一覧表示

データセット作成

POST /api/{tenantId}/{projectId}/dataset/csv - CSVファイルからデータセット作成
POST /api/{tenantId}/{projectId}/dataset/package - ZIPパッケージからデータセット作成
POST /api/{tenantId}/{projectId}/dataset/binary - バイナリファイルからデータセット作成

データセット更新

PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/csv - CSVによるデータセット更新
PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/package - ZIPパッケージによるデータセット更新
PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/binary - バイナリファイルによるデータセット更新

サポートされているファイル形式

mindzieStudioはプロセスマイニング用に複数のデータ形式をサポートしています：

CSVファイル

カンマ区切りの値で柔軟な列マッピングが可能です。

ケースID、アクティビティ、タイムスタンプを含むイベントログ
日付・数値の文化設定対応
UTF-8エンコーディング対応

ZIPパッケージ

複数の関連ファイルを含む圧縮パッケージ。

複数テーブルを含む複雑なデータセット
メタデータおよび設定ファイル
mindzieデータセットパッケージング標準対応

バイナリファイル

効率的なデータ転送のためのネイティブバイナリ形式。

事前処理済みイベントログデータ
大規模データセットに最適化
列マッピングが必須

データセット構造

プロセスマイニング分析に必要なデータ構造の理解：

必須列

列名	説明
Case ID	各プロセスインスタンスの一意識別子
Activity	アクティビティまたはイベントの名称
Timestamp	アクティビティ発生日時

任意列

列名	説明
Resource	アクティビティを実行したユーザーまたはシステム
Start Time	アクティビティ開始時刻（期間計算用）
Expected Order	順序付け用シーケンス列

レスポンス構造

{
  "datasetId": "550e8400-e29b-41d4-a716-446655440000",
  "datasetName": "Purchase Order Process",
  "datasetDescription": "Event log from SAP procurement",
  "projectId": "660e8400-e29b-41d4-a716-446655440000",
  "caseIdColumnName": "CaseID",
  "activityColumnName": "Activity",
  "timeColumnName": "Timestamp",
  "resourceColumnName": "Resource",
  "beginTimeColumnName": "StartTime",
  "useDateOnlySorting": false,
  "useOnlyEventColumns": false,
  "dateCreated": "2024-01-15T10:30:00Z",
  "dateModified": "2024-01-15T14:45:00Z",
  "createdBy": "user@example.com",
  "modifiedBy": "user@example.com"
}

アップロードレスポンス構造

データセット作成および更新エンドポイントはインポート統計を返します：

{
  "datasetId": "550e8400-e29b-41d4-a716-446655440000",
  "caseCount": 5200,
  "eventCount": 150000,
  "invalidValueCount": 12,
  "skippedRowsCount": 3,
  "errors": [],
  "rowIssues": [],
  "statusCode": 200
}

主な利用シナリオ

イベントログインポート: ERP、CRM、BPMシステムからのプロセスイベントデータのアップロード
データリフレッシュ: 解析設定を保持しつつ既存データセットの新データ更新
マルチフォーマット対応: CSVエクスポートや独自バイナリ形式からのデータインポート
バッチ処理: 最大1GBの大規模データセットを進行状況を確認しながらアップロード

ファイルサイズ制限

すべてのアップロードエンドポイントは最大1GBのファイルサイズをサポートします。より大きなデータセットの場合は以下を検討してください：

複数回に分けてアップロード
効率的なバイナリ形式の利用
エンタープライズ向けデータソリューションのサポートへの相談

認証

unauthorized-pingを除くすべてのデータセットAPIエンドポイントは、対象のプロジェクトおよびテナントに対する適切な認証と権限が必要です。

はじめに

データセット作成から始めてデータセット作成方法を学び、その後にデータインポートで列マッピングの詳細を確認してください。