データセット
データ管理API
CSV、ZIPパッケージ、バイナリ形式など複数のファイル形式をサポートし、データセットのアップロード、管理、更新が可能です。
機能
データセット作成
CSV、ZIPパッケージ、またはバイナリファイルから新しいデータセットを作成します。
データインポート
プロセスマイニング分析のために列マッピングを行いデータをインポートします。
データセット更新
既存のデータセットに新しいデータを追加し、設定を保持します。
ファイル形式
サポートされているファイル形式とデータ構造。
利用可能なエンドポイント
接続テスト
- GET
/api/{tenantId}/{projectId}/dataset/unauthorized-ping- 公開接続テスト(認証不要) - GET
/api/{tenantId}/{projectId}/dataset/ping- 認証済み接続テスト
データセット操作
- GET
/api/{tenantId}/{projectId}/dataset- プロジェクト内の全データセットを一覧表示
データセット作成
- POST
/api/{tenantId}/{projectId}/dataset/csv- CSVファイルからデータセット作成 - POST
/api/{tenantId}/{projectId}/dataset/package- ZIPパッケージからデータセット作成 - POST
/api/{tenantId}/{projectId}/dataset/binary- バイナリファイルからデータセット作成
データセット更新
- PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/csv- CSVによるデータセット更新 - PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/package- ZIPパッケージによるデータセット更新 - PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/binary- バイナリファイルによるデータセット更新
サポートされているファイル形式
mindzieStudioはプロセスマイニング用に複数のデータ形式をサポートしています:
CSVファイル
カンマ区切りの値で柔軟な列マッピングが可能です。
- ケースID、アクティビティ、タイムスタンプを含むイベントログ
- 日付・数値の文化設定対応
- UTF-8エンコーディング対応
ZIPパッケージ
複数の関連ファイルを含む圧縮パッケージ。
- 複数テーブルを含む複雑なデータセット
- メタデータおよび設定ファイル
- mindzieデータセットパッケージング標準対応
バイナリファイル
効率的なデータ転送のためのネイティブバイナリ形式。
- 事前処理済みイベントログデータ
- 大規模データセットに最適化
- 列マッピングが必須
データセット構造
プロセスマイニング分析に必要なデータ構造の理解:
必須列
| 列名 | 説明 |
|---|---|
| Case ID | 各プロセスインスタンスの一意識別子 |
| Activity | アクティビティまたはイベントの名称 |
| Timestamp | アクティビティ発生日時 |
任意列
| 列名 | 説明 |
|---|---|
| Resource | アクティビティを実行したユーザーまたはシステム |
| Start Time | アクティビティ開始時刻(期間計算用) |
| Expected Order | 順序付け用シーケンス列 |
レスポンス構造
{
"datasetId": "550e8400-e29b-41d4-a716-446655440000",
"datasetName": "Purchase Order Process",
"datasetDescription": "Event log from SAP procurement",
"projectId": "660e8400-e29b-41d4-a716-446655440000",
"caseIdColumnName": "CaseID",
"activityColumnName": "Activity",
"timeColumnName": "Timestamp",
"resourceColumnName": "Resource",
"beginTimeColumnName": "StartTime",
"useDateOnlySorting": false,
"useOnlyEventColumns": false,
"dateCreated": "2024-01-15T10:30:00Z",
"dateModified": "2024-01-15T14:45:00Z",
"createdBy": "user@example.com",
"modifiedBy": "user@example.com"
}
アップロードレスポンス構造
データセット作成および更新エンドポイントはインポート統計を返します:
{
"datasetId": "550e8400-e29b-41d4-a716-446655440000",
"caseCount": 5200,
"eventCount": 150000,
"invalidValueCount": 12,
"skippedRowsCount": 3,
"errors": [],
"rowIssues": [],
"statusCode": 200
}
主な利用シナリオ
- イベントログインポート: ERP、CRM、BPMシステムからのプロセスイベントデータのアップロード
- データリフレッシュ: 解析設定を保持しつつ既存データセットの新データ更新
- マルチフォーマット対応: CSVエクスポートや独自バイナリ形式からのデータインポート
- バッチ処理: 最大1GBの大規模データセットを進行状況を確認しながらアップロード
ファイルサイズ制限
すべてのアップロードエンドポイントは最大1GBのファイルサイズをサポートします。より大きなデータセットの場合は以下を検討してください:
- 複数回に分けてアップロード
- 効率的なバイナリ形式の利用
- エンタープライズ向けデータソリューションのサポートへの相談
認証
unauthorized-pingを除くすべてのデータセットAPIエンドポイントは、対象のプロジェクトおよびテナントに対する適切な認証と権限が必要です。