Conjuntos de Datos
API de Gestión de Datos
Suba, gestione y actualice conjuntos de datos con soporte para múltiples formatos de archivo, incluyendo CSV, paquetes ZIP y formatos binarios.
Características
Creación de Conjuntos de Datos
Cree nuevos conjuntos de datos a partir de archivos CSV, paquetes ZIP o archivos binarios.
Importación de Datos
Importe datos con asignación de columnas para análisis de minería de procesos.
Actualizaciones de Conjuntos de Datos
Actualice conjuntos de datos existentes con datos nuevos mientras se preservan las configuraciones.
Formatos de Archivo
Formatos de archivo y estructuras de datos soportados.
Endpoints Disponibles
Prueba de Conectividad
- GET
/api/{tenantId}/{projectId}/dataset/unauthorized-ping- Prueba de conectividad pública (sin autenticación requerida) - GET
/api/{tenantId}/{projectId}/dataset/ping- Prueba de conectividad autenticada
Operaciones de Conjuntos de Datos
- GET
/api/{tenantId}/{projectId}/dataset- Listar todos los conjuntos de datos en un proyecto
Creación de Conjuntos de Datos
- POST
/api/{tenantId}/{projectId}/dataset/csv- Crear conjunto de datos desde archivo CSV - POST
/api/{tenantId}/{projectId}/dataset/package- Crear conjunto de datos desde paquete ZIP - POST
/api/{tenantId}/{projectId}/dataset/binary- Crear conjunto de datos desde archivo binario
Actualizaciones de Conjuntos de Datos
- PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/csv- Actualizar conjunto de datos desde CSV - PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/package- Actualizar conjunto de datos desde paquete ZIP - PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/binary- Actualizar conjunto de datos desde archivo binario
Formatos de Archivo Soportados
mindzieStudio soporta múltiples formatos de datos para minería de procesos:
Archivos CSV
Valores separados por comas con asignación flexible de columnas.
- Registros de eventos con ID de caso, actividad, marca de tiempo
- Configuraciones culturales personalizadas para el análisis de fechas/números
- Soporte para codificación UTF-8
Paquetes ZIP
Paquetes comprimidos que contienen múltiples archivos relacionados.
- Conjuntos de datos complejos con múltiples tablas
- Archivos de metadatos y configuración
- Estándares de empaquetado de conjuntos de datos mindzie
Archivos Binarios
Formato binario nativo para transferencia eficiente de datos.
- Datos de registros de eventos preprocesados
- Optimizado para grandes conjuntos de datos
- Se requieren asignaciones de columnas
Estructura del Conjunto de Datos
Comprendiendo la estructura de datos esperada para el análisis de minería de procesos:
Columnas Requeridas
| Columna | Descripción |
|---|---|
| Case ID | Identificador único para cada instancia del proceso |
| Activity | Nombre de la actividad o evento |
| Timestamp | Momento en que ocurrió la actividad |
Columnas Opcionales
| Columna | Descripción |
|---|---|
| Resource | Usuario o sistema que realizó la actividad |
| Start Time | Hora de inicio de la actividad (para cálculos de duración) |
| Expected Order | Columna para ordenamiento secuencial |
Estructura de Respuesta
{
"datasetId": "550e8400-e29b-41d4-a716-446655440000",
"datasetName": "Purchase Order Process",
"datasetDescription": "Event log from SAP procurement",
"projectId": "660e8400-e29b-41d4-a716-446655440000",
"caseIdColumnName": "CaseID",
"activityColumnName": "Activity",
"timeColumnName": "Timestamp",
"resourceColumnName": "Resource",
"beginTimeColumnName": "StartTime",
"useDateOnlySorting": false,
"useOnlyEventColumns": false,
"dateCreated": "2024-01-15T10:30:00Z",
"dateModified": "2024-01-15T14:45:00Z",
"createdBy": "user@example.com",
"modifiedBy": "user@example.com"
}
Estructura de Respuesta de Subida
Los endpoints de creación y actualización de conjuntos de datos retornan estadísticas de importación:
{
"datasetId": "550e8400-e29b-41d4-a716-446655440000",
"caseCount": 5200,
"eventCount": 150000,
"invalidValueCount": 12,
"skippedRowsCount": 3,
"errors": [],
"rowIssues": [],
"statusCode": 200
}
Casos de Uso Comunes
- Importación de Registros de Eventos: Suba datos de eventos de procesos desde sistemas ERP, CRM o BPM
- Actualización de Datos: Actualice conjuntos de datos existentes con nuevos datos, preservando las configuraciones de análisis
- Soporte Multi-Formato: Importe datos desde exportaciones CSV o formatos binarios propietarios
- Procesamiento por Lotes: Suba conjuntos de datos grandes de hasta 1GB con seguimiento de progreso
Límites de Tamaño de Archivo
Todos los endpoints de subida soportan archivos hasta 1GB de tamaño. Para conjuntos de datos más grandes, considere:
- Dividir los datos en múltiples subidas
- Usar el formato binario para mayor eficiencia
- Contactar con soporte para soluciones empresariales de datos
Autenticación
Todos los endpoints de la API de Conjuntos de Datos (excepto unauthorized-ping) requieren autenticación válida con permisos apropiados para el proyecto y tenant objetivo.
Primeros Pasos
Comience con Creación de Conjuntos de Datos para aprender cómo crear conjuntos de datos, luego explore Importación de Datos para detalles sobre asignación de columnas.