Conjuntos de Datos

API de Gestión de Datos

Suba, gestione y actualice conjuntos de datos con soporte para múltiples formatos de archivo, incluyendo CSV, paquetes ZIP y formatos binarios.

Características

Creación de Conjuntos de Datos

Cree nuevos conjuntos de datos a partir de archivos CSV, paquetes ZIP o archivos binarios.

Crear Conjuntos de Datos

Importación de Datos

Importe datos con asignación de columnas para análisis de minería de procesos.

Importar Datos

Actualizaciones de Conjuntos de Datos

Actualice conjuntos de datos existentes con datos nuevos mientras se preservan las configuraciones.

Actualizar Conjuntos de Datos

Formatos de Archivo

Formatos de archivo y estructuras de datos soportados.

Ver Formatos

Endpoints Disponibles

Prueba de Conectividad

  • GET /api/{tenantId}/{projectId}/dataset/unauthorized-ping - Prueba de conectividad pública (sin autenticación requerida)
  • GET /api/{tenantId}/{projectId}/dataset/ping - Prueba de conectividad autenticada

Operaciones de Conjuntos de Datos

  • GET /api/{tenantId}/{projectId}/dataset - Listar todos los conjuntos de datos en un proyecto

Creación de Conjuntos de Datos

  • POST /api/{tenantId}/{projectId}/dataset/csv - Crear conjunto de datos desde archivo CSV
  • POST /api/{tenantId}/{projectId}/dataset/package - Crear conjunto de datos desde paquete ZIP
  • POST /api/{tenantId}/{projectId}/dataset/binary - Crear conjunto de datos desde archivo binario

Actualizaciones de Conjuntos de Datos

  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/csv - Actualizar conjunto de datos desde CSV
  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/package - Actualizar conjunto de datos desde paquete ZIP
  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/binary - Actualizar conjunto de datos desde archivo binario

Formatos de Archivo Soportados

mindzieStudio soporta múltiples formatos de datos para minería de procesos:

Archivos CSV

Valores separados por comas con asignación flexible de columnas.

  • Registros de eventos con ID de caso, actividad, marca de tiempo
  • Configuraciones culturales personalizadas para el análisis de fechas/números
  • Soporte para codificación UTF-8

Paquetes ZIP

Paquetes comprimidos que contienen múltiples archivos relacionados.

  • Conjuntos de datos complejos con múltiples tablas
  • Archivos de metadatos y configuración
  • Estándares de empaquetado de conjuntos de datos mindzie

Archivos Binarios

Formato binario nativo para transferencia eficiente de datos.

  • Datos de registros de eventos preprocesados
  • Optimizado para grandes conjuntos de datos
  • Se requieren asignaciones de columnas

Estructura del Conjunto de Datos

Comprendiendo la estructura de datos esperada para el análisis de minería de procesos:

Columnas Requeridas

Columna Descripción
Case ID Identificador único para cada instancia del proceso
Activity Nombre de la actividad o evento
Timestamp Momento en que ocurrió la actividad

Columnas Opcionales

Columna Descripción
Resource Usuario o sistema que realizó la actividad
Start Time Hora de inicio de la actividad (para cálculos de duración)
Expected Order Columna para ordenamiento secuencial

Estructura de Respuesta

{
  "datasetId": "550e8400-e29b-41d4-a716-446655440000",
  "datasetName": "Purchase Order Process",
  "datasetDescription": "Event log from SAP procurement",
  "projectId": "660e8400-e29b-41d4-a716-446655440000",
  "caseIdColumnName": "CaseID",
  "activityColumnName": "Activity",
  "timeColumnName": "Timestamp",
  "resourceColumnName": "Resource",
  "beginTimeColumnName": "StartTime",
  "useDateOnlySorting": false,
  "useOnlyEventColumns": false,
  "dateCreated": "2024-01-15T10:30:00Z",
  "dateModified": "2024-01-15T14:45:00Z",
  "createdBy": "user@example.com",
  "modifiedBy": "user@example.com"
}

Estructura de Respuesta de Subida

Los endpoints de creación y actualización de conjuntos de datos retornan estadísticas de importación:

{
  "datasetId": "550e8400-e29b-41d4-a716-446655440000",
  "caseCount": 5200,
  "eventCount": 150000,
  "invalidValueCount": 12,
  "skippedRowsCount": 3,
  "errors": [],
  "rowIssues": [],
  "statusCode": 200
}

Casos de Uso Comunes

  • Importación de Registros de Eventos: Suba datos de eventos de procesos desde sistemas ERP, CRM o BPM
  • Actualización de Datos: Actualice conjuntos de datos existentes con nuevos datos, preservando las configuraciones de análisis
  • Soporte Multi-Formato: Importe datos desde exportaciones CSV o formatos binarios propietarios
  • Procesamiento por Lotes: Suba conjuntos de datos grandes de hasta 1GB con seguimiento de progreso

Límites de Tamaño de Archivo

Todos los endpoints de subida soportan archivos hasta 1GB de tamaño. Para conjuntos de datos más grandes, considere:

  • Dividir los datos en múltiples subidas
  • Usar el formato binario para mayor eficiencia
  • Contactar con soporte para soluciones empresariales de datos

Autenticación

Todos los endpoints de la API de Conjuntos de Datos (excepto unauthorized-ping) requieren autenticación válida con permisos apropiados para el proyecto y tenant objetivo.

Primeros Pasos

Comience con Creación de Conjuntos de Datos para aprender cómo crear conjuntos de datos, luego explore Importación de Datos para detalles sobre asignación de columnas.