Jeux de données

API de gestion des données

Téléversez, gérez et mettez à jour des jeux de données avec prise en charge de plusieurs formats de fichiers, y compris CSV, packages ZIP et formats binaires.

Fonctionnalités

Création de jeux de données

Créez de nouveaux jeux de données à partir de fichiers CSV, packages ZIP ou fichiers binaires.

Créer des jeux de données

Importation de données

Importez des données avec mappage des colonnes pour l’analyse de process mining.

Importer des données

Mises à jour des jeux de données

Mettez à jour les jeux de données existants avec de nouvelles données tout en conservant les configurations.

Mises à jour des jeux de données

Formats de fichiers

Formats de fichiers supportés et structures de données.

Voir les formats

Points de terminaison disponibles

Test de connectivité

  • GET /api/{tenantId}/{projectId}/dataset/unauthorized-ping - Test de connectivité public (authentification non requise)
  • GET /api/{tenantId}/{projectId}/dataset/ping - Test de connectivité authentifié

Opérations sur les jeux de données

  • GET /api/{tenantId}/{projectId}/dataset - Liste tous les jeux de données d’un projet

Création de jeux de données

  • POST /api/{tenantId}/{projectId}/dataset/csv - Crée un jeu de données à partir d’un fichier CSV
  • POST /api/{tenantId}/{projectId}/dataset/package - Crée un jeu de données à partir d’un package ZIP
  • POST /api/{tenantId}/{projectId}/dataset/binary - Crée un jeu de données à partir d’un fichier binaire

Mises à jour des jeux de données

  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/csv - Met à jour un jeu de données à partir d’un CSV
  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/package - Met à jour un jeu de données à partir d’un package ZIP
  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/binary - Met à jour un jeu de données à partir d’un fichier binaire

Formats de fichiers supportés

mindzieStudio prend en charge plusieurs formats de données pour le process mining :

Fichiers CSV

Valeurs séparées par des virgules avec mappage flexible des colonnes.

  • Journaux d’événements avec ID de cas, activité, horodatage
  • Paramètres culturels personnalisés pour l’analyse des dates/nombres
  • Support de l’encodage UTF-8

Packages ZIP

Packages compressés contenant plusieurs fichiers liés.

  • Jeux de données complexes avec plusieurs tables
  • Fichiers de métadonnées et de configuration
  • Standards mindzie pour le packaging des jeux de données

Fichiers binaires

Format binaire natif pour un transfert efficace des données.

  • Données de journaux d’événements pré-traitées
  • Optimisé pour les gros jeux de données
  • Mappages de colonnes requis

Structure du jeu de données

Comprendre la structure de données attendue pour l’analyse de process mining :

Colonnes obligatoires

Colonne Description
Case ID Identifiant unique pour chaque instance de processus
Activity Nom de l’activité ou de l’événement
Timestamp Moment où l’activité s’est produite

Colonnes optionnelles

Colonne Description
Resource Utilisateur ou système ayant réalisé l’activité
Start Time Heure de début de l’activité (pour calcul de durée)
Expected Order Colonne de séquencement des événements

Structure de la réponse

{
  "datasetId": "550e8400-e29b-41d4-a716-446655440000",
  "datasetName": "Processus de commande d’achat",
  "datasetDescription": "Journal d’événements provenant de SAP procurement",
  "projectId": "660e8400-e29b-41d4-a716-446655440000",
  "caseIdColumnName": "CaseID",
  "activityColumnName": "Activity",
  "timeColumnName": "Timestamp",
  "resourceColumnName": "Resource",
  "beginTimeColumnName": "StartTime",
  "useDateOnlySorting": false,
  "useOnlyEventColumns": false,
  "dateCreated": "2024-01-15T10:30:00Z",
  "dateModified": "2024-01-15T14:45:00Z",
  "createdBy": "user@example.com",
  "modifiedBy": "user@example.com"
}

Structure de la réponse d’upload

Les points de terminaison de création et mise à jour renvoient des statistiques d’import :

{
  "datasetId": "550e8400-e29b-41d4-a716-446655440000",
  "caseCount": 5200,
  "eventCount": 150000,
  "invalidValueCount": 12,
  "skippedRowsCount": 3,
  "errors": [],
  "rowIssues": [],
  "statusCode": 200
}

Cas d’usage courants

  • Import de journaux d’événements : Téléversez des données d’événements procéduraux depuis des systèmes ERP, CRM ou BPM
  • Actualisation des données : Mettez à jour les jeux de données existants avec de nouvelles données tout en conservant les configurations d’analyse
  • Support multiformat : Importez des données depuis des exports CSV ou des formats binaires propriétaires
  • Traitement par lots : Téléversez de grands jeux de données jusqu’à 1 Go avec suivi de progression

Limites de taille de fichiers

Tous les points de terminaison d’upload supportent des fichiers jusqu’à 1 Go. Pour des jeux de données plus volumineux, pensez à :

  • Fractionner les données en plusieurs uploads
  • Utiliser le format binaire pour plus d’efficacité
  • Contacter le support pour des solutions données entreprise

Authentification

Tous les points de terminaison de l’API de jeux de données (à l’exception de unauthorized-ping) nécessitent une authentification valide avec les permissions appropriées pour le projet et le tenant ciblés.

Premiers pas

Commencez avec la création de jeux de données pour apprendre à créer des jeux de données, puis explorez l’importation de données pour les détails sur le mappage des colonnes.