Jeux de données
API de gestion des données
Téléversez, gérez et mettez à jour des jeux de données avec prise en charge de plusieurs formats de fichiers, y compris CSV, packages ZIP et formats binaires.
Fonctionnalités
Création de jeux de données
Créez de nouveaux jeux de données à partir de fichiers CSV, packages ZIP ou fichiers binaires.
Importation de données
Importez des données avec mappage des colonnes pour l’analyse de process mining.
Mises à jour des jeux de données
Mettez à jour les jeux de données existants avec de nouvelles données tout en conservant les configurations.
Mises à jour des jeux de données
Formats de fichiers
Formats de fichiers supportés et structures de données.
Points de terminaison disponibles
Test de connectivité
- GET
/api/{tenantId}/{projectId}/dataset/unauthorized-ping- Test de connectivité public (authentification non requise) - GET
/api/{tenantId}/{projectId}/dataset/ping- Test de connectivité authentifié
Opérations sur les jeux de données
- GET
/api/{tenantId}/{projectId}/dataset- Liste tous les jeux de données d’un projet
Création de jeux de données
- POST
/api/{tenantId}/{projectId}/dataset/csv- Crée un jeu de données à partir d’un fichier CSV - POST
/api/{tenantId}/{projectId}/dataset/package- Crée un jeu de données à partir d’un package ZIP - POST
/api/{tenantId}/{projectId}/dataset/binary- Crée un jeu de données à partir d’un fichier binaire
Mises à jour des jeux de données
- PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/csv- Met à jour un jeu de données à partir d’un CSV - PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/package- Met à jour un jeu de données à partir d’un package ZIP - PUT
/api/{tenantId}/{projectId}/dataset/{datasetId}/binary- Met à jour un jeu de données à partir d’un fichier binaire
Formats de fichiers supportés
mindzieStudio prend en charge plusieurs formats de données pour le process mining :
Fichiers CSV
Valeurs séparées par des virgules avec mappage flexible des colonnes.
- Journaux d’événements avec ID de cas, activité, horodatage
- Paramètres culturels personnalisés pour l’analyse des dates/nombres
- Support de l’encodage UTF-8
Packages ZIP
Packages compressés contenant plusieurs fichiers liés.
- Jeux de données complexes avec plusieurs tables
- Fichiers de métadonnées et de configuration
- Standards mindzie pour le packaging des jeux de données
Fichiers binaires
Format binaire natif pour un transfert efficace des données.
- Données de journaux d’événements pré-traitées
- Optimisé pour les gros jeux de données
- Mappages de colonnes requis
Structure du jeu de données
Comprendre la structure de données attendue pour l’analyse de process mining :
Colonnes obligatoires
| Colonne | Description |
|---|---|
| Case ID | Identifiant unique pour chaque instance de processus |
| Activity | Nom de l’activité ou de l’événement |
| Timestamp | Moment où l’activité s’est produite |
Colonnes optionnelles
| Colonne | Description |
|---|---|
| Resource | Utilisateur ou système ayant réalisé l’activité |
| Start Time | Heure de début de l’activité (pour calcul de durée) |
| Expected Order | Colonne de séquencement des événements |
Structure de la réponse
{
"datasetId": "550e8400-e29b-41d4-a716-446655440000",
"datasetName": "Processus de commande d’achat",
"datasetDescription": "Journal d’événements provenant de SAP procurement",
"projectId": "660e8400-e29b-41d4-a716-446655440000",
"caseIdColumnName": "CaseID",
"activityColumnName": "Activity",
"timeColumnName": "Timestamp",
"resourceColumnName": "Resource",
"beginTimeColumnName": "StartTime",
"useDateOnlySorting": false,
"useOnlyEventColumns": false,
"dateCreated": "2024-01-15T10:30:00Z",
"dateModified": "2024-01-15T14:45:00Z",
"createdBy": "user@example.com",
"modifiedBy": "user@example.com"
}
Structure de la réponse d’upload
Les points de terminaison de création et mise à jour renvoient des statistiques d’import :
{
"datasetId": "550e8400-e29b-41d4-a716-446655440000",
"caseCount": 5200,
"eventCount": 150000,
"invalidValueCount": 12,
"skippedRowsCount": 3,
"errors": [],
"rowIssues": [],
"statusCode": 200
}
Cas d’usage courants
- Import de journaux d’événements : Téléversez des données d’événements procéduraux depuis des systèmes ERP, CRM ou BPM
- Actualisation des données : Mettez à jour les jeux de données existants avec de nouvelles données tout en conservant les configurations d’analyse
- Support multiformat : Importez des données depuis des exports CSV ou des formats binaires propriétaires
- Traitement par lots : Téléversez de grands jeux de données jusqu’à 1 Go avec suivi de progression
Limites de taille de fichiers
Tous les points de terminaison d’upload supportent des fichiers jusqu’à 1 Go. Pour des jeux de données plus volumineux, pensez à :
- Fractionner les données en plusieurs uploads
- Utiliser le format binaire pour plus d’efficacité
- Contacter le support pour des solutions données entreprise
Authentification
Tous les points de terminaison de l’API de jeux de données (à l’exception de unauthorized-ping) nécessitent une authentification valide avec les permissions appropriées pour le projet et le tenant ciblés.
Premiers pas
Commencez avec la création de jeux de données pour apprendre à créer des jeux de données, puis explorez l’importation de données pour les détails sur le mappage des colonnes.