Datasets

Data Management API

Upload, beheer en werk datasets bij met ondersteuning voor meerdere bestandsformaten, waaronder CSV, ZIP-pakketten en binaire formaten.

Functies

Dataset Creatie

Maak nieuwe datasets aan vanuit CSV, ZIP-pakketten of binaire bestanden.

Datasets aanmaken

Data Importeren

Importeer gegevens met kolommapping voor procesmining-analyse.

Data importeren

Dataset Updates

Werk bestaande datasets bij met nieuwe data terwijl configuraties behouden blijven.

Datasets bijwerken

Bestandsformaten

Ondersteunde bestandsformaten en datastructuren.

Formaten bekijken

Beschikbare Endpoints

Connectiviteitstest

  • GET /api/{tenantId}/{projectId}/dataset/unauthorized-ping - Publieke connectiviteitstest (geen authenticatie vereist)
  • GET /api/{tenantId}/{projectId}/dataset/ping - Geauthenticeerde connectiviteitstest

Dataset Operaties

  • GET /api/{tenantId}/{projectId}/dataset - Alle datasets in een project weergeven

Dataset Creatie

  • POST /api/{tenantId}/{projectId}/dataset/csv - Dataset aanmaken vanuit CSV-bestand
  • POST /api/{tenantId}/{projectId}/dataset/package - Dataset aanmaken vanuit ZIP-pakket
  • POST /api/{tenantId}/{projectId}/dataset/binary - Dataset aanmaken vanuit binair bestand

Dataset Updates

  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/csv - Dataset bijwerken vanuit CSV
  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/package - Dataset bijwerken vanuit ZIP-pakket
  • PUT /api/{tenantId}/{projectId}/dataset/{datasetId}/binary - Dataset bijwerken vanuit binair bestand

Ondersteunde Bestandsformaten

mindzieStudio ondersteunt meerdere dataformaten voor procesmining:

CSV-bestanden

Door komma’s gescheiden waarden met flexibele kolommapping.

  • Event logs met case-ID, activiteit, tijdstempel
  • Aangepaste cultuurinstellingen voor datum-/nummerparsing
  • UTF-8 codering ondersteund

ZIP-pakketten

Gecomprimeerde pakketten met meerdere gerelateerde bestanden.

  • Complexe datasets met meerdere tabellen
  • Metadata- en configuratiebestanden
  • mindzie dataset verpakkingsstandaarden

Binaire Bestanden

Native binair formaat voor efficiënte datatransfer.

  • Voorverwerkte event log data
  • Geoptimaliseerd voor grote datasets
  • Kolommapping vereist

Datasetstructuur

Begrip van de verwachte datastructuur voor procesmining-analyse:

Vereiste kolommen

Kolom Omschrijving
Case ID Unieke identifier voor elke procesinstantie
Activiteit Naam van de activiteit of gebeurtenis
Tijdstempel Wanneer de activiteit plaatsvond

Optionele kolommen

Kolom Omschrijving
Resource Gebruiker of systeem dat de activiteit uitvoerde
Starttijd Starttijd van de activiteit (voor duurcalculaties)
Verwachte volgorde Kolom voor volgorde in de sequentie

Response-structuur

{
  "datasetId": "550e8400-e29b-41d4-a716-446655440000",
  "datasetName": "Purchase Order Process",
  "datasetDescription": "Event log from SAP procurement",
  "projectId": "660e8400-e29b-41d4-a716-446655440000",
  "caseIdColumnName": "CaseID",
  "activityColumnName": "Activity",
  "timeColumnName": "Timestamp",
  "resourceColumnName": "Resource",
  "beginTimeColumnName": "StartTime",
  "useDateOnlySorting": false,
  "useOnlyEventColumns": false,
  "dateCreated": "2024-01-15T10:30:00Z",
  "dateModified": "2024-01-15T14:45:00Z",
  "createdBy": "user@example.com",
  "modifiedBy": "user@example.com"
}

Upload Response-structuur

Endpoints voor dataset aanmaken en bijwerken geven importstatistieken terug:

{
  "datasetId": "550e8400-e29b-41d4-a716-446655440000",
  "caseCount": 5200,
  "eventCount": 150000,
  "invalidValueCount": 12,
  "skippedRowsCount": 3,
  "errors": [],
  "rowIssues": [],
  "statusCode": 200
}

Veelvoorkomende Use Cases

  • Event Log Importeren: Procesgebeurtenisgegevens uploaden vanuit ERP-, CRM- of BPM-systemen
  • Data Vernieuwen: Bestaande datasets bijwerken met nieuwe data terwijl analyseconfiguraties behouden blijven
  • Ondersteuning voor Meerdere Formaten: Data importeren uit CSV-exporten of propriëtaire binaire formaten
  • Batchverwerking: Grote datasets tot 1GB uploaden met voortgangscontrole

Limieten voor Bestandsgrootte

Alle upload endpoints ondersteunen bestanden tot 1GB. Voor grotere datasets overweeg:

  • Data op te splitsen in meerdere uploads
  • Het binaire formaat te gebruiken voor efficiëntie
  • Contact op te nemen met support voor enterprise data-oplossingen

Authenticatie

Alle Dataset API endpoints (behalve unauthorized-ping) vereisen geldige authenticatie met de juiste rechten voor het doelproject en tenant.

Aan de slag

Begin met Dataset Creatie om te leren hoe je datasets maakt, en verken daarna Data Importeren voor details over kolommapping.