Architecture des Données

L'architecture des données montre comment les données de processus entrent dans mindzieStudio, sont transformées via l'enrichissement, et peuvent être exportées ou utilisées pour déclencher des actions automatisées. Comprendre ces flux de données vous aide à concevoir des stratégies d’intégration de données efficaces.

Architecture des Données

Vue d’ensemble

mindzieStudio prend en charge plusieurs méthodes d'entrée de données, une couche API centralisée, et diverses options de sortie. Cette architecture flexible vous permet d'intégrer le process mining dans votre écosystème de données existant.


Sources d’Entrée des Données

Il existe plusieurs façons d'importer des données de processus dans mindzieStudio :

Téléversement Manuel

La méthode la plus simple consiste à téléverser des fichiers directement via l’interface mindzieStudio. Les formats pris en charge incluent :

  • Fichiers CSV : valeurs séparées par des virgules standard
  • Fichiers Excel : feuilles de calcul .xlsx
  • Fichiers Parquet : format de stockage en colonnes pour grands ensembles de données
  • Archives ZIP : paquets compressés contenant plusieurs fichiers

Le téléversement manuel est idéal pour des analyses ponctuelles, des projets de preuve de concept, ou lorsque les données sont déjà exportées des systèmes sources.

mindzie Data Designer

mindzie Data Designer est un outil visuel qui se connecte directement à vos bases de données et systèmes sources. Il vous permet de :

  • Définir les schémas de données visuellement
  • Mapper les colonnes sources au format journal d’événements
  • Planifier des rafraîchissements de données automatisés
  • Transformer les données lors de l'extraction

Data Designer supporte les connexions aux principales bases de données dont SQL Server, Oracle, PostgreSQL, MySQL, SAP HANA, et bien d'autres.

Outils ETL Tiers

Si votre organisation dispose déjà d’une infrastructure ETL (Extract, Transform, Load), vous pouvez l’intégrer à mindzieStudio via des pipelines de données standards. Cette approche exploite vos capacités d’ingénierie des données et processus de gouvernance existants.

Téléversement de Données par Développeur

Pour un accès programmatique, l’API mindzieStudio permet aux développeurs de :

  • Téléverser des ensembles de données via des points de terminaison HTTP
  • Automatiser le rafraîchissement des données depuis des applications personnalisées
  • S’intégrer avec des pipelines CI/CD
  • Construire des connecteurs de données personnalisés

Cela convient parfaitement aux organisations construisant des pipelines de données automatisés ou intégrant le process mining dans des systèmes plus larges.

Intégration Mulesoft

Les organisations d’envergure utilisant Mulesoft pour l’intégration peuvent connecter mindzieStudio comme point de terminaison API dans leurs flux d’intégration. Cela permet aux données de processus de circuler dans le cadre de votre stratégie d’intégration d’entreprise globale.


API

L’API sert de passerelle centrale à tous les déplacements de données dans mindzieStudio. Toutes les données - qu’elles soient téléversées manuellement ou via automatisation - transitent par la couche API.

L’API offre :

  • Authentification : accès sécurisé par jetons d’accès bearer
  • Validation : validation du format et du schéma des données
  • Routage : acheminement des données vers les composants de traitement appropriés
  • Contrôle d’accès : permissions au niveau locataire et projet

L’API est disponible dans les éditions Enterprise Server et SaaS de mindzieStudio.


Dataset

Une fois les données entrées dans mindzieStudio, elles sont stockées sous forme de Dataset. Les Datasets sont :

  • Compressés : format de stockage binaire efficace
  • Validés : contrôlés pour les colonnes nécessaires et les types de données
  • Versionnés : les versions précédentes peuvent être conservées pour comparaison

Chaque dataset doit inclure les trois colonnes principales du journal d'événements :

  • Case ID (identifiant de chaque instance de processus)
  • Activity (nom de chaque étape)
  • Timestamp (moment auquel chaque étape s’est produite)

Les colonnes d’attributs supplémentaires peuvent contenir toutes les données métier pertinentes.


Enrichissement avec Python

La couche d’enrichissement transforme les datasets bruts en données prêtes pour l’analyse. Les enrichissements peuvent inclure :

  • Opérateurs de transformation intégrés
  • Scripts Python personnalisés pour une logique avancée
  • Calculs de règles métier
  • Corrections de qualité de données

L’intégration Python vous permet de :

  • Écrire une logique de transformation personnalisée
  • Exploiter les bibliothèques Python de data science
  • Créer des scripts de transformation réutilisables
  • Gérer des scénarios complexes de manipulation de données

Les enrichissements s’exécutent en arrière-plan et mettent en cache leurs résultats pour un accès rapide lors de l’analyse.


Investigation et Analyse

La couche Investigation est le lieu où l’analyse a lieu. Dans les investigations, vous pouvez :

  • Appliquer des filtres d’investigation pour vous concentrer sur des sous-ensembles spécifiques de données
  • Créer des carnets d’analyse composés de blocs ordonnés
  • Générer des insights via des calculateurs
  • Construire des visualisations

Les résultats d’analyse sont mis en cache et peuvent être actualisés lors de la mise à jour des données sources.


Sortie et Intégration

mindzieStudio propose plusieurs moyens d’exporter les données et de s’intégrer avec des systèmes externes :

Actions

Les Actions sont des workflows automatisés qui s’exécutent selon des horaires ou des déclencheurs. Les Actions peuvent :

  • Exécuter des scripts Python pour un traitement personnalisé
  • Appeler des APIs HTTP externes
  • Exporter des données vers des systèmes externes
  • Enchaîner plusieurs étapes
  • Gérer les erreurs avec des actions de secours

Les Actions permettent une intégration opérationnelle, où les insights de processus déclenchent des réponses concrètes.

Export API

Les systèmes externes peuvent interroger mindzieStudio via l’API pour :

  • Récupérer les résultats d’analyse de façon programmatique
  • Extraire les données des tableaux de bord dans d’autres applications
  • Intégrer les métriques de processus dans des systèmes de reporting
  • Alimenter des tableaux de bord opérationnels dans des outils externes

Export CSV

Pour une exportation simple des données, vous pouvez télécharger les résultats d’analyse au format CSV. Cela est utile pour :

  • Partager les données avec des parties prenantes sans accès à mindzieStudio
  • Charger les données dans des outils de tableur
  • Créer des copies de sauvegarde des résultats d’analyse

Résumé du Flux de Données

Le flux complet des données à travers mindzieStudio :

  1. Entrée : Les données arrivent via Téléversement Manuel, Data Designer, outils ETL, API ou Mulesoft
  2. Passerelle : L’API valide, authentifie et route les données
  3. Stockage : Les données sont stockées sous forme de Datasets compressés
  4. Transformation : Les enrichissements (avec Python en option) préparent les données
  5. Analyse : Les investigations et carnets génèrent des insights
  6. Sortie : Les résultats circulent vers les Actions, consommateurs API ou exports CSV

Cette architecture supporte à la fois l’analyse interactive et les workflows opérationnels automatisés, rendant mindzieStudio adapté aussi bien à l’exploration ponctuelle qu’à la surveillance des processus en production.