Comprendre l’Architecture à Double Jeu de Données de mindzie

Aperçu

Lorsque vous téléchargez des données dans mindzie Studio, la plateforme crée automatiquement deux jeux de données distincts qui fonctionnent ensemble pour alimenter votre analyse de fouille de processus. Comprendre la différence entre ces jeux de données et savoir quand en utiliser chacun est fondamental pour travailler efficacement avec mindzie Studio.

Ce guide explique l’architecture à double jeu de données, comment le pipeline de données mindzie transforme vos données, et ce qui se passe automatiquement lors de la première importation de données.

Les Deux Jeux de Données

Jeu de Données Original

Le Jeu de Données Original est le journal des événements brut que vous téléchargez initialement dans mindzie Studio. Ce jeu de données contient vos données de processus telle qu’elles ont été fournies, que ce soit via un fichier CSV ou ingéré via mindzie Data Designer depuis les systèmes source.

Caractéristiques :

  • Contient les données brutes dans leur forme originale
  • Comprend uniquement les colonnes et attributs que vous avez importés (Case ID, Activity, Timestamp, Resource, et tout attribut supplémentaire)
  • Reste inchangé tout au long de votre analyse
  • Sert de base pour tous les traitements de données ultérieurs

Quand utiliser le Jeu de Données Original :

  • Pour vérifier les données sources
  • Pour les contrôles et validations de qualité des données
  • Pour comprendre ce qui a été initialement fourni avant toute transformation

Jeu de Données Enrichi

Le Jeu de Données Enrichi est automatiquement créé par mindzie Studio après l’exécution du pipeline de données. C’est la version améliorée de vos données qui inclut tous les attributs calculés, métriques de performance, indicateurs de conformité, et autres enrichissements ajoutés via le moteur d’enrichissement des logs.

Caractéristiques :

  • Créé automatiquement lors de l’importation des données
  • Contient tous les attributs originaux plus les nouveaux attributs calculés
  • Mis à jour chaque fois que vous lancez des calculs d’enrichissement
  • Alimente toutes les analyses, enquêtes, et tableaux de bord

Quand utiliser le Jeu de Données Enrichi :

  • Pour tout travail d’analyse et d’enquête (c’est le jeu de données principal pour l’analyse)
  • Lors de la création de tableaux de bord et KPI
  • Pour travailler avec les métriques de performance, règles de conformité, ou enrichissements personnalisés
  • Pour les activités quotidiennes de fouille de processus

Vue des jeux de données Vue des jeux de données montrant à la fois le Jeu de Données Original et le Jeu de Données Enrichi

Comment Fonctionne le Pipeline de Données

Lorsque vous téléchargez des données dans mindzie Studio, voici ce qui se passe automatiquement :

Étape 1 : Importation et Validation des Données

Votre fichier CSV ou données issues de mindzie Data Designer sont chargés dans mindzie Studio. Le système :

  • Valide le format et la structure des données
  • Mappe les colonnes clés (Case ID, Activity, Timestamp, Resource)
  • Assigne les types de colonnes et de données
  • Crée le Jeu de Données Original

Étape 2 : Exécution Automatique du Pipeline

Une fois que vous cliquez sur "Save" après avoir téléchargé vos données, mindzie Studio :

  • Exécute automatiquement le pipeline de données
  • Crée le Jeu de Données Enrichi
  • Ajoute des attributs fondamentaux qui améliorent vos capacités d’analyse

Étape 3 : Génération d’Analyse par Défaut

Pour vous donner un démarrage rapide, mindzie Studio génère automatiquement des analyses par défaut utiles incluant :

  • Vue d’ensemble du processus
  • Durées longues des cas
  • Durées entre les étapes principales du processus
  • Autres insights clés

Ces analyses préconstruites vous aident à commencer à explorer votre processus immédiatement sans avoir à tout créer de zéro.

Analyse par défaut Enquête par défaut créée automatiquement lors de l’importation des données

Tableau de bord par défaut Analyse par défaut montrant 10 000 cas et 121 000 événements avec des insights clés du processus

Comprendre la Taille du Jeu de Données : Exemple

Dans la démonstration, le jeu de données d’intégration bancaire contient :

  • 10 000 cas - Chaque cas représente un parcours client lors de l’intégration
  • 121 000 événements - Le nombre total d’étapes de processus à travers tous les cas

Cela signifie qu’en moyenne, chaque cas d’intégration client implique environ 12 activités ou étapes de processus. Ce type d’information devient immédiatement visible une fois vos données chargées dans mindzie Studio.

Le Rôle de l’Enrichissement des Logs

La puissance de l’architecture à double jeu de données devient évidente lorsque vous commencez à utiliser le moteur d’enrichissement des logs. C’est ici que le Jeu de Données Enrichi se différencie véritablement du Jeu de Données Original.

Ce que fait l’Enrichissement des Logs

L’enrichissement des logs vous permet d’améliorer vos données avec :

Métriques de Performance :

  • Calculs de durée entre paires d’activités
  • Durée du cas du début à la fin
  • Classification de performance (rapide, normal, lent)
  • Suivi personnalisé du respect des SLA

Règles de Conformité :

  • Indicateurs pour activités indésirables
  • Étapes obligatoires manquantes
  • Ordre incorrect des activités
  • Activités répétées et boucles de retouche

Attributs Personnalisés :

  • Coût basé sur l’activité
  • Prédictions IA
  • Catégorisations personnalisées
  • Transformations mathématiques
  • Calculs basés sur le temps

Comment les Enrichissements Mettent à Jour le Jeu de Données

Chaque fois que vous créez de nouveaux enrichissements et les calculez :

  1. Le pipeline de données s’exécute
  2. De nouveaux attributs sont ajoutés au Jeu de Données Enrichi
  3. Ces nouveaux attributs deviennent disponibles pour les filtres et calculateurs
  4. Votre analyse devient plus puissante à chaque enrichissement

Attributs enrichis Vue d’ensemble des données montrant à la fois les attributs originaux et les attributs enrichis avec des icônes indiquant les améliorations générées par le système

Attributs Automatiques Ajoutés par mindzie

Même sans aucun enrichissement manuel, mindzie Studio ajoute automatiquement plusieurs attributs utiles à votre Jeu de Données Enrichi, notamment :

  • Heure de la journée - Moment où les activités ont eu lieu
  • Début du cas - Quand chaque cas a commencé
  • Fin du cas - Quand chaque cas s’est terminé
  • Durée du cas - Temps total du début à la fin
  • Premier intervenant - Qui a initié le cas
  • Fréquence d’activité - À quelle fréquence les activités se produisent
  • Et bien plus encore...

Ces enrichissements automatiques vous offrent des capacités analytiques immédiates sans aucune configuration.

Choisir le Bon Jeu de Données pour l’Analyse

Lorsque vous créez des enquêtes et des carnets d’analyse dans mindzie Studio, vous devez sélectionner quel jeu de données analyser.

Bonne pratique : Sélectionnez toujours le Jeu de Données Enrichi pour vos enquêtes et travaux d’analyse. Ce jeu de données contient tous les attributs enrichis et les métriques calculées qui rendent votre analyse puissante et pertinente.

Le Jeu de Données Original doit être principalement utilisé pour :

  • Référence et validation
  • Audits de qualité des données
  • Compréhension de la structure des données sources

Le Cycle d’Amélioration Continue

L’architecture à double jeu de données supporte un flux de travail itératif :

  1. Importer - Importez vos données pour créer le Jeu de Données Original
  2. Enrichir - Ajoutez des métriques de performance, règles de conformité, et attributs personnalisés
  3. Calculer - Exécutez le pipeline pour mettre à jour le Jeu de Données Enrichi
  4. Analyser - Créez des enquêtes et analyses utilisant les attributs enrichis
  5. Répéter - Ajoutez plus d’enrichissements au besoin pour approfondir vos insights

Chaque cycle rend votre Jeu de Données Enrichi plus précieux et votre analyse plus sophistiquée.

Points Clés à Retenir

  • Deux jeux de données sont créés : Original (données brutes) et Enrichi (données améliorées)
  • Création automatique : Le Jeu de Données Enrichi est créé automatiquement lors de l’importation des données
  • Utilisez le Jeu de Données Enrichi : C’est votre jeu de données principal pour toute analyse et enquête
  • Exécution du pipeline : Le pipeline de données transforme l’Original en Enrichi
  • Amélioration continue : Chaque calcul d’enrichissement ajoute de nouveaux attributs au Jeu de Données Enrichi
  • Analyse par défaut : mindzie Studio fournit automatiquement des analyses de démarrage utiles
  • Processus itératif : Vous pouvez continuer à ajouter des enrichissements pour rendre votre analyse plus puissante

Prochaines Étapes

Maintenant que vous comprenez l’architecture à double jeu de données, vous êtes prêt à :

  • Explorer le moteur d’enrichissement des logs pour ajouter des métriques de performance
  • Créer des règles de conformité pour identifier les non-conformités dans vos processus
  • Construire des enrichissements personnalisés pour des besoins métier spécifiques
  • Créer des enquêtes et analyses utilisant les attributs enrichis
  • Publier des insights aux tableaux de bord destinés aux utilisateurs finaux

L’architecture à double jeu de données est la base qui rend possibles toutes les puissantes capacités analytiques de mindzie Studio. En séparant les données originales des données enrichies, vous conservez l’intégrité des données tout en gagnant une flexibilité illimitée pour transformer et analyser vos processus.