Comprendre l’Architecture à Double Jeu de Données de mindzie
Aperçu
Lorsque vous téléchargez des données dans mindzie Studio, la plateforme crée automatiquement deux jeux de données distincts qui fonctionnent ensemble pour alimenter votre analyse de fouille de processus. Comprendre la différence entre ces jeux de données et savoir quand en utiliser chacun est fondamental pour travailler efficacement avec mindzie Studio.
Ce guide explique l’architecture à double jeu de données, comment le pipeline de données mindzie transforme vos données, et ce qui se passe automatiquement lors de la première importation de données.
Les Deux Jeux de Données
Jeu de Données Original
Le Jeu de Données Original est le journal des événements brut que vous téléchargez initialement dans mindzie Studio. Ce jeu de données contient vos données de processus telle qu’elles ont été fournies, que ce soit via un fichier CSV ou ingéré via mindzie Data Designer depuis les systèmes source.
Caractéristiques :
- Contient les données brutes dans leur forme originale
- Comprend uniquement les colonnes et attributs que vous avez importés (Case ID, Activity, Timestamp, Resource, et tout attribut supplémentaire)
- Reste inchangé tout au long de votre analyse
- Sert de base pour tous les traitements de données ultérieurs
Quand utiliser le Jeu de Données Original :
- Pour vérifier les données sources
- Pour les contrôles et validations de qualité des données
- Pour comprendre ce qui a été initialement fourni avant toute transformation
Jeu de Données Enrichi
Le Jeu de Données Enrichi est automatiquement créé par mindzie Studio après l’exécution du pipeline de données. C’est la version améliorée de vos données qui inclut tous les attributs calculés, métriques de performance, indicateurs de conformité, et autres enrichissements ajoutés via le moteur d’enrichissement des logs.
Caractéristiques :
- Créé automatiquement lors de l’importation des données
- Contient tous les attributs originaux plus les nouveaux attributs calculés
- Mis à jour chaque fois que vous lancez des calculs d’enrichissement
- Alimente toutes les analyses, enquêtes, et tableaux de bord
Quand utiliser le Jeu de Données Enrichi :
- Pour tout travail d’analyse et d’enquête (c’est le jeu de données principal pour l’analyse)
- Lors de la création de tableaux de bord et KPI
- Pour travailler avec les métriques de performance, règles de conformité, ou enrichissements personnalisés
- Pour les activités quotidiennes de fouille de processus
Vue des jeux de données montrant à la fois le Jeu de Données Original et le Jeu de Données Enrichi
Comment Fonctionne le Pipeline de Données
Lorsque vous téléchargez des données dans mindzie Studio, voici ce qui se passe automatiquement :
Étape 1 : Importation et Validation des Données
Votre fichier CSV ou données issues de mindzie Data Designer sont chargés dans mindzie Studio. Le système :
- Valide le format et la structure des données
- Mappe les colonnes clés (Case ID, Activity, Timestamp, Resource)
- Assigne les types de colonnes et de données
- Crée le Jeu de Données Original
Étape 2 : Exécution Automatique du Pipeline
Une fois que vous cliquez sur "Save" après avoir téléchargé vos données, mindzie Studio :
- Exécute automatiquement le pipeline de données
- Crée le Jeu de Données Enrichi
- Ajoute des attributs fondamentaux qui améliorent vos capacités d’analyse
Étape 3 : Génération d’Analyse par Défaut
Pour vous donner un démarrage rapide, mindzie Studio génère automatiquement des analyses par défaut utiles incluant :
- Vue d’ensemble du processus
- Durées longues des cas
- Durées entre les étapes principales du processus
- Autres insights clés
Ces analyses préconstruites vous aident à commencer à explorer votre processus immédiatement sans avoir à tout créer de zéro.
Enquête par défaut créée automatiquement lors de l’importation des données
Analyse par défaut montrant 10 000 cas et 121 000 événements avec des insights clés du processus
Comprendre la Taille du Jeu de Données : Exemple
Dans la démonstration, le jeu de données d’intégration bancaire contient :
- 10 000 cas - Chaque cas représente un parcours client lors de l’intégration
- 121 000 événements - Le nombre total d’étapes de processus à travers tous les cas
Cela signifie qu’en moyenne, chaque cas d’intégration client implique environ 12 activités ou étapes de processus. Ce type d’information devient immédiatement visible une fois vos données chargées dans mindzie Studio.
Le Rôle de l’Enrichissement des Logs
La puissance de l’architecture à double jeu de données devient évidente lorsque vous commencez à utiliser le moteur d’enrichissement des logs. C’est ici que le Jeu de Données Enrichi se différencie véritablement du Jeu de Données Original.
Ce que fait l’Enrichissement des Logs
L’enrichissement des logs vous permet d’améliorer vos données avec :
Métriques de Performance :
- Calculs de durée entre paires d’activités
- Durée du cas du début à la fin
- Classification de performance (rapide, normal, lent)
- Suivi personnalisé du respect des SLA
Règles de Conformité :
- Indicateurs pour activités indésirables
- Étapes obligatoires manquantes
- Ordre incorrect des activités
- Activités répétées et boucles de retouche
Attributs Personnalisés :
- Coût basé sur l’activité
- Prédictions IA
- Catégorisations personnalisées
- Transformations mathématiques
- Calculs basés sur le temps
Comment les Enrichissements Mettent à Jour le Jeu de Données
Chaque fois que vous créez de nouveaux enrichissements et les calculez :
- Le pipeline de données s’exécute
- De nouveaux attributs sont ajoutés au Jeu de Données Enrichi
- Ces nouveaux attributs deviennent disponibles pour les filtres et calculateurs
- Votre analyse devient plus puissante à chaque enrichissement
Vue d’ensemble des données montrant à la fois les attributs originaux et les attributs enrichis avec des icônes indiquant les améliorations générées par le système
Attributs Automatiques Ajoutés par mindzie
Même sans aucun enrichissement manuel, mindzie Studio ajoute automatiquement plusieurs attributs utiles à votre Jeu de Données Enrichi, notamment :
- Heure de la journée - Moment où les activités ont eu lieu
- Début du cas - Quand chaque cas a commencé
- Fin du cas - Quand chaque cas s’est terminé
- Durée du cas - Temps total du début à la fin
- Premier intervenant - Qui a initié le cas
- Fréquence d’activité - À quelle fréquence les activités se produisent
- Et bien plus encore...
Ces enrichissements automatiques vous offrent des capacités analytiques immédiates sans aucune configuration.
Choisir le Bon Jeu de Données pour l’Analyse
Lorsque vous créez des enquêtes et des carnets d’analyse dans mindzie Studio, vous devez sélectionner quel jeu de données analyser.
Bonne pratique : Sélectionnez toujours le Jeu de Données Enrichi pour vos enquêtes et travaux d’analyse. Ce jeu de données contient tous les attributs enrichis et les métriques calculées qui rendent votre analyse puissante et pertinente.
Le Jeu de Données Original doit être principalement utilisé pour :
- Référence et validation
- Audits de qualité des données
- Compréhension de la structure des données sources
Le Cycle d’Amélioration Continue
L’architecture à double jeu de données supporte un flux de travail itératif :
- Importer - Importez vos données pour créer le Jeu de Données Original
- Enrichir - Ajoutez des métriques de performance, règles de conformité, et attributs personnalisés
- Calculer - Exécutez le pipeline pour mettre à jour le Jeu de Données Enrichi
- Analyser - Créez des enquêtes et analyses utilisant les attributs enrichis
- Répéter - Ajoutez plus d’enrichissements au besoin pour approfondir vos insights
Chaque cycle rend votre Jeu de Données Enrichi plus précieux et votre analyse plus sophistiquée.
Points Clés à Retenir
- Deux jeux de données sont créés : Original (données brutes) et Enrichi (données améliorées)
- Création automatique : Le Jeu de Données Enrichi est créé automatiquement lors de l’importation des données
- Utilisez le Jeu de Données Enrichi : C’est votre jeu de données principal pour toute analyse et enquête
- Exécution du pipeline : Le pipeline de données transforme l’Original en Enrichi
- Amélioration continue : Chaque calcul d’enrichissement ajoute de nouveaux attributs au Jeu de Données Enrichi
- Analyse par défaut : mindzie Studio fournit automatiquement des analyses de démarrage utiles
- Processus itératif : Vous pouvez continuer à ajouter des enrichissements pour rendre votre analyse plus puissante