Téléversement et Configuration des Sources de Données

Aperçu

Ce guide vous accompagne dans le processus de téléversement de données CSV dans mindzie Studio et de configuration des colonnes clés pour l’analyse de process mining. La correspondance correcte de vos colonnes de données est essentielle pour que mindzie analyse efficacement vos processus métier.

Prérequis

Avant de téléverser des données, assurez-vous de disposer de :

  • Un fichier CSV contenant les données de votre journal d’événements de processus
  • Au minimum, les colonnes suivantes dans vos données :
    • Case ID : Un identifiant unique pour chaque instance de processus
    • Activity : Le nom de chaque étape ou activité du processus
    • Timestamp : Date et heure auxquelles chaque activité a eu lieu
    • Resource (recommandé) : La personne ou le système ayant réalisé l’activité

Choisir votre méthode d’importation de données

mindzie propose deux méthodes principales pour importer des données dans vos projets :

Téléversement CSV

Idéal pour :

  • Analyse de données ponctuelle
  • Projets de test et de preuve de concept
  • Jeux de données plus petits
  • Scénarios de mise à jour manuelle des données

mindzie Data Designer

Idéal pour :

  • Surveillance continue et mises à jour programmées
  • Connexion directe aux bases de données ou entrepôts de données
  • Transformations ETL complexes
  • Déploiements en production avec actualisation automatisée des données

Ce guide se concentre sur la méthode de téléversement CSV, qui est la façon la plus rapide de démarrer avec mindzie Studio.

Étape par étape : Téléversement d’un fichier CSV

Étape 1 : Accéder à la section Datasets

Lorsque vous entrez pour la première fois dans votre projet mindzie Studio, vous êtes dirigé automatiquement vers la section Datasets. Si vous n’y êtes pas déjà :

  1. Cliquez sur l’onglet Datasets dans la barre de navigation supérieure
  2. Vous verrez l’écran "Bienvenue dans mindzieStudio" avec plusieurs options

Écran d’accueil Datasets

Étape 2 : Sélectionner Téléversement CSV

Sur l’écran Datasets, cliquez sur le bouton Upload CSV en haut à droite de l’interface. Cela ouvrira une boîte de dialogue de sélection de fichiers.

Dialogue de sélection de fichier CSV

Étape 3 : Sélectionner votre fichier CSV

  1. Naviguez jusqu’à l’emplacement de votre fichier CSV sur votre ordinateur
  2. Sélectionnez le fichier (par exemple, banking_onboarding_enhanced_event_log.csv)
  3. Cliquez sur Open pour commencer le téléversement

Le système affichera un indicateur de chargement montrant la progression du téléversement.

Progression du chargement des données

Étape 4 : Valider et configurer les paramètres de données

Après le téléversement, mindzie Studio affichera un aperçu de vos données et vous permettra de configurer les paramètres :

Paramètres d’encodage

  • Le système détectera automatiquement l’encodage du fichier
  • Si vos données contiennent des caractères spéciaux, vous pourriez avoir besoin d’ajuster ce paramètre

Aperçu des données

  • Vérifiez que l’aperçu montre bien les données chargées correctement
  • Contrôlez que les colonnes sont correctement séparées
  • Assurez-vous que les horodatages et autres valeurs s’affichent comme prévu

Une fois la vérification terminée, cliquez sur Next pour passer au mappage des colonnes.

Configuration des colonnes clés

L’écran de mappage des colonnes est l’endroit où vous indiquez à mindzie Studio quelles colonnes de votre CSV correspondent aux champs clés du process mining.

Interface de mappage des colonnes

Comprendre les icônes des colonnes clés

mindzie Studio utilise des icônes visuelles pour vous aider à identifier et mapper les colonnes clés :

  • Case ID : icône violette - Identifie les instances uniques de processus
  • Activity : icône jaune - Contient les noms des étapes du processus
  • Activity Time : icône orange - Horodatage du moment où chaque activité a eu lieu
  • Resource : icône bleue - Personne ou système réalisant l’activité

Étape 5 : Mapper vos colonnes par glisser-déposer

mindzie Studio détecte automatiquement et suggère les correspondances pour les noms de colonnes courants. Pour mapper ou modifier les affectations :

  1. Détection automatique : le système détecte généralement automatiquement les colonnes standard comme Case ID, Activity et Timestamp
  2. Glisser-déposer : pour affecter une colonne manuellement, faites-la glisser depuis la section inférieure vers une des cases des colonnes clés en haut
  3. Affectation de la ressource : si vous avez une colonne resource (recommandé), faites-la glisser vers le champ Resource

Dans l’exemple montré :

  • Case ID est mappé sur la colonne Case ID
  • Activity est mappé sur la colonne Activity
  • Timestamp est mappé sur la colonne DateTime
  • Resource Name est mappé sur la colonne Resource Name

Étape 6 : Configurer les paramètres supplémentaires des colonnes

Pour chaque colonne de votre jeu de données, vous pouvez :

Changer le type de colonne

  • Cliquez sur une colonne pour modifier son type
  • Options disponibles : chaîne de caractères, nombre, date, booléen, etc.

Modifier les types de données

  • Ajustez la façon dont mindzie interprète les données
  • Assurez-vous que les dates sont reconnues comme des horodatages
  • Confirmez que les valeurs numériques sont correctement typées

Anonymiser les données sensibles

  • Activez l’anonymisation pour les colonnes contenant des données sensibles
  • Utile pour respecter les réglementations sur la confidentialité des données
  • Les noms, ID clients et autres informations personnelles peuvent être masqués

Colonnes optionnelles La section « Optionnel » à droite de l’écran permet de mapper des attributs supplémentaires pour le process mining :

  • Resource Role : poste ou rôle de la ressource
  • Cost : coûts associés à chaque activité
  • Channel : canal du processus (ex. Agence, Mobile, En ligne)
  • Compliance Flags : indicateurs de conformité ou respect des règles
  • Country/Region : attributs géographiques

Étape 7 : Traiter et enregistrer le jeu de données

Une fois le mappage terminé :

  1. Vérifiez toutes les correspondances pour en assurer la précision
  2. Cliquez sur Next pour lancer le traitement

mindzie Studio va maintenant :

  • Transformer vos données CSV au format journal d’événements mindzie
  • Valider la qualité et la structure des données
  • Créer le jeu de données de base pour l’analyse

Traitement du jeu de données

Cette étape de traitement peut prendre quelques instants selon la taille du jeu de données. Vous verrez une boîte de dialogue "Travail en cours ! Traitement du jeu de données" pendant ce temps.

Étape 8 : Confirmer la réussite de l’importation des données

Une fois le traitement terminé, mindzie Studio affichera un dialogue de confirmation indiquant :

  • Le nom du jeu de données
  • Le nombre total de cas (instances de processus)
  • Le nombre total d’événements (activités)

Confirmation d’enregistrement du jeu de données

Dans l’exemple présenté, le jeu de données contient :

  • 10 000 cas (instances uniques d’onboarding client)
  • 121 000 événements (activités totales pour tous les cas)

Cliquez sur Save pour finaliser l’import.

Que se passe-t-il après le téléversement des données

Une fois que vous avez enregistré votre jeu de données, mindzie Studio exécute automatiquement :

  1. Création de deux jeux de données :

    • Jeu de données original : votre journal d’événements brut tel que téléversé
    • Jeu de données enrichi : version améliorée créée par le pipeline mindzie (utilisée pour toutes les analyses)
  2. Construction d’un pipeline de données : prépare vos données pour l’enrichissement avec métriques de performance, règles de conformité et autres améliorations

  3. Génération d’analyses par défaut : création d’analyses de démarrage incluant :

    • Vue d’ensemble du processus
    • Analyse des cas à longue durée
    • Durée entre les étapes principales du processus
    • Autres insights fondamentaux

Ces analyses par défaut vous donnent un point de départ pour comprendre votre processus et peuvent être personnalisées ou supprimées selon vos besoins.

Comprendre la transformation des données

Pendant la phase de téléversement et de traitement, mindzie Studio :

  • Standardise le format des données : convertit votre CSV au format optimisé de journal d’événements mindzie
  • Valide la qualité des données : vérifie les champs obligatoires manquants, les horodatages invalides et les incohérences dans les données
  • Prépare à l’enrichissement : structure les données pour pouvoir être améliorées avec des attributs calculés, des métriques de performance et des règles de conformité

Le processus de transformation garantit que vos données sont prêtes pour une analyse puissante et une visualisation du process mining.

Conseils pour un téléversement réussi

Nomination des colonnes

  • Utilisez des noms de colonnes clairs et cohérents dans votre CSV
  • Des noms courants comme "CaseID", "Activity", "Timestamp" sont détectés automatiquement
  • Évitez les caractères spéciaux dans les noms de colonnes

Qualité des données

  • Assurez-vous que chaque ligne a un Case ID, une Activity et un Timestamp
  • Les horodatages doivent suivre un format cohérent (ISO 8601 recommandé)
  • Supprimez ou corrigez les en-têtes dupliqués ou les lignes malformées

Considérations sur la taille du fichier

  • Le téléversement CSV fonctionne bien pour des jeux de données jusqu’à plusieurs millions d’événements
  • Pour des jeux très volumineux ou une surveillance continue, préférez mindzie Data Designer
  • Testez d’abord avec un échantillon de vos données pour vérifier le mappage des colonnes

Colonnes Resource et optionnelles

  • Bien que seules les colonnes Case ID, Activity et Timestamp soient requises, ajouter des informations Resource permet une analyse plus approfondie
  • Des colonnes supplémentaires comme Cost, Channel et Region permettent des segmentations et insights plus riches
  • Vous pouvez toujours ajouter d’autres colonnes optionnelles plus tard via l’enrichissement des données

Prochaines étapes

Après avoir téléversé et configuré avec succès votre source de données :

  1. Vérifiez les jeux de données générés : consultez les jeux original et enrichi dans la section Datasets
  2. Explorez les analyses par défaut : allez dans Investigations pour voir les insights générés automatiquement
  3. Planifiez la structure de vos tableaux de bord : décidez des tableaux de bord et métriques à créer pour vos utilisateurs
  4. Améliorez vos données : utilisez le Log Enrichment Engine pour ajouter des métriques de performance, des règles de conformité et des attributs personnalisés

Vos données sont désormais prêtes à être transformées en intelligence processuelle exploitable !

Sujets connexes

  • Comprendre l’architecture duale des jeux de données mindzie : Découvrez les différences entre jeux originaux et enrichis
  • Maîtriser le Log Enrichment Engine : Ajoutez des métriques de performance et des règles de conformité pour enrichir vos données
  • Utiliser mindzie Data Designer : Connectez-vous à des sources de données en direct pour une actualisation automatique des données
  • Créer votre première analyse : Construisez des métriques et KPIs à partir de vos données téléversées