Informations sur le Jeu de Données
Présentation
Le calculateur d'Informations sur le Jeu de Données fournit un résumé statistique complet de l'ensemble de votre jeu de données de processus. Il affiche les principales métriques, notamment les plages temporelles, le nombre de cas et d'événements, les statistiques d'activités, ainsi que les informations sur la structure des données, dans une vue d'ensemble unique et facile à lire.
Ce calculateur ne nécessite aucune configuration et est idéal pour comprendre rapidement la portée et les caractéristiques de vos données de processus.
Usages Courants
- Comprendre la portée d'un nouveau jeu de données avant de commencer l'analyse
- Valider que l'extraction des données a capturé le volume et la plage temporelle attendus
- Comparer des jeux de données en examinant leurs profils statistiques côte à côte
- Suivre les tendances de volume de processus en suivant le nombre de cas et d'événements dans le temps
- Vérifier la qualité des données en contrôlant les plages de durée des cas et les distributions des événements
- Générer des métadonnées du jeu de données pour des rapports et présentations
Paramètres
Il n'y a pas de paramètres spécifiques pour ce calculateur au-delà des champs standard de titre et de description. Le calculateur analyse automatiquement l'ensemble du jeu de données et affiche toutes les métriques disponibles.
Exemples
Exemple 1 : Découverte Initiale du Processus
Scénario : Vous venez d'importer un nouveau jeu de données achat-à-paiement et souhaitez comprendre ses caractéristiques avant de commencer votre analyse.
Paramètres :
- Titre : "Présentation du Jeu de Données Achat-à-Paiement"
- Description : "Données d'approvisionnement T4 2024"
Résultat :
Le calculateur affiche un tableau complet avec les métriques suivantes :
- Heure de début du jeu de données : 2024-10-01 00:00:00
- Heure de fin du jeu de données : 2024-12-31 23:59:59
- Durée du jeu de données : 92 jours
- Durée minimale d'un cas : 2 heures
- Durée maximale d'un cas : 45 jours
- Durée moyenne d'un cas : 8,5 jours
- Durée médiane d'un cas : 6,2 jours
- Nombre total de cas : 1 847
- Nombre total d'activités : 14 776
- Moyenne des activités par cas : 8,0
- Activités : 23 activités uniques
- Colonnes de cas : 15 attributs
- Colonnes d'activités : 12 attributs
Analyse : Ce jeu de données couvre un trimestre complet avec près de 1 900 commandes. La durée moyenne des cas de 8,5 jours est raisonnable pour un processus d'approvisionnement, bien que certains cas durent jusqu'à 45 jours, ce qui suggère des retards potentiels à investiguer. Avec une moyenne de 8 activités par cas réparties sur 23 activités uniques, le processus présente une complexité modérée avec quelques variations dans les parcours d'exécution.
Exemple 2 : Comparaison des Données Filtrées vs Non Filtrées
Scénario : Vous souhaitez comprendre comment l'application d'un filtre temporel affecte les caractéristiques de votre jeu de données.
Paramètres :
- Créez deux calculateurs d'Informations sur le Jeu de Données :
- "Présentation du Jeu de Données Complet" (sans filtres)
- "Présentation des 30 Derniers Jours" (avec filtre de période temporelle)
Résultat :
Jeu de Données Complet :
- Nombre total de cas : 1 847
- Durée du jeu de données : 92 jours
- Durée moyenne d'un cas : 8,5 jours
30 Derniers Jours :
- Nombre total de cas : 623
- Durée du jeu de données : 30 jours
- Durée moyenne d'un cas : 9,2 jours
Analyse : La vue filtrée montre qu'environ un tiers des cas se situe dans le mois le plus récent. Fait intéressant, la durée moyenne des cas est passée de 8,5 à 9,2 jours sur la période récente, ce qui suggère une possible dégradation de la performance du processus et mérite une enquête plus approfondie.
Exemple 3 : Validation de la Qualité des Données
Scénario : Après avoir complété une extraction de données, vous devez vérifier que toutes les données attendues ont été correctement capturées.
Paramètres :
- Titre : "Contrôle de Qualité des Données"
- Description : "Validation de l'extraction de janvier 2025"
Résultat :
- Heure de début du jeu de données : 2025-01-01 00:00:00
- Heure de fin du jeu de données : 2025-01-31 23:59:59
- Nombre total de cas : 412
- Nombre total d'activités : 3 296
- Activités : 18 activités uniques
Analyse : Le jeu de données couvre correctement tout le mois de janvier 2025 comme attendu. Le nombre de cas de 412 correspond au volume mensuel prévu. Les 18 activités standards sont toutes présentes dans les données, ce qui confirme que l'extraction a bien capturé tous les types d'activité. La moyenne de 8 activités par cas est cohérente avec les schémas historiques.
Exemple 4 : Documentation de la Base de Référence de Performance
Scénario : Vous devez documenter les métriques de base de votre processus avant de mettre en œuvre des initiatives d'amélioration.
Paramètres :
- Titre : "Métriques de Référence Avant Amélioration"
- Description : "Base de référence du traitement des factures - janvier 2025"
Résultat :
- Nombre total de cas : 2 156
- Durée moyenne d'un cas : 12,3 jours
- Durée médiane d'un cas : 9,5 jours
- Durée minimale d'un cas : 4 heures
- Durée maximale d'un cas : 67 jours
- Moyenne des activités par cas : 11,2
Analyse : Le traitement actuel des factures dure en moyenne 12,3 jours avec une variation significative (de 4 heures à 67 jours). L'écart entre la moyenne (12,3 jours) et la médiane (9,5 jours) suggère qu'un sous-ensemble de factures avec des temps de traitement très longs tire la moyenne vers le haut. Ces métriques établissent une base claire pour mesurer les améliorations après mise en œuvre des changements du processus.
Résultat
Le calculateur d'Informations sur le Jeu de Données affiche un tableau unique avec deux colonnes :
Nom : Le nom de chaque métrique
Valeur : La valeur correspondante à cette métrique
Métriques Incluses
Métriques Temporelles :
- Heure de début du jeu de données : L'horodatage de l'événement le plus ancien du jeu de données
- Heure de fin du jeu de données : L'horodatage de l'événement le plus récent du jeu de données
- Durée du jeu de données : La période totale couverte par le jeu de données
Métriques de Durée des Cas :
- Durée minimale d'un cas : La durée la plus courte d'un cas dans le jeu de données
- Durée maximale d'un cas : La durée la plus longue d'un cas dans le jeu de données
- Durée moyenne d'un cas : La durée moyenne de tous les cas
- Durée médiane d'un cas : La durée médiane (valeur centrale) des cas
Métriques de Volume :
- Nombre total de cas : Le nombre de cas uniques dans le jeu de données
- Nombre total d'activités : Le nombre total d'événements dans tous les cas
- Moyenne des activités par cas : Le nombre moyen d'événements par cas
Métriques de Structure :
- Activités : Le nombre de types d'activités uniques dans le processus
- Colonnes de cas : Le nombre d'attributs au niveau du cas
- Colonnes d'activités : Le nombre d'attributs au niveau de l'événement
Toutes les valeurs temporelles sont affichées dans un format lisible (par exemple, "8,5 jours" ou "2 heures 30 minutes"). Le résultat peut être ajouté aux tableaux de bord pour un suivi continu ou exporté pour la documentation.
Cette documentation fait partie de la plateforme de process mining mindzie Studio.