Sélecteur de Données
Vue d'ensemble
Le calculateur Sélecteur de Données est un outil de post-traitement des données qui sélectionne des colonnes spécifiques à partir de la sortie d’un autre calculateur et qui, en option, trie et limite les résultats. Ce calculateur est essentiel pour créer des vues de données ciblées en choisissant les colonnes pertinentes, en ordonnant les données et en affichant uniquement les N premières lignes.
Contrairement à la plupart des calculateurs qui analysent directement les données de processus, le Sélecteur de Données travaille avec les tableaux de sortie d’autres calculateurs, ce qui le rend idéal pour affiner les résultats d’analyse pour les tableaux de bord, rapports et exports.
Usages courants
- Préparer des sous-ensembles de données spécifiques pour la livraison par email ou l’export aux parties prenantes
- Créer des vues simplifiées de tableau de bord montrant uniquement les indicateurs clés issus d’analyses complexes
- Sélectionner et trier les N meilleurs résultats à partir de grandes sorties d’analyse (ex. : les 10 cas les plus lents)
- Focaliser les rapports sur des colonnes pertinentes en supprimant les détails superflus
- Transformer des résultats d’analyse exhaustifs en synthèses accessibles aux cadres
- Créer des pipelines de données en enchaînant plusieurs calculateurs et en sélectionnant des sorties spécifiques à chaque étape
Paramètres
Calculateur Source : Sélectionnez le bloc calculateur dont la sortie doit être utilisée. Ce calculateur doit avoir déjà été exécuté dans le carnet actuel.
Table Source : Choisissez la table à utiliser si le calculateur source produit plusieurs tableaux de résultats. La plupart des calculateurs produisent un tableau unique (index 0), mais certains retournent plusieurs tableaux avec différents types d’informations.
Colonnes à Inclure : Sélectionnez les colonnes du tableau source qui doivent apparaître dans la sortie. Vous pouvez sélectionner plusieurs colonnes, et elles apparaîtront dans l’ordre que vous spécifiez. Les noms des colonnes doivent correspondre exactement à ceux présents dans la sortie du calculateur source.
Colonne de Tri : Optionnellement, choisissez une colonne pour trier les résultats. Si vous ne spécifiez pas de colonne de tri, les données conserveront le même ordre que la sortie du calculateur source.
Direction du Tri : Lorsque le tri est activé, choisissez si vous souhaitez trier en :
- Ordre croissant : du plus bas au plus élevé (A-Z, 0-9, du plus ancien au plus récent)
- Ordre décroissant : du plus élevé au plus bas (Z-A, 9-0, du plus récent au plus ancien)
Nombre maximal de lignes : Spécifiez le nombre maximal de lignes à inclure dans la sortie. Mettez à 0 ou laissez vide pour aucune limite. Combiné au tri, cela permet de sélectionner les “N premiers” résultats (ex. : les 20 cas les plus longs triés par durée décroissante).
Exemples
Exemple 1 : Top 10 des bons de commande les plus lents pour rapport exécutif
Scénario : Votre calculateur Durée des Cas a analysé 2 500 bons de commande, mais vous souhaitez créer un tableau de bord exécutif montrant uniquement les 10 cas les plus lents pour une attention immédiate.
Paramètres :
- Calculateur Source : "Purchase Order Duration Analysis"
- Table Source : 0 (table principale des résultats)
- Colonnes à Inclure : ["Case ID", "Supplier Name", "Duration", "Total Value"]
- Colonne de Tri : Duration
- Direction du Tri : Descending
- Nombre maximal de lignes : 10
Sortie :
Le calculateur affiche un tableau ciblé avec exactement 4 colonnes et 10 lignes :
| Case ID | Supplier Name | Duration | Total Value |
|---|---|---|---|
| PO-2024-8821 | Acme Manufacturing | 47.3 jours | 125 400 $ |
| PO-2024-9156 | Global Supplies Inc | 42.8 jours | 89 200 $ |
| PO-2024-7633 | TechParts Ltd | 38.5 jours | 156 800 $ |
| ... | ... | ... | ... |
Remarques : En sélectionnant uniquement les colonnes essentielles et en limitant à 10 lignes, vous avez créé un tableau de bord exploitable qui met en lumière les cas problématiques sans submerger les cadres avec 2 500 lignes de données. Le tri par durée garantit que les cas les plus urgents apparaissent en premier. L’inclusion de la valeur totale montre l’impact financier de ces retards.
Exemple 2 : Résumé hebdomadaire d’activité pour distribution par email
Scénario : Vous exécutez une analyse de fréquence hebdomadaire qui génère des statistiques détaillées pour 45 activités différentes. Vous souhaitez envoyer par email au responsable de processus uniquement les 15 activités les plus fréquentes avec des métriques simplifiées.
Paramètres :
- Calculateur Source : "Weekly Activity Frequency Report"
- Table Source : 0
- Colonnes à Inclure : ["Activity Name", "Event Count", "Percentage of Total Events"]
- Colonne de Tri : Event Count
- Direction du Tri : Descending
- Nombre maximal de lignes : 15
Sortie :
Un tableau propre et ciblé parfait pour un email :
| Activity Name | Event Count | Percentage of Total Events |
|---|---|---|
| Create Purchase Requisition | 1 847 | 18,2 % |
| Manager Approval | 1 823 | 17,9 % |
| Vendor Selection | 1 792 | 17,6 % |
| ... | ... | ... |
Remarques : Cette vue simplifiée supprime des colonnes comme "First Occurrence" et "Last Occurrence" qui encombrent l’email, tout en conservant les métriques essentielles qui montrent quelles activités dominent le processus. Le destinataire voit immédiatement que les 3 premières activités représentent plus de la moitié de tous les événements du processus.
Exemple 3 : Simplification du tableau de bord d’analyse client
Scénario : Votre calculateur Analyse par Catégories a analysé les clients selon 12 critères différents, mais votre widget de tableau de bord n’a de la place que pour 5 colonnes montrant les 20 meilleurs clients.
Paramètres :
- Calculateur Source : "Customer Performance Analysis"
- Table Source : 0
- Colonnes à Inclure : ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
- Colonne de Tri : Total Revenue
- Direction du Tri : Descending
- Nombre maximal de lignes : 20
Sortie :
Tableau prêt pour le tableau de bord avec métriques ciblées :
| Customer Name | Case Count | Average Duration | Total Revenue | On-Time Percentage |
|---|---|---|---|---|
| MegaCorp Industries | 487 | 8,2 jours | 4 850 000 $ | 92 % |
| TechStart Solutions | 356 | 7,5 jours | 3 240 000 $ | 95 % |
| Global Systems Inc | 298 | 9,1 jours | 2 870 000 $ | 88 % |
| ... | ... | ... | ... | ... |
Remarques : Vous avez transformé une analyse complète de 12 colonnes en une vue à 5 colonnes adaptée au tableau de bord, montrant exactement ce que les parties prenantes doivent savoir : quels clients génèrent le plus de revenus, combien de commandes ils passent, la durée moyenne de traitement et leur performance de livraison. Le tri par revenu met en avant les clients les plus importants en un coup d’œil.
Exemple 4 : Analyse des variantes - Top variantes par fréquence
Scénario : Votre analyse des variantes a identifié 284 variantes de processus uniques. Vous souhaitez concentrer vos efforts d’amélioration sur les 25 variantes les plus courantes, qui représentent typiquement 80 % de votre volume de cas.
Paramètres :
- Calculateur Source : "Process Variant Analysis"
- Table Source : 0
- Colonnes à Inclure : ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
- Colonne de Tri : Frequency
- Direction du Tri : Descending
- Nombre maximal de lignes : 25
Sortie :
| Variant ID | Frequency | Cumulative Percentage | Average Duration | Contains Rework |
|---|---|---|---|---|
| VAR-001 | 1 245 | 24,8 % | 6,2 jours | Non |
| VAR-002 | 876 | 42,2 % | 8,5 jours | Oui |
| VAR-003 | 623 | 54,6 % | 5,8 jours | Non |
| ... | ... | ... | ... | ... |
Remarques : Les 25 principales variantes représentent le cœur de votre processus, et la colonne de pourcentage cumulé montre qu’en se focalisant sur ces variantes, on couvre la majorité des cas. La colonne "Contains Rework" indique immédiatement quelles variantes communes incluent des étapes de retouches inefficaces, aidant à prioriser les opportunités d’amélioration.
Exemple 5 : Analyse par plage de dates pour tendances
Scénario : Votre calculateur taux dans le temps a généré des statistiques journalières sur 90 jours, mais vous souhaitez afficher uniquement les métriques clés en ordre chronologique sans limite de lignes pour une analyse complète des tendances.
Paramètres :
- Calculateur Source : "90-Day Completion Rate Analysis"
- Table Source : 0
- Colonnes à Inclure : ["Date", "Cases Completed", "Completion Rate"]
- Colonne de Tri : Date
- Direction du Tri : Ascending
- Nombre maximal de lignes : 0 (sans limite)
Sortie :
Les 90 lignes affichées en ordre chronologique :
| Date | Cases Completed | Completion Rate |
|---|---|---|
| 2024-10-01 | 23 | 87,4 % |
| 2024-10-02 | 28 | 91,2 % |
| 2024-10-03 | 31 | 89,7 % |
| ... | ... | ... |
Remarques : En triant par date croissante et sans limitation de lignes, vous conservez la série temporelle complète pour le graphique ou l’export. Vous avez simplifié la sortie en retirant des colonnes statistiques (comme "Standard Deviation" et "Min/Max") qui ne sont pas nécessaires pour une simple visualisation des tendances, rendant les données plus propres pour les outils graphiques.
Exemple 6 : Sélection multi-table source
Scénario : Votre vérificateur de conformité retourne deux tableaux : le tableau 0 contient les statistiques synthétiques, et le tableau 1 contient les listes détaillées des violations. Vous souhaitez créer un rapport à partir du tableau des violations détaillées.
Paramètres :
- Calculateur Source : "Standard Process Conformance Check"
- Table Source : 1 (tableau détail, pas le résumé)
- Colonnes à Inclure : ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
- Colonne de Tri : Violation Type
- Direction du Tri : Ascending
- Nombre maximal de lignes : 100
Sortie :
| Case ID | Violation Type | Activity Name | Timestamp |
|---|---|---|---|
| CS-1234 | Missing Required Step | Invoice Approval | 2024-11-15 14:22 |
| CS-5678 | Missing Required Step | Purchase Approval | 2024-11-16 09:15 |
| CS-9012 | Out of Sequence | Goods Receipt | 2024-11-16 11:45 |
| ... | ... | ... | ... |
Remarques : En sélectionnant le tableau 1 au lieu du tableau 0 par défaut, vous accédez aux données détaillées des violations plutôt qu’aux simples totaux. Le tri par type de violation regroupe les problèmes similaires, facilitant la détection de motifs. La limite de 100 lignes assure que le rapport reste gérable tout en couvrant les violations les plus importantes.
Sortie
Le calculateur Sélecteur de Données affiche un tableau avec exactement les colonnes que vous avez spécifiées, dans l’ordre que vous avez sélectionné. La structure du tableau est dynamique et dépend de vos sélections de colonnes.
Caractéristiques de la sortie
Structure des colonnes : Seules les colonnes sélectionnées dans "Colonnes à Inclure" apparaissent dans la sortie. Les noms de colonnes, types de données et formats sont préservés depuis le calculateur source.
Nombre de lignes : Déterminé par le paramètre Nombre maximal de lignes :
- Si Nombre maximal de lignes = 0 ou vide : Toutes les lignes du tableau source
- Si Nombre maximal de lignes > 0 : Jusqu’à ce nombre de lignes (peut être inférieur si le tableau source contient moins de lignes)
Ordre des lignes : Déterminé par les paramètres de tri :
- Si aucune colonne de tri spécifiée : Maintient le même ordre que le calculateur source
- Si colonne de tri spécifiée : Les lignes sont ordonnées selon la colonne et la direction de tri
Fonctionnalités interactives
Cliquez sur les lignes : Dans de nombreux cas, cliquer sur une ligne permet d’accéder aux cas ou détails sous-jacents, comme dans le calculateur source.
Capacités d’export : La sortie affinée peut être exportée vers des fichiers Excel ou CSV, ce qui est idéal pour le partage avec des parties prenantes n’ayant pas accès à la plateforme mindzie.
Intégration email : La sortie de ce calculateur est souvent utilisée avec un envoi automatisé d’emails pour envoyer des sous-ensembles de données ciblées aux responsables de processus et cadres de manière planifiée.
Widgets de tableau de bord : La sortie simplifiée et ciblée est parfaite pour être intégrée dans les widgets de tableau de bord où l’espace est limité.
Conseils d’utilisation
- Assurez-vous toujours que le calculateur source a été exécuté avec succès avant d’exécuter le Sélecteur de Données
- Utilisez la fonction d’aperçu dans la configuration du calculateur pour voir les colonnes disponibles à partir de votre source
- Les noms de colonnes sont sensibles à la casse - ils doivent correspondre exactement à ceux du source
- Lors de la combinaison tri et limitation des lignes, le tri est appliqué en premier, puis la limite de lignes (permettant les sélections “top N”)
- Si le calculateur source n’a aucun résultat ou une erreur, le Sélecteur de Données produira un tableau vide
- Plusieurs calculateurs Sélecteur de Données peuvent être utilisés en cascade pour affiner les données progressivement
Schémas courants
Schéma Tableau de bord : Calculateur complexe -> Sélecteur de Données (sélection colonnes clés, N premières lignes) -> Widget tableau de bord
Schéma Email : Calculateur d’analyse -> Sélecteur de Données (ciblage sur données exploitables) -> Envoi d’email automatisé
Schéma Export : Analyse complète -> Sélecteur de Données (simplification pour parties externes) -> Export Excel
Schéma Pipeline : Calculateur A -> Sélecteur de Données 1 (affinage) -> Calculateur B (analyse complémentaire) -> Sélecteur de Données 2 (sortie finale)
Le Sélecteur de Données est particulièrement utile lorsque vous devez présenter les résultats d’analyse à des parties prenantes qui ont besoin d’informations ciblées et exploitables plutôt que de détails analytiques exhaustifs. Il comble le fossé entre une analyse détaillée de process mining et un reporting clair, prêt à la prise de décision.
Cette documentation fait partie de la plateforme de process mining mindzie Studio.