Sélecteur de Données

Vue d'ensemble

Le calculateur Sélecteur de Données est un outil de post-traitement des données qui sélectionne des colonnes spécifiques à partir de la sortie d’un autre calculateur et qui trie et limite éventuellement les résultats. Ce calculateur est essentiel pour créer des vues de données ciblées en choisissant les colonnes pertinentes, en ordonnant les données et en affichant uniquement les N premières lignes.

Contrairement à la plupart des calculateurs qui analysent directement les données de processus, le Sélecteur de Données travaille avec les tableaux de sortie d’autres calculateurs, ce qui le rend idéal pour affiner les résultats d’analyse destinés aux tableaux de bord, rapports et exportations.

Usages courants

Préparer des sous-ensembles spécifiques de données pour un envoi par e-mail ou une exportation aux parties prenantes
Créer des vues simplifiées de tableau de bord montrant uniquement les indicateurs clés d’une analyse complexe
Sélectionner et trier les N meilleurs résultats dans de grandes sorties d’analyse (ex. : les 10 cas les plus lents)
Focaliser les rapports sur les colonnes pertinentes en supprimant les détails inutiles
Transformer des résultats complets d’analyse en résumés faciles à comprendre pour les cadres
Créer des pipelines de données en enchaînant plusieurs calculateurs et en sélectionnant des sorties spécifiques à chaque étape

Paramètres

Source Calculator : Sélectionnez le bloc calculateur dont vous souhaitez utiliser la sortie. Ce calculateur doit déjà avoir été exécuté dans le carnet actuel.

Source Table : Choisissez quelle table utiliser si le calculateur source produit plusieurs tables de résultats. La plupart des calculateurs produisent une table unique (index 0), mais certains renvoient plusieurs tables avec différents types d’informations.

Columns to Include : Sélectionnez les colonnes de la table source à afficher dans la sortie. Vous pouvez sélectionner plusieurs colonnes, qui apparaîtront dans l’ordre que vous spécifiez. Les noms de colonnes doivent correspondre exactement à ceux apparaissant dans la sortie du calculateur source.

Sort Column : Choisissez facultativement une colonne pour trier les résultats. Si vous ne spécifiez pas de colonne de tri, les données conserveront l’ordre de la sortie du calculateur source.

Sort Direction : Lorsque le tri est activé, choisissez de trier par :

Ordre croissant : Du plus petit au plus grand (A-Z, 0-9, du plus ancien au plus récent)
Ordre décroissant : Du plus grand au plus petit (Z-A, 9-0, du plus récent au plus ancien)

Maximum Rows : Indiquez le nombre maximal de lignes à inclure dans la sortie. Mettez 0 ou laissez vide pour aucune limite. Combiné avec le tri, cela permet de sélectionner les « top N » résultats (ex. : 20 cas les plus lents triés par durée décroissante).

Exemples

Exemple 1 : Top 10 des commandes d’achat les plus lentes pour un rapport exécutif

Scénario : Votre calculateur Case Duration a analysé 2 500 commandes d’achat, mais vous souhaitez créer un tableau de bord exécutif affichant uniquement les 10 cas les plus lents pour une attention immédiate.

Paramètres :

Source Calculator : « Purchase Order Duration Analysis »
Source Table : 0 (table principale des résultats)
Columns to Include : ["Case ID", "Supplier Name", "Duration", "Total Value"]
Sort Column : Duration
Sort Direction : Descending
Maximum Rows : 10

Sortie :

Le calculateur affiche un tableau ciblé avec exactement 4 colonnes et 10 lignes :

Case ID	Supplier Name	Duration	Total Value
PO-2024-8821	Acme Manufacturing	47.3 jours	$125,400
PO-2024-9156	Global Supplies Inc	42.8 jours	$89,200
PO-2024-7633	TechParts Ltd	38.5 jours	$156,800
...	...	...	...

Conclusions : En sélectionnant uniquement les colonnes essentielles et en limitant à 10 lignes, vous avez créé un tableau de bord opérationnel qui met en avant les cas problématiques sans submerger les cadres avec 2 500 lignes. Le tri par durée garantit que les cas les plus urgents apparaissent en premier. La colonne Total Value montre l’impact financier de ces retards.

Exemple 2 : Résumé hebdomadaire d’activité pour distribution par e-mail

Scénario : Vous exécutez une analyse hebdomadaire de la fréquence des activités qui génère des statistiques détaillées pour 45 activités différentes. Vous voulez envoyer par e-mail au responsable du processus uniquement les 15 activités les plus fréquentes avec des métriques simplifiées.

Paramètres :

Source Calculator : « Weekly Activity Frequency Report »
Source Table : 0
Columns to Include : ["Activity Name", "Event Count", "Percentage of Total Events"]
Sort Column : Event Count
Sort Direction : Descending
Maximum Rows : 15

Sortie :

Un tableau net et ciblé parfait pour un e-mail :

Activity Name	Event Count	Percentage of Total Events
Create Purchase Requisition	1 847	18.2%
Manager Approval	1 823	17.9%
Vendor Selection	1 792	17.6%
...	...	...

Conclusions : Cette vue simplifiée retire les colonnes comme « First Occurrence » et « Last Occurrence » qui encombrent l’e-mail, tout en conservant les métriques essentielles montrant quelles activités dominent le processus. Le destinataire voit immédiatement que les 3 premières activités représentent plus de la moitié des événements du processus.

Exemple 3 : Simplification du tableau de bord d’analyse client

Scénario : Votre calculateur Breakdown by Categories a analysé les clients selon 12 métriques différentes, mais votre widget de tableau de bord dispose seulement de la place pour 5 colonnes pour les 20 meilleurs clients.

Paramètres :

Source Calculator : « Customer Performance Analysis »
Source Table : 0
Columns to Include : ["Customer Name", "Case Count", "Average Duration", "Total Revenue", "On-Time Percentage"]
Sort Column : Total Revenue
Sort Direction : Descending
Maximum Rows : 20

Sortie :

Tableau prêt pour tableau de bord avec métriques ciblées :

Customer Name	Case Count	Average Duration	Total Revenue	On-Time Percentage
MegaCorp Industries	487	8.2 jours	$4,850,000	92%
TechStart Solutions	356	7.5 jours	$3,240,000	95%
Global Systems Inc	298	9.1 jours	$2,870,000	88%
...	...	...	...	...

Conclusions : Vous avez transformé une analyse complète de 12 colonnes en une vue de 5 colonnes adaptée au tableau de bord, montrant exactement ce que les parties prenantes doivent savoir : quels clients génèrent le plus de revenus, combien de commandes ils passent, la durée moyenne de traitement, et leur performance de livraison. Le tri par revenu assure que les clients les plus importants sont visibles en un coup d’œil.

Exemple 4 : Analyse de variantes – Top variantes par fréquence

Scénario : Votre analyse de variantes a identifié 284 variantes uniques de processus. Vous souhaitez concentrer vos efforts d’amélioration sur les 25 variantes les plus fréquentes, qui représentent généralement 80 % du volume de cas.

Paramètres :

Source Calculator : « Process Variant Analysis »
Source Table : 0
Columns to Include : ["Variant ID", "Frequency", "Cumulative Percentage", "Average Duration", "Contains Rework"]
Sort Column : Frequency
Sort Direction : Descending
Maximum Rows : 25

Sortie :

Variant ID	Frequency	Cumulative Percentage	Average Duration	Contains Rework
VAR-001	1 245	24.8%	6.2 jours	Non
VAR-002	876	42.2%	8.5 jours	Oui
VAR-003	623	54.6%	5.8 jours	Non
...	...	...	...	...

Conclusions : Les 25 variantes principales représentent le cœur de votre processus, et la colonne de pourcentage cumulé montre que se concentrer sur ces variantes couvre la majorité des cas. La colonne « Contains Rework » signale immédiatement quelles variantes communes incluent des étapes de retouche inefficaces, aidant à prioriser les opportunités d’amélioration.

Exemple 5 : Analyse de plage de dates pour tendances

Scénario : Votre calculateur rate-over-time a généré des statistiques quotidiennes sur 90 jours, mais vous souhaitez afficher uniquement les métriques clés dans l’ordre chronologique sans limite de lignes pour une analyse des tendances complète.

Paramètres :

Source Calculator : « 90-Day Completion Rate Analysis »
Source Table : 0
Columns to Include : ["Date", "Cases Completed", "Completion Rate"]
Sort Column : Date
Sort Direction : Ascending
Maximum Rows : 0 (aucune limite)

Sortie :

Les 90 lignes affichées dans l’ordre chronologique :

Date	Cases Completed	Completion Rate
2024-10-01	23	87.4%
2024-10-02	28	91.2%
2024-10-03	31	89.7%
...	...	...

Conclusions : En triant par date croissante et sans limiter les lignes, vous conservez la série temporelle complète pour les graphiques ou exportations. Vous avez simplifié la sortie en retirant les colonnes statistiques (comme « Standard Deviation » et « Min/Max ») non nécessaires à la visualisation basique des tendances, rendant les données plus claires pour les outils graphiques.

Exemple 6 : Sélection de source multi-tables

Scénario : Votre vérificateur de conformité retourne deux tables : la table 0 contient des statistiques résumées, et la table 1 liste en détail les violations. Vous souhaitez créer un rapport à partir de la table détaillée des violations.

Paramètres :

Source Calculator : « Standard Process Conformance Check »
Source Table : 1 (table de détail, pas le résumé)
Columns to Include : ["Case ID", "Violation Type", "Activity Name", "Timestamp"]
Sort Column : Violation Type
Sort Direction : Ascending
Maximum Rows : 100

Sortie :

Case ID	Violation Type	Activity Name	Timestamp
CS-1234	Missing Required Step	Invoice Approval	2024-11-15 14:22
CS-5678	Missing Required Step	Purchase Approval	2024-11-16 09:15
CS-9012	Out of Sequence	Goods Receipt	2024-11-16 11:45
...	...	...	...

Conclusions : En sélectionnant la table 1 au lieu de la table 0 par défaut, vous accédez aux données détaillées des violations et non pas seulement aux totaux résumés. Le tri par type de violation regroupe les problèmes similaires, facilitant l’identification de motifs. La limite de 100 lignes garantit que le rapport reste gérable tout en couvrant les violations les plus importantes.

Sortie

Le calculateur Sélecteur de Données affiche un tableau avec les colonnes exactes que vous avez spécifiées, dans l’ordre dans lequel vous les avez sélectionnées. La structure du tableau est dynamique et dépend de votre sélection de colonnes.

Caractéristiques de la sortie

Structure des colonnes : Seules les colonnes que vous avez sélectionnées dans « Columns to Include » apparaissent dans la sortie. Les noms de colonnes, types de données et formatage sont conservés tels qu’ils apparaissent dans la sortie du calculateur source.

Nombre de lignes : Déterminé par le paramètre Maximum Rows :

Si Maximum Rows = 0 ou vide : Toutes les lignes de la table source
Si Maximum Rows > 0 : Jusqu’à ce nombre de lignes (peut être moins si la source comporte moins de lignes)

Ordre des lignes : Déterminé par les paramètres de tri :

Si aucune colonne de tri spécifiée : conserve l’ordre identique à celui du calculateur source
Si colonne de tri spécifiée : les lignes sont ordonnées selon la colonne de tri et la direction

Fonctionnalités interactives

Clic sur les lignes : Dans de nombreux cas, cliquer sur une ligne permet d’approfondir pour afficher les cas ou détails sous-jacents, comme dans le calculateur source.

Capacités d’export : La sortie affinée peut être exportée en fichiers Excel ou CSV, ce qui est idéal pour partager avec des parties prenantes qui n’ont pas accès à la plateforme mindzie.

Intégration e-mail : La sortie de ce calculateur est souvent utilisée avec la livraison automatisée par e-mail pour envoyer des sous-ensembles de données ciblés aux responsables processus et cadres selon un calendrier.

Widgets de tableau de bord : La sortie simplifiée et ciblée est parfaite pour être intégrée dans des widgets de tableau de bord où l’espace est limité.

Conseils d’utilisation

Assurez-vous toujours que le calculateur source a été exécuté avec succès avant d’exécuter Sélecteur de Données
Utilisez la fonction d’aperçu dans la configuration du calculateur pour voir les colonnes disponibles depuis votre source
Les noms de colonnes sont sensibles à la casse – ils doivent correspondre exactement tels qu’ils apparaissent dans la source
Lors de la combinaison tri et limite de lignes, le tri est appliqué en premier, puis la limite (permettant les sélections « top N »)
Si le calculateur source n’a pas de résultats ou affiche une erreur, Sélecteur de Données produira un tableau vide
Plusieurs calculateurs Sélecteur de Données peuvent être utilisés en séquence pour affiner progressivement les données

Schémas courants

Schéma tableau de bord : Calculateur complexe -> Sélecteur de Données (sélection des colonnes clés, top N lignes) -> Widget de tableau de bord

Schéma e-mail : Calculateur d’analyse -> Sélecteur de Données (mise au point sur les données exploitables) -> Livraison automatisée par e-mail

Schéma export : Analyse complète -> Sélecteur de Données (simplification pour parties externes) -> Export Excel

Schéma pipeline : Calculateur A -> Sélecteur de Données 1 (affinage) -> Calculateur B (analyse complémentaire) -> Sélecteur de Données 2 (sortie finale)

Le Sélecteur de Données est particulièrement précieux lorsque vous devez présenter des résultats d’analyse à des parties prenantes qui ont besoin d’informations précises et exploitables plutôt que de détails analytiques exhaustifs. Il fait le lien entre une analyse détaillée de process mining et un reporting clair, prêt à la décision.

Cette documentation fait partie de la plateforme de process mining mindzie Studio.