Masquer les attributs vides

Vue d'ensemble

L'enrichissement Masquer les attributs vides est un opérateur de nettoyage automatisé des données qui identifie et supprime tous les attributs (colonnes) ne contenant aucune donnée dans l'ensemble de votre jeu de données. Cet outil puissant analyse à la fois les attributs au niveau des cas et des événements, masquant automatiquement toute colonne où chaque ligne contient des valeurs nulles ou vides. En supprimant ces colonnes vides, l'enrichissement simplifie considérablement la vue de votre jeu de données, réduit l'encombrement visuel dans les outils d'analyse et améliore les performances lorsque vous travaillez avec de grands ensembles de données.

Cet enrichissement est particulièrement utile lors de l'importation de données provenant de systèmes d'entreprise qui exportent des schémas fixes avec de nombreux champs optionnels, ou lorsqu'on manipule des jeux de données ayant subi plusieurs transformations où certains attributs deviennent obsolètes. Contrairement à la suppression manuelle de colonnes, qui nécessite d'identifier chaque colonne vide individuellement, cet enrichissement effectue un balayage complet de votre jeu de données en une seule opération. L'enrichissement conserve toutes les colonnes contenant au moins une valeur non nulle, garantissant qu'aucune donnée utile potentielle ne soit perdue tout en maximisant la propreté et l'utilisabilité de votre espace de travail en fouille de processus.

Utilisations courantes

  • Nettoyer les jeux de données importés des systèmes ERP incluant des centaines de champs optionnels non renseignés
  • Simplifier la vue des jeux de données après des opérations de filtrage pouvant laisser certains attributs totalement vides
  • Réduire l'encombrement visuel dans les panneaux d’attributs au niveau des cas et des événements pour se concentrer sur les données significatives
  • Améliorer les performances et réduire l'utilisation mémoire lors du traitement de jeux de données larges comportant de nombreuses colonnes inutilisées
  • Préparer les jeux de données pour l'export ou le partage en supprimant les colonnes vides sans pertinence
  • Nettoyer après des transformations de données consolidant plusieurs attributs en nouveaux champs calculés
  • Rationaliser le contrôle de conformité en supprimant les attributs qui n'apportent aucune valeur analytique

Paramètres

Cet enrichissement fonctionne automatiquement sans nécessiter de configuration. Il analyse tous les attributs non calculés et non masqués dans votre jeu de données, supprimant uniquement ceux qui sont complètement vides sur l'ensemble des cas et événements.

Exemples

Exemple 1 : Nettoyage d'une exportation depuis un système ERP

Scénario : Une entreprise de fabrication exporte des données de traitement des commandes depuis SAP avec plus de 200 champs standard, mais leur implémentation spécifique n'utilise qu'environ 60 champs, laissant plus de 140 colonnes totalement vides et compliquant l'analyse.

Avant enrichissement :
Le jeu de données contient 215 attributs au total, dont :

  • Attributs cas : 125 colonnes (75 vides)
  • Attributs événement : 90 colonnes (65 vides)
  • Exemples de colonnes vides : Legacy_System_ID, Deprecated_Cost_Center, Old_Warehouse_Code, Custom_Field_1 à Custom_Field_50

Après enrichissement :
Jeu de données simplifié à 75 attributs pertinents :

  • Attributs cas : 50 colonnes (toutes contenant des données)
  • Attributs événement : 25 colonnes (toutes contenant des données)
  • Toutes les colonnes vides sont automatiquement cachées de la vue

Résultat : L'enrichissement a supprimé 140 colonnes vides tout en conservant les 75 colonnes contenant au moins une valeur. La vue du jeu de données se concentre maintenant uniquement sur les attributs contenant des données réelles, rendant la navigation et l'analyse nettement plus faciles.

Analyse : Après nettoyage, les analystes ont pu rapidement identifier les attributs pertinents pour la fouille de processus. La vue simplifiée a révélé que le traitement des commandes impliquait en réalité seulement 12 attributs clés pour la prise de décision, auparavant noyés parmi des centaines de champs vides. Les performances ont été améliorées de 40 % lors du chargement du jeu de données grâce à la réduction de la charge mémoire.

Exemple 2 : Nettoyage post-filtrage en santé

Scénario : Un hôpital filtre son jeu de données de traitement des patients pour analyser uniquement les cas du service d'urgence, ce qui rend de nombreux attributs spécialisés des services hospitaliers complètement vides car ces cas n'utilisent pas ces champs.

Avant enrichissement :
Après filtrage sur les cas d'urgence uniquement :

  • Total des attributs : 180
  • Attributs renseignés : Emergency_Triage_Level, Emergency_Wait_Time, Emergency_Treatment
  • Attributs vides : ICU_Ventilator_Settings, Surgery_Type, Rehabilitation_Plan, Oncology_Stage, et 85 autres champs spécialisés

Après enrichissement :

  • Attributs visibles au total : 92
  • Tous les attributs contiennent désormais des données pertinentes pour le service d'urgence
  • 88 attributs spécialisés vides sont cachés

Résultat : L'enrichissement a automatiquement identifié et masqué tous les attributs devenus vides après l'application du filtre sur le service d'urgence. Les attributs restants contiennent tous des données utiles aux cas urgents.

Analyse : Le jeu de données nettoyé a permis aux responsables du service d'urgence de se concentrer sur leurs indicateurs clés sans distraction des champs non pertinents. Le temps d'analyse a diminué de 60 % puisque le personnel n'avait plus à faire défiler des colonnes vides pour trouver les données pertinentes.

Exemple 3 : Consolidation de processus financiers

Scénario : Une banque fusionne les données de traitement de factures issues de trois systèmes différents, chacun avec des structures de champs uniques, ce qui engendre de nombreux attributs spécifiques à un système vides pour les cas des autres systèmes.

Avant enrichissement :
Jeu de données fusionné avec 340 attributs :

  • Champs communs (utilisés par tous les systèmes) : 45 attributs
  • Champs spécifiques au Système A : 95 attributs (vides pour les cas des systèmes B et C)
  • Champs spécifiques au Système B : 110 attributs (vides pour les cas des systèmes A et C)
  • Champs spécifiques au Système C : 90 attributs (vides pour les cas des systèmes A et B)

Après enrichissement :
Jeu de données focalisé avec 45 attributs communs visibles, plus uniquement les attributs spécifiques au système qui contiennent des données pour la sélection actuelle des cas.

Résultat : L'enrichissement a supprimé toutes les colonnes complètement vides, ne laissant que les 45 champs communs renseignés par les trois systèmes. Les attributs spécifiques vides ont été automatiquement masqués.

Analyse : La consolidation a révélé qu'en dépit des différentes structures systèmes, les trois captaient les mêmes 45 attributs de processus principaux. Cette découverte a permis à la banque de standardiser le traitement des factures et de réduire la complexité de 85 %.

Exemple 4 : Préparation des données d'approvisionnement

Scénario : Le jeu de données d'approvisionnement d'une société de distribution contient des attributs pour divers niveaux d'approbation et des codes de gestion spécifique, mais beaucoup de ces champs sont utilisés uniquement pour des articles de grande valeur ou réglementés, donc restent vides pour les achats courants.

Avant enrichissement :
Jeu de données avec 150 attributs dont :

  • Champs standards : PO_Number, Supplier, Amount, Create_Date (toujours renseignés)
  • Champs conditionnels : VP_Approval, Legal_Review, Hazmat_Code, Export_License, Compliance_Check (95 % vides)
  • Champs hérités : Old_Vendor_Code, Previous_System_Ref (100 % vides après migration)

Après enrichissement :
Jeu épuré à 67 attributs actifs :

  • Tous les champs standards d'approvisionnement conservés
  • Champs conditionnels avec au moins une valeur conservés
  • Champs hérités complètement vides supprimés

Résultat : L'enrichissement a masqué 83 attributs dépourvus de données, incluant tous les champs hérités et de validation conditionnelle jamais utilisés dans le jeu de données actuel. Les attributs restants contribuent tous à l'analyse des processus.

Analyse : Après nettoyage, l'équipe achats a découvert que seulement 5 % des achats nécessitaient réellement des approbations spéciales, leur permettant de rationaliser le processus pour 95 % des achats courants. La vue simplifiée a facilité l’identification de ces cas complexes pour un traitement différencié.

Exemple 5 : Contrôle qualité en fabrication

Scénario : Un fabricant de pièces automobiles exporte des données de contrôle qualité avec plusieurs centaines de champs de mesure, mais chaque ligne de production n'utilise que des mesures spécifiques pertinentes à ses pièces, laissant beaucoup de champs vides.

Avant enrichissement :
Jeu qualité avec 450 attributs :

  • Champs communs : Part_Number, Production_Line, Timestamp, Pass_Fail (toujours renseignés)
  • Mesures spécifiques à une ligne : 200+ champs de mesure par ligne (vides pour les autres lignes)
  • Mesures obsolètes : 50+ anciens indicateurs de qualité non collectés

Après enrichissement :
Jeu pertinent avec 125 attributs :

  • Tous les champs communs conservés
  • Seules les mesures avec données conservées
  • Tous les champs de mesures obsolètes et inutilisés masqués

Résultat : L'enrichissement a supprimé 325 colonnes de mesures vides tout en conservant les 125 colonnes contenant des données qualité réelles. Chaque vue de ligne de production affiche désormais uniquement les mesures pertinentes.

Analyse : Le nettoyage a révélé que malgré les 450 mesures possibles, chaque ligne ne surveillait activement que 20-30 indicateurs qualité critiques. Cette information a conduit à un programme d'amélioration ciblé réduisant de 15 % le taux de défauts en concentrant les efforts sur les mesures réellement importantes.

Résultat

L’enrichissement Masquer les attributs vides modifie la visibilité des colonnes existantes sans supprimer les données :

Colonnes masquées :

  • Attributs cas où chaque ligne de cas contient des valeurs nulles/vides
  • Attributs événement où chaque ligne d'événement contient des valeurs nulles/vides
  • Colonnes marquées comme masquées mais non supprimées du jeu de données
  • Le statut masqué peut être inversé si nécessaire via la gestion des colonnes

Colonnes conservées :

  • Toutes les colonnes contenant au moins une valeur non nulle
  • Toutes les colonnes calculées (créées par d'autres enrichissements)
  • Toutes les colonnes déjà marquées comme masquées (pas de traitement redondant)
  • Colonnes système comme Case ID et noms d’activités

Impact sur la performance :

  • Réduction de l’utilisation mémoire lors du chargement des jeux de données
  • Rendu plus rapide des listes d’attributs et des filtres
  • Amélioration des performances des requêtes sur des ensembles de colonnes simplifiés
  • Fichiers d’export plus propres lors du partage de jeux de données

Les effets de l’enrichissement sont immédiatement visibles dans les panneaux d’attributs cas et événement, où les colonnes vides n’apparaissent plus. Cela crée un environnement de travail concentré et efficace pour l’analyse des processus.

Voir aussi


Cette documentation fait partie de la plateforme de fouille de processus mindzie Studio.