Copier un Attribut

Vue d'ensemble

L'enrichissement Copier un Attribut crée un duplicata d'un attribut existant avec un nouveau nom, vous permettant de préserver les données originales tout en effectuant des transformations, de créer des copies de sauvegarde avant modifications, ou d'établir plusieurs versions des mêmes données pour différents objectifs analytiques. Cet opérateur fondamental de manipulation de données fonctionne parfaitement avec les attributs de cas et d'événement, détectant automatiquement le niveau de l'attribut et créant la copie à l'emplacement approprié dans la structure de votre jeu de données.

En process mining, la capacité à copier des attributs est essentielle pour la préservation des données, la version des attributs, et la création de copies de travail pour des transformations ultérieures. L'enrichissement Copier un Attribut réalise une réplication complète de l'attribut source, incluant son type de données, son format d'affichage, et toutes ses valeurs. Combiné à des filtres, vous pouvez copier sélectivement les valeurs d'attribut uniquement pour certains cas, laissant le nouvel attribut vide pour les cas ne correspondant pas aux critères du filtre. Cette capacité de copie sélective rend l'enrichissement particulièrement précieux pour la segmentation des données, la préparation conditionnelle des données, et la création de variantes d'attributs pour différents scénarios analytiques.

L'enrichissement gère intelligemment tous les types d'attributs - texte, numérique, booléen et datetime - en préservant le type de données exact et le formatage de l'attribut source. Cette préservation du type garantit que les calculs, filtres, et visualisations en aval peuvent travailler avec l'attribut copié exactement comme avec l'original, assurant l'intégrité des données tout au long de vos workflows analytiques.

Usages courants

  • Créer des copies de sauvegarde d'attributs avant d'appliquer des transformations ou enrichissements
  • Préserver les valeurs originales tout en créant des versions modifiées pour l'analyse comparative
  • Dupliquer des attributs pour différents contextes analytiques (rapports hebdomadaires vs mensuels)
  • Créer des copies de travail d'attributs pour des améliorations itératives de la qualité des données
  • Établir des versions de référence d'attributs avant d'appliquer des mises à jour conditionnelles
  • Copier des attributs de manière sélective selon des critères de filtre pour une analyse segmentée
  • Générer des variantes d'attributs avec des noms d'affichage différents pour des publics métier vs technique

Paramètres

Column Name : Sélectionnez l'attribut source que vous souhaitez copier. Cela peut être n'importe quel attribut de cas ou d'événement existant dans votre jeu de données. L'enrichissement détectera automatiquement si l'attribut est au niveau du cas ou de l'événement et créera la copie au même niveau. Tous les types de données sont supportés, y compris texte, numérique, booléen, et datetime. Le format d'affichage et le type de données de l'attribut source seront préservés dans la copie.

New Attribute Name : Spécifiez le nom du nouvel attribut copié. Choisissez un nom descriptif qui indique clairement le but de la copie ou sa relation avec l'original. Par exemple, utilisez "Original_Amount" lors de la création d'une sauvegarde avant transformations, ou "Baseline_Status" pour préserver les valeurs initiales. Le nom doit être unique et ne peut pas entrer en conflit avec des attributs existants dans votre jeu de données.

Filter (Optional) : Appliquez des filtres pour contrôler quels cas reçoivent les valeurs copiées. Lorsque des filtres sont spécifiés, seules les cases correspondant aux critères du filtre auront les valeurs copiées dans le nouvel attribut. Les cas qui ne correspondent pas au filtre auront le nouvel attribut créé mais laissé vide (null). Cette copie sélective est utile pour créer des variantes d'attributs ne s'appliquant qu'à des segments spécifiques du processus, périodes temporelles, ou catégories de cas. Le filtre opère au niveau du cas, même lors de la copie d'attributs d'événement.

Exemples

Exemple 1 : Création d'un statut de référence pour comparaison

Scénario : Dans un processus de traitement des commandes, vous devez préserver le statut initial de la commande au moment de sa création pour le comparer avec le statut actuel et suivre les changements de statut tout au long du cycle de vie du processus.

Paramètres :

  • Column Name : Order_Status
  • New Attribute Name : Initial_Order_Status
  • Filter : Aucun (copie pour tous les cas)

Résultat : Crée un nouvel attribut de cas "Initial_Order_Status" contenant une copie exacte des valeurs de Order_Status. Pour les cas avec :

  • Order_Status : "Pending Approval"

L'Initial_Order_Status sera également : "Pending Approval"

Plus tard dans votre analyse, vous pourrez comparer Initial_Order_Status avec le Order_Status actuel pour identifier quelles commandes ont changé de statut, permettant d'analyser les schémas de progression des statuts et d'identifier les cas bloqués à certains états.

Aperçus : Cette copie de référence permet l'analyse du suivi des changements, aide à identifier les goulets d'étranglement du processus où les statuts ne progressent pas comme prévu, et fournit un point de référence pour mesurer l'évolution du processus dans le temps.

Exemple 2 : Préservation du coût original avant conversion monétaire

Scénario : Dans un processus d'achat global, vous devez convertir tous les coûts en une devise de base (USD) pour un reporting consolidé, mais vous voulez préserver les valeurs de coût originales dans leurs devises natives pour audits et rapprochements.

Paramètres :

  • Column Name : Invoice_Amount
  • New Attribute Name : Original_Invoice_Amount
  • Filter : Aucun

Résultat : Crée un nouvel attribut de cas "Original_Invoice_Amount" contenant la copie exacte des valeurs de Invoice_Amount. Pour les cas avec :

  • Invoice_Amount : 45000.00 (en différentes devises)
  • Currency : "EUR"

L'Original_Invoice_Amount sera : 45000.00

Après la copie, vous pouvez appliquer des enrichissements de conversion monétaire à Invoice_Amount tandis que Original_Invoice_Amount reste inchangé, préservant les données sources pour les audits et l'analyse des écarts.

Aperçus : Cette approche de préservation maintient la traçabilité des données, facilite le rapprochement des audits entre montants originaux et convertis, et offre une transparence dans les scénarios de reporting multi-devises.

Exemple 3 : Création de variantes régionales pour différents contextes analytiques

Scénario : Dans un processus de vente couvrant plusieurs régions, vous souhaitez créer des copies séparées de l'attribut montant des ventes pour différentes équipes régionales, chacune contenant uniquement les valeurs pour leur région respective afin de simplifier l'analyse spécifique à la région.

Paramètres :

  • Column Name : Sales_Amount
  • New Attribute Name : North_America_Sales
  • Filter : Region = "North America"

Résultat : Crée un nouvel attribut de cas "North_America_Sales" contenant uniquement les montants des ventes pour les cas nord-américains. Pour un cas nord-américain avec :

  • Sales_Amount : 125000.00
  • Region : "North America"

Le North_America_Sales sera : 125000.00

Pour les cas d'autres régions :

  • Sales_Amount : 85000.00
  • Region : "Europe"

Le North_America_Sales sera : vide (null)

Aperçus : Cette copie sélective permet des tableaux de bord et rapports spécifiques par région sans nécessiter une application constante de filtres, simplifie l'analyse des écarts entre régions, et permet aux équipes différentes de se concentrer sur leur sous-ensemble de données pertinent.

Exemple 4 : Établir une copie de travail pour une qualité de données itérative

Scénario : Dans un processus de service client, vous devez nettoyer et standardiser les noms de catégories de produits, mais vous souhaitez préserver les valeurs brutes originales pour l'assurance qualité et pour suivre l'ampleur du nettoyage des données nécessaire.

Paramètres :

  • Column Name : Product_Category
  • New Attribute Name : Product_Category_Original
  • Filter : Aucun

Résultat : Crée un nouvel attribut de cas "Product_Category_Original" avec des copies exactes de toutes les valeurs de Product_Category. Pour les cas avec :

  • Product_Category : "Laptop Computer - 15in"

Le Product_Category_Original sera : "Laptop Computer - 15in"

Après copie, vous pouvez appliquer des enrichissements de remplacement de texte, de regroupement et de standardisation à Product_Category tandis que Product_Category_Original reste inchangé, vous permettant de :

  • Comparer les valeurs nettoyées vs originales pour mesurer les améliorations de qualité des données
  • Identifier les variations brutes les plus courantes nécessitant standardisation
  • Maintenir une traçabilité de toutes les transformations de données

Aperçus : Cette approche de copie de travail permet des processus transparents de qualité des données, offre des capacités de comparaison avant/après, et assure la traçabilité de toutes les transformations appliquées à vos données.

Exemple 5 : Création de snapshots temporels pour l'analyse des tendances

Scénario : Dans un processus de gestion de projet, vous souhaitez capturer le pourcentage d'achèvement du projet à des jalons spécifiques pour analyser comment les estimations évoluent dans le temps et identifier des schémas dans la précision des prévisions de projet.

Paramètres :

  • Column Name : Completion_Percentage
  • New Attribute Name : Completion_At_Midpoint
  • Filter : Milestone = "Project Midpoint Review"

Résultat : Crée un nouvel attribut de cas "Completion_At_Midpoint" qui capture le pourcentage d'achèvement uniquement pour les cas ayant atteint la revue de mi-parcours. Pour un cas à mi-parcours avec :

  • Completion_Percentage : 45
  • Milestone : "Project Midpoint Review"

Le Completion_At_Midpoint sera : 45

Pour les cas n'étant pas encore à mi-parcours :

  • Completion_Percentage : 25
  • Milestone : "Initial Planning"

Le Completion_At_Midpoint sera : vide (null)

Plus tard, à mesure que Completion_Percentage continue de s'actualiser, vous pourrez comparer le snapshot de mi-parcours avec l'achèvement final pour analyser la précision des estimations et identifier les projets ayant significativement dévié des projections de mi-parcours.

Aperçus : Ces snapshots temporels permettent l'analyse des tendances au cours des cycles de vie de projet, aident à identifier des biais systématiques d'estimation à différentes phases du projet, et fournissent des métriques de référence pour améliorer la précision des planifications futures.

Résultat

L'enrichissement Copier un Attribut crée un nouvel attribut unique au même niveau (cas ou événement) que l'attribut source. Le nouvel attribut est une réplique exacte de l'attribut source, préservant :

  • Type de données : L'attribut copié conserve le même type de données que la source (texte, entier, décimal, booléen ou datetime)
  • Format d'affichage : Tout formatage appliqué à l'attribut source (symboles monétaires, décimales, formats de date) est préservé dans la copie
  • Valeurs : Toutes les valeurs non nulles de l'attribut source sont copiées exactement dans le nouvel attribut

Le nouvel attribut apparaît dans votre jeu de données aux côtés de l'attribut original et peut être utilisé dans toutes les fonctionnalités de mindzieStudio incluant filtres, calculateurs, visualisations, et enrichissements ultérieurs. Lorsqu'aucun filtre n'est appliqué, le nouvel attribut aura des valeurs pour tous les cas ou événements (correspondant à la complétude de l'attribut source). Lorsqu'un filtre est appliqué, seuls les cas ou événements correspondant aux critères du filtre auront des valeurs remplies dans le nouvel attribut ; les cas non correspondants auront l'attribut présent mais mis à null.

L'attribut copié est marqué comme attribut dérivé dans les métadonnées du jeu de données, indiquant qu'il a été créé via un traitement d'enrichissement plutôt que faisant partie des données source. Les dépendances de l'attribut référencent l'attribut source original, maintenant la traçabilité des données pour l'audit et la compréhension des transformations.

Pour les attributs d'événement, l'opération de copie est effectuée au niveau de l'événement, ce qui signifie que chaque événement individuel reçoit une copie de la valeur de son attribut. Pour les attributs de cas, la copie se fait au niveau du cas, avec la valeur unique au niveau du cas dupliquée dans le nouvel attribut.


Cette documentation fait partie de la plateforme de process mining mindzie Studio.