Remplacer le Texte

Aperçu

L'enrichissement Remplacer le Texte est un opérateur de transformation de données puissant qui effectue des opérations de recherche et remplacement sur les attributs texte de votre jeu de données. Cet enrichissement permet une substitution systématique du texte à travers les attributs de cas et d’événement, vous permettant de standardiser la terminologie, corriger des erreurs systématiques ou transformer les formats de données de manière cohérente. Que vous ayez besoin de remplacer des codes produits obsolètes, standardiser des noms de départements ou corriger des fautes récurrentes dans vos données de processus, cet enrichissement offre une solution fiable et efficace pour les modifications massives de texte.

Contrairement aux opérations manuelles de recherche et remplacement qui risquent de manquer des occurrences ou d’introduire des incohérences, cet enrichissement traite chaque instance du motif texte spécifié à travers tous les attributs sélectionnés. L'enrichissement supporte les modes de remplacement sensibles ou insensibles à la casse, vous offrant un contrôle précis sur la manière dont la correspondance de texte s’effectue. Cette flexibilité est essentielle lorsqu’on traite des données issues de sources multiples où les conventions de capitalisation peuvent varier, comme lors de l’intégration de données provenant de différents systèmes ERP ou bureaux régionaux.

L'enrichissement Remplacer le Texte agit directement sur les attributs chaînes de caractères de votre jeu de données, modifiant les valeurs sur place afin de préserver les relations et l’intégrité des données. Cette approche garantit que toutes les analyses, filtres et calculs en aval bénéficient automatiquement des valeurs texte standardisées, sans nécessiter de configuration ou étapes de cartographie supplémentaires.

Usages courants

  • Standardiser les noms de département ou de site variable entre différents systèmes (ex. remplacer "NY Office", "New York", "NYC" par un standard "New York Office")
  • Mettre à jour des codes produits ou SKU obsolètes après migrations système ou initiatives de rebranding
  • Corriger des erreurs orthographiques systématiques ou des abréviations dans les noms d’activité pour une meilleure visualisation des processus
  • Remplacer les informations sensibles par des valeurs anonymisées pour se conformer aux règles de confidentialité des données
  • Standardiser les formats de date ou d’heure dans des champs texte en remplaçant les séparateurs ou caractères de formatage
  • Transformer les codes de statut ou abréviations en termes métier lisibles pour un meilleur reporting
  • Harmoniser les noms de fournisseurs ou clients qui ont plusieurs variantes dans les données sources

Paramètres

Attribute Name : Sélectionnez l’attribut texte sur lequel vous souhaitez effectuer l’opération de remplacement. Le menu déroulant affiche tous les attributs chaîne disponibles issus des données au niveau cas et événement. Seuls les attributs de type texte (string) qui ne sont pas cachés ni calculés sont disponibles. Choisissez l’attribut spécifique contenant les valeurs texte que vous souhaitez modifier.

Original Text : Saisissez la chaîne texte exacte que vous voulez trouver et remplacer dans l’attribut sélectionné. Il s’agit du motif de recherche qui sera recherché dans vos données. Le texte doit correspondre exactement (en tenant compte du paramètre Ignore Case) pour que le remplacement s’effectue. Laissez ce champ vide si vous souhaitez remplacer des chaînes vides par une valeur spécifique. Des exemples courants incluent des codes obsolètes, des fautes d’orthographe ou une terminologie incohérente.

New Text : Spécifiez le texte de remplacement qui substituera toutes les occurrences du Texte Original. Cela peut être n’importe quelle chaîne texte, y compris une chaîne vide si vous souhaitez supprimer complètement le texte original. Le nouveau texte remplacera chaque occurrence correspondante dans les valeurs de l’attribut. Pensez à l’impact sur les processus en aval et assurez-vous que le nouveau texte conserve l’intégrité et le sens des données.

Ignore Case : Activez cette option pour effectuer une recherche insensible à la casse lors de la recherche du Texte Original. Si activé, l’enrichissement associera le texte indépendamment des différences de majuscules ou minuscules (ex. "approved", "Approved" et "APPROVED" seront tous remplacés). Désactivé, seules les correspondances exactes en casse seront remplacées. Ce paramètre est particulièrement utile en présence de capitalisation incohérente issue de saisies manuelles ou de systèmes sources différents.

Exemples

Exemple 1 : Standardiser les noms de département dans les commandes d’achat

Scénario : Une multinationale doit standardiser les noms de département dans son système de commande d’achat où "Information Technology", "IT Dept", "I.T." et "InfoTech" désignent tous le même département, ce qui cause une analyse fragmentée des dépenses et des problèmes de routage d’approbation.

Paramètres :

  • Attribute Name : Department
  • Original Text : IT Dept
  • New Text : Information Technology
  • Ignore Case : Activé

Résultat : L’enrichissement remplace toutes les occurrences de "IT Dept" (et variations comme "it dept", "It Dept") par "Information Technology" dans l’attribut Department. Après plusieurs passages avec d’autres textes originaux ("I.T.", "InfoTech", etc.), toutes les références aux départements sont standardisées.

Avant : | Case ID | Department | Amount | |---------|------------|--------| | PO-001 | IT Dept | $5,000 | | PO-002 | Information Technology | $3,000 | | PO-003 | it dept | $2,500 | | PO-004 | I.T. | $4,000 |

Après : | Case ID | Department | Amount | |---------|------------|--------| | PO-001 | Information Technology | $5,000 | | PO-002 | Information Technology | $3,000 | | PO-003 | Information Technology | $2,500 | | PO-004 | Information Technology | $4,000 |

Analyse : Après standardisation, l’entreprise a découvert que le département Information Technology représentait en réalité 14 500 $ en commandes d’achat, plutôt que d’apparaître sous quatre départements distincts avec des modèles de dépense peu clairs. Ceci a permis un suivi budgétaire correct et mis en lumière des opportunités de remises sur volume avec les fournisseurs.

Exemple 2 : Mise à jour des codes produits après migration système

Scénario : Une entreprise de distribution a migré vers un nouveau système d’inventaire avec des normes de codage produit mises à jour, nécessitant le remplacement de tous les codes anciens formats (ex. "PROD-") par des nouveaux formats (ex. "SKU-") dans les données historiques des commandes pour une réconciliation d’inventaire précise.

Paramètres :

  • Attribute Name : Product_Code
  • Original Text : PROD-
  • New Text : SKU-
  • Ignore Case : Désactivé

Résultat : Tous les codes produits commençant par "PROD-" sont mis à jour pour commencer par "SKU-", en conservant les parties numériques tout en mettant à jour le préfixe pour correspondre au nouveau format du système.

Avant : | Case ID | Product_Code | Quantity | Order_Date | |---------|--------------|----------|------------| | ORD-501 | PROD-12345 | 10 | 2024-01-15 | | ORD-502 | PROD-67890 | 5 | 2024-01-16 | | ORD-503 | prod-12345 | 3 | 2024-01-16 | | ORD-504 | PROD-54321 | 8 | 2024-01-17 |

Après : | Case ID | Product_Code | Quantity | Order_Date | |---------|--------------|----------|------------| | ORD-501 | SKU-12345 | 10 | 2024-01-15 | | ORD-502 | SKU-67890 | 5 | 2024-01-16 | | ORD-503 | prod-12345 | 3 | 2024-01-16 | | ORD-504 | SKU-54321 | 8 | 2024-01-17 |

Analyse : Notez que "prod-12345" n’a pas été remplacé car la recherche était sensible à la casse. Cela a permis d’identifier 47 commandes avec des codes produits en minuscules incorrectes nécessitant une investigation qualité spécifique, révélant un problème de saisie dans un entrepôt particulier.

Exemple 3 : Anonymisation des noms clients pour conformité

Scénario : Un prestataire de santé doit anonymiser les noms des patients dans ses données de processus de prise de rendez-vous pour la recherche, tout en conservant la capacité de différencier les patients.

Paramètres :

  • Attribute Name : Patient_Name
  • Original Text : Smith, John
  • New Text : Patient_001
  • Ignore Case : Désactivé

Résultat : Les noms spécifiques des patients sont remplacés par des identifiants anonymisés, permettant l’analyse des processus tout en protégeant la confidentialité des patients selon les exigences HIPAA.

Avant : | Case ID | Patient_Name | Appointment_Type | Department | |---------|--------------|------------------|------------| | APT-101 | Smith, John | Initial Consultation | Cardiology | | APT-102 | Jones, Mary | Follow-up | Orthopedics | | APT-103 | Smith, John | Test Results | Cardiology | | APT-104 | Brown, David | Emergency | Emergency |

Après (premier remplacement) : | Case ID | Patient_Name | Appointment_Type | Department | |---------|--------------|------------------|------------| | APT-101 | Patient_001 | Initial Consultation | Cardiology | | APT-102 | Jones, Mary | Follow-up | Orthopedics | | APT-103 | Patient_001 | Test Results | Cardiology | | APT-104 | Brown, David | Emergency | Emergency |

Analyse : Le processus d’anonymisation a préservé la relation entre les rendez-vous du même patient tout en supprimant les informations personnelles identifiables. L’exploration des processus a montré que les patients avec une consultation initiale en cardiologie avaient un taux de 73 % de rendez-vous de suivi dans les 30 jours.

Exemple 4 : Correction des fautes dans les noms d’activité en production

Scénario : Le système MES d’une usine de fabrication présente une incohérence dans la dénomination des activités où les opérateurs tapent parfois "Quaility Check" au lieu de "Quality Check", entraînant un signalement incorrect des écarts de conformité.

Paramètres :

  • Attribute Name : Activity
  • Original Text : Quaility Check
  • New Text : Quality Check
  • Ignore Case : Activé

Résultat : Toutes les occurrences mal orthographiées des activités de contrôle qualité sont corrigées, quelle que soit la variation de casse, assurant une découverte de processus précise et une analyse de conformité fidèle.

Données d’événement avant : | Case ID | Activity | Timestamp | Resource | |---------|----------|-----------|----------| | WO-801 | Material Receipt | 2024-02-01 08:00 | Warehouse | | WO-801 | Quaility Check | 2024-02-01 09:15 | QC Team | | WO-801 | Assembly Start | 2024-02-01 10:00 | Line 1 | | WO-802 | Material Receipt | 2024-02-01 08:30 | Warehouse | | WO-802 | QUAILITY CHECK | 2024-02-01 09:45 | QC Team |

Données d’événement après : | Case ID | Activity | Timestamp | Resource | |---------|----------|-----------|----------| | WO-801 | Material Receipt | 2024-02-01 08:00 | Warehouse | | WO-801 | Quality Check | 2024-02-01 09:15 | QC Team | | WO-801 | Assembly Start | 2024-02-01 10:00 | Line 1 | | WO-802 | Material Receipt | 2024-02-01 08:30 | Warehouse | | WO-802 | Quality Check | 2024-02-01 09:45 | QC Team |

Analyse : Après correction, le contrôle de conformité a montré que 98 % des ordres de travail suivaient correctement le processus standard avec les contrôles qualité, contre 67 % avant correction. Ceci a révélé que le problème apparent de conformité était en réalité un problème de qualité des données.

Exemple 5 : Standardiser les codes de statut entre systèmes

Scénario : Une société de logistique intègre des données d’expédition de trois systèmes de transporteurs différents, chacun utilisant des codes différents pour le statut de livraison ("DLVRD", "Delivered", "COMPLETE"), nécessitant une standardisation pour des tableaux de bord de suivi unifiés.

Paramètres :

  • Attribute Name : Delivery_Status
  • Original Text : DLVRD
  • New Text : Delivered
  • Ignore Case : Désactivé

Résultat : Les codes de statut spécifiques à chaque transporteur sont remplacés par des termes métier standardisés, permettant un reporting cohérent des statuts à travers toutes les sources d’expédition.

Avant : | Case ID | Carrier | Delivery_Status | Delivery_Date | |---------|---------|-----------------|---------------| | SHP-901 | CarrierA | DLVRD | 2024-03-01 | | SHP-902 | CarrierB | Delivered | 2024-03-01 | | SHP-903 | CarrierC | COMPLETE | 2024-03-01 | | SHP-904 | CarrierA | DLVRD | 2024-03-02 |

Après (premier remplacement) : | Case ID | Carrier | Delivery_Status | Delivery_Date | |---------|---------|-----------------|---------------| | SHP-901 | CarrierA | Delivered | 2024-03-01 | | SHP-902 | CarrierB | Delivered | 2024-03-01 | | SHP-903 | CarrierC | COMPLETE | 2024-03-01 | | SHP-904 | CarrierA | Delivered | 2024-03-02 |

Analyse : Après d’autres remplacements pour "COMPLETE" et autres variations, l’équipe logistique a pu rapporter que 94 % des expéditions ont été livrées à temps, comparé à un reporting fragmenté par système transporteur qui masquait les indicateurs de performance globaux.

Résultat

L’enrichissement Remplacer le Texte modifie directement les valeurs de l’attribut sélectionné dans votre jeu de données, effectuant un remplacement sur place des motifs de texte spécifiés. L’enrichissement conserve la structure et le type de donnée original des attributs tout en mettant à jour uniquement le contenu texte correspondant à vos critères de recherche.

Pour les attributs cas, le remplacement s’effectue une fois par cas, affectant la valeur d’attribut associée à chaque cas. Pour les attributs événement, le remplacement traite chaque événement dans votre jeu de données, pouvant modifier plusieurs occurrences dans un même cas. L’enrichissement préserve les valeurs nulles et ne traite que les valeurs chaînes non-nulles dans l’attribut sélectionné.

Après exécution, l’attribut modifié conserve son nom et sa position d’origine dans votre jeu de données mais contient les valeurs texte mises à jour. Ces modifications impactent immédiatement tous les calculs, filtres et visualisations dépendant de l’attribut modifié. L’enrichissement ne crée pas de nouveaux attributs ni de colonnes de sauvegarde — il transforme directement les données existantes selon vos spécifications.

L’opération de remplacement est sensible à la casse par défaut mais peut être configurée en insensible à la casse via le paramètre Ignore Case. Lors de remplacements insensibles à la casse, la casse originale des portions non correspondantes du texte est préservée, tandis que la portion correspondante est entièrement remplacée par la valeur New Text spécifiée.

Voir aussi

  • Trim Text - Supprimer les espaces avant et après les attributs texte
  • Text Start - Extraire un nombre spécifié de caractères au début des valeurs texte
  • Text End - Extraire un nombre spécifié de caractères à la fin des valeurs texte
  • Group Attribute Values - Combiner plusieurs valeurs d’attribut en catégories standardisées
  • Categorize Attribute Values - Créer des catégories basées sur des plages ou motifs des valeurs d’attribut
  • Concatenate Text Attributes - Combiner plusieurs attributs texte en un seul champ

Cette documentation fait partie de la plateforme d’exploration de processus mindzie Studio.