Fin du Texte
Vue d'ensemble
L'enrichissement Fin du Texte extrait un nombre spécifié de caractères depuis la fin des valeurs d'attributs textuels, créant un nouvel attribut contenant le suffixe extrait. Cet opérateur de manipulation de texte puissant vous permet d'isoler et d'analyser les parties finales des champs textuels, qui contiennent souvent des informations d'identification critiques, des codes de classification ou des suffixes standardisés. En se concentrant sur les caractères les plus à droite des valeurs textuelles, vous pouvez extraire des motifs et catégories significatifs qui sont couramment ajoutés à la fin des identifiants métiers.
En process mining, l'enrichissement Fin du Texte est particulièrement utile pour travailler avec des codes et identifiants structurés où la partie finale porte une signification spécifique. De nombreux systèmes métier utilisent des suffixes pour désigner des catégories, des régions, des types de produits ou des indicateurs de statut. Par exemple, les numéros de facture peuvent se terminer par des codes pays, les SKUs de produits peuvent inclure des suffixes de catégorie, ou les IDs de dossiers peuvent contenir des identifiants de département. Cet enrichissement vous permet d'extraire ces fins significatives pour l'analyse, le filtrage et la détection de variantes de processus. L'opérateur fonctionne avec les attributs de cas comme avec les attributs d'événement, offrant une flexibilité quant à la façon dont vous extrayez et analysez les motifs textuels dans vos données de processus.
Utilisations Courantes
- Extraire les extensions de fichiers à partir des noms de documents pour analyser les types de documents dans les processus d'approbation
- Isoler les codes pays ou régions depuis la fin des identifiants clients ou fournisseurs
- Extraire les suffixes de département ou d'équipe à partir des IDs de cas pour l'analyse organisationnelle
- Récupérer les codes de catégorie produit à partir de la fin des numéros SKU pour l'analyse des stocks
- Identifier les numéros de version ou codes de révision depuis la fin des références de documents
- Extraire les indicateurs de statut ou flags ajoutés aux codes de transaction
- Isoler les indicateurs d'année ou de période à partir des numéros de référence financière
Paramètres
Nom du Nouvel Attribut : Spécifiez le nom du nouvel attribut qui contiendra la fin de texte extraite. Choisissez un nom descriptif qui indique clairement quelle information est extraite du texte source. Par exemple, utilisez "File_Extension" pour extraire les types de fichiers, "Country_Code" pour les identifiants de localisation, ou "Category_Suffix" pour les codes de classification. Le nom doit être unique et ne pas entrer en conflit avec les attributs existants dans votre jeu de données.
Nom de la Colonne : Sélectionnez l'attribut texte dont vous souhaitez extraire les caractères de fin. Ce menu déroulant présente tous les attributs textuels disponibles, tant au niveau cas qu'au niveau événement. L'enrichissement détecte automatiquement si l'attribut sélectionné est un attribut de cas ou d'événement et crée le nouvel attribut au même niveau. Seuls les attributs de type texte (chaîne) non masqués sont disponibles à la sélection.
Longueur : Indiquez le nombre de caractères à extraire à partir de la fin de la valeur textuelle. Cela doit être un entier positif (valeur minimale de 1). Si la longueur spécifiée dépasse la longueur réelle de la valeur textuelle, la valeur entière sera retournée. Par exemple, si vous spécifiez une longueur de 3 et qu'une valeur ne fait que 2 caractères, la valeur complète de 2 caractères sera extraite. Prenez en compte la longueur maximale attendue du suffixe que vous souhaitez extraire afin d'éviter de capturer des caractères inutiles.
Exemples
Exemple 1 : Extraction des Extensions de Fichiers depuis les Noms de Documents
Scénario : Dans un processus d'approbation de documents, vous devez analyser quels types de documents sont soumis le plus souvent et leurs temps de traitement. Les noms des documents sont stockés avec leurs extensions de fichiers, et vous souhaitez extraire ces extensions pour les catégoriser.
Paramètres :
- Nom du Nouvel Attribut : Document_Type
- Nom de la Colonne : Document_Name
- Longueur : 4
Résultat : Crée un nouvel attribut "Document_Type" contenant les 4 derniers caractères de chaque nom de document. Pour les cas ayant des noms de documents :
- "Q3_Report_2024.pdf" → ".pdf"
- "Contract_Amendment.docx" → "docx"
- "Invoice_10245.xlsx" → "xlsx"
- "Presentation.ppt" → ".ppt"
Perspectives : En extrayant les extensions de fichiers, vous pouvez analyser quels types de documents nécessitent des temps d'approbation plus longs, identifier les départements qui travaillent avec certains formats, et détecter d’éventuels problèmes de conformité liés à des types de fichiers non autorisés.
Exemple 2 : Isolement des Codes Pays depuis les IDs Fournisseurs
Scénario : Dans un processus d'approvisionnement mondial, les IDs fournisseurs se terminent par des codes pays à deux lettres. Vous devez extraire ces codes pour analyser les schémas d'approvisionnement par pays et garantir la conformité aux politiques régionalisées d'achat.
Paramètres :
- Nom du Nouvel Attribut : Supplier_Country
- Nom de la Colonne : Supplier_ID
- Longueur : 2
Résultat : Crée un nouvel attribut de cas "Supplier_Country" avec le code pays. Pour les fournisseurs :
- "SUP-2024-0145-US" → "US"
- "SUP-2024-0892-DE" → "DE"
- "SUP-2024-0234-CN" → "CN"
- "SUP-2024-0567-BR" → "BR"
Perspectives : Cette extraction permet une analyse géographique de la distribution des fournisseurs, le calcul des métriques d'approvisionnement régional, et l'identification du respect des exigences locales d'approvisionnement.
Exemple 3 : Extraction des Codes Départementaux à partir des IDs de Cas
Scénario : Dans un système d'enregistrement de patients en santé, les IDs de cas incluent un code départemental de trois caractères à la fin. Vous devez extraire ces codes pour analyser le flux des patients entre les différents départements et identifier les goulets d'étranglement.
Paramètres :
- Nom du Nouvel Attribut : Department_Code
- Nom de la Colonne : Case_ID
- Longueur : 3
Résultat : Crée un nouvel attribut "Department_Code" contenant les identifiants de département. Pour les IDs de cas :
- "PAT-2024-10523-EMR" → "EMR" (Urgences)
- "PAT-2024-10524-RAD" → "RAD" (Radiologie)
- "PAT-2024-10525-LAB" → "LAB" (Laboratoire)
- "PAT-2024-10526-SUR" → "SUR" (Chirurgie)
Perspectives : L’extraction des codes départementaux permet d’analyser les parcours patients, de repérer les retards spécifiques à certains départements, et de comparer les temps de traitement entre unités médicales.
Exemple 4 : Récupération des Catégories de Produits depuis les Numéros SKU
Scénario : Dans un processus de gestion des stocks en commerce de détail, les SKUs de produits terminent par un code catégorie de deux caractères. Vous souhaitez extraire ces codes pour analyser le renouvellement des stocks par catégorie de produit et optimiser les niveaux de stock.
Paramètres :
- Nom du Nouvel Attribut : Product_Category
- Nom de la Colonne : SKU_Number
- Longueur : 2
Résultat : Crée un nouvel attribut "Product_Category" avec les codes de catégorie. Pour les SKUs :
- "PROD-854621-EL" → "EL" (Électronique)
- "PROD-854622-CL" → "CL" (Vêtements)
- "PROD-854623-FD" → "FD" (Alimentation)
- "PROD-854624-TY" → "TY" (Jouets)
Perspectives : L’extraction des catégories permet d’analyser les tendances d’inventaire par catégorie, d’identifier les produits à rotation lente, et d’optimiser les points de réapprovisionnement selon la catégorie.
Exemple 5 : Extraction des Indicateurs d’Année depuis les Références Financières
Scénario : Dans un processus de comptes fournisseurs, les numéros de facture se terminent par une année sous forme de quatre chiffres. Vous devez extraire l’année pour analyser les tendances de paiement dans le temps et identifier les factures en retard.
Paramètres :
- Nom du Nouvel Attribut : Invoice_Year
- Nom de la Colonne : Invoice_Number
- Longueur : 4
Résultat : Crée un nouvel attribut "Invoice_Year" contenant l’année. Pour les numéros de facture :
- "INV-US-054321-2024" → "2024"
- "INV-EU-098765-2023" → "2023"
- "INV-AP-012345-2024" → "2024"
- "INV-LA-067890-2022" → "2022"
Perspectives : L’extraction de l’année permet d’analyser les tendances temporelles des traitements de factures, de repérer les factures impayées anciennes, et de comparer les performances de paiement d’une année sur l’autre.
Résultat
L'enrichissement Fin du Texte crée un nouvel attribut (au niveau cas ou événement, en fonction du niveau de l'attribut source) contenant le texte extrait depuis la fin des valeurs originales. Le nouvel attribut est toujours de type chaîne de caractères, quelle que soit la nature du contenu extrait. L’attribut est automatiquement ajouté à la table appropriée (cas ou événement) et devient immédiatement disponible pour une utilisation dans les filtres, calculateurs et autres enrichissements.
Pour les attributs de cas, l’extraction est réalisée une fois par cas, le résultat étant stocké au niveau cas. Pour les attributs d’événements, l’extraction est effectuée pour chaque événement, vous permettant ainsi d’analyser comment les suffixes peuvent varier au travers des différentes activités du processus. Si la valeur source est nulle ou vide, le nouvel attribut sera également nul pour ce cas ou cet événement.
Le texte extrait conserve exactement les mêmes caractères à partir de la fin de la chaîne source, y compris les caractères spéciaux, chiffres ou signes de ponctuation. Cela garantit que des suffixes significatifs comme les extensions de fichiers (incluant le point) ou les codes composites sont capturés avec précision. L’enrichissement gère élégamment les textes sources de longueur variable – si une valeur source est plus courte que la longueur d’extraction spécifiée, la valeur entière est retournée, sans générer d’erreur.
Cette documentation fait partie de la plateforme de process mining mindzie Studio.