Teksteinde

Overzicht

De Text End verrijking extraheert een opgegeven aantal tekens van het einde van tekstattribuutwaarden, en creëert een nieuw attribuut dat het geëxtraheerde achtervoegsel bevat. Deze krachtige tekstmanipulatie-operator stelt u in staat om het afsluitende deel van tekstvelden te isoleren en te analyseren, die vaak cruciale identificerende informatie, classificatiecodes of gestandaardiseerde achtervoegsels bevatten. Door te focussen op de meest rechtse tekens van tekstwaarden, kunt u zinvolle patronen en categorieën extraheren die vaak aan het einde van zakelijke identificatoren worden toegevoegd.

In process mining is de Text End verrijking bijzonder waardevol bij het werken met gestructureerde codes en identificatoren waar het afsluitende deel een specifieke betekenis draagt. Veel zakelijke systemen gebruiken achtervoegsels om categorieën, regio's, producttypes of statusindicatoren aan te duiden. Bijvoorbeeld, factuurnummers kunnen eindigen met landcodes, product-SKU's kunnen categorietoevoegsels bevatten, of case-ID's kunnen afdeling-identificatoren bevatten. Deze verrijking stelt u in staat deze betekenisvolle eindes te extraheren voor analyse, filtering en detectie van procesvarianten. De operator werkt met zowel case-attributen als gebeurtenis-attributen, wat flexibiliteit biedt in hoe u tekstpatronen door uw procesdata heen extraheert en analyseert.

Veelvoorkomend Gebruik

  • Bestandsnaamextensies extraheren uit documentnamen om documenttypes in goedkeuringsprocessen te analyseren
  • Land- of regiocodes isoleren uit het einde van klant- of leverancier-ID's
  • Afdelings- of teamachtervoegsels extraheren uit case-ID's voor organisatorische analyse
  • Productcategoriecodes ophalen uit het einde van SKU-nummers voor voorraadbeheeranalyse
  • Versienummers of revisiecodes identificeren uit het einde van documentreferenties
  • Statusindicatoren of vlaggen extraheren die aan transactiescodes zijn toegevoegd
  • Jaar- of periode-indicatoren isoleren uit financiële referentienummers

Instellingen

Nieuwe Attribuutnaam: Geef de naam op voor het nieuwe attribuut dat de geëxtraheerde tekstuitgang zal opslaan. Kies een beschrijvende naam die duidelijk aangeeft welke informatie uit de bron wordt gehaald. Gebruik bijvoorbeeld "File_Extension" bij het extraheren van bestandstypen, "Country_Code" voor locatiecodes of "Category_Suffix" voor classificatiecodes. De naam moet uniek zijn en mag niet conflicteren met bestaande attributen in uw dataset.

Kolomnaam: Selecteer het tekstattribuut waarvan u de eindtekens wilt extraheren. Deze dropdown toont alle beschikbare tekstattributen zowel van case- als evenement-niveau. De verrijking detecteert automatisch of het geselecteerde attribuut een case- of gebeurtenisattribuut is en creëert het nieuwe attribuut op hetzelfde niveau. Alleen tekst (string) type attributen die niet verborgen zijn, zijn beschikbaar voor selectie.

Lengte: Geef het aantal tekens op dat u van het einde van de tekstwaarde wilt extraheren. Dit moet een positief geheel getal zijn (minimale waarde 1). Als de opgegeven lengte langer is dan de werkelijke lengte van een tekstwaarde, wordt de hele waarde geretourneerd. Bijvoorbeeld: als u een lengte van 3 opgeeft en de waarde is slechts 2 tekens lang, wordt de volledige 2-tekenwaarde geëxtraheerd. Houd rekening met de maximale verwachte lengte van het achtervoegsel dat u wilt extraheren om onnodige tekens te vermijden.

Voorbeelden

Voorbeeld 1: Bestandsnaamextensies extraheren uit documentnamen

Scenario: In een documentgoedkeuringsproces wilt u analyseren welke documenttypes het vaakst worden ingediend en hun verwerkingstijden. Documentnamen zijn opgeslagen met hun bestandsextensies, en u wilt deze extensies extraheren voor categorisering.

Instellingen:

  • Nieuwe Attribuutnaam: Document_Type
  • Kolomnaam: Document_Name
  • Lengte: 4

Output: Creëert een nieuw attribuut "Document_Type" met de laatste 4 tekens van elke documentnaam. Voor cases met documentnamen:

  • "Q3_Report_2024.pdf" → ".pdf"
  • "Contract_Amendment.docx" → "docx"
  • "Invoice_10245.xlsx" → "xlsx"
  • "Presentation.ppt" → ".ppt"

Inzichten: Door bestandsextensies te extraheren, kunt u analyseren welke documenttypes langere goedkeuringstijden vereisen, afdelingen identificeren die met specifieke bestandsformaten werken, en mogelijke complianceproblemen met ongeautoriseerde bestandstypes detecteren.

Voorbeeld 2: Landcodes isoleren uit leverancier-ID's

Scenario: In een mondiaal inkoopproces eindigen leverancier-ID's met tweeletterige landcodes. U moet deze codes extraheren om inkooppatronen per land te analyseren en naleving van regionale inkoopbeleid te waarborgen.

Instellingen:

  • Nieuwe Attribuutnaam: Supplier_Country
  • Kolomnaam: Supplier_ID
  • Lengte: 2

Output: Creëert een nieuw case-attribuut "Supplier_Country" met de landcode. Voor leveranciers:

  • "SUP-2024-0145-US" → "US"
  • "SUP-2024-0892-DE" → "DE"
  • "SUP-2024-0234-CN" → "CN"
  • "SUP-2024-0567-BR" → "BR"

Inzichten: Deze extractie stelt geografische analyse van leveranciersdistributie in staat, berekening van regionale inkoopstatistieken en identificatie van naleving van lokale inkoopvereisten.

Voorbeeld 3: Afdelingscodes extraheren uit case-ID's

Scenario: In een patiëntregistratiesysteem voor de gezondheidszorg bevatten case-ID's een drieletterige afdelingscode aan het einde. U wilt deze codes extraheren om patiëntstromen in verschillende afdelingen te analyseren en knelpunten te identificeren.

Instellingen:

  • Nieuwe Attribuutnaam: Department_Code
  • Kolomnaam: Case_ID
  • Lengte: 3

Output: Creëert een nieuw attribuut "Department_Code" met afdelingsidentificaties. Voor case-ID's:

  • "PAT-2024-10523-EMR" → "EMR" (Spoedeisende hulp)
  • "PAT-2024-10524-RAD" → "RAD" (Radiologie)
  • "PAT-2024-10525-LAB" → "LAB" (Laboratorium)
  • "PAT-2024-10526-SUR" → "SUR" (Chirurgie)

Inzichten: Het extraheren van afdelingscodes maakt analyse van patiëntverlooppatronen mogelijk, identificatie van afdeling-specifieke vertragingen en vergelijking van verwerkingstijden tussen verschillende medische eenheden.

Voorbeeld 4: Productcategorieën ophalen uit SKU-nummers

Scenario: In een retailvoorraadbeheerproces eindigen product-SKU's met een tweecijferige categoriecode. U wilt deze codes extraheren om voorraadrotatie per productcategorie te analyseren en voorraadniveaus te optimaliseren.

Instellingen:

  • Nieuwe Attribuutnaam: Product_Category
  • Kolomnaam: SKU_Number
  • Lengte: 2

Output: Creëert een nieuw attribuut "Product_Category" met categoriewaarden. Voor SKU's:

  • "PROD-854621-EL" → "EL" (Elektronica)
  • "PROD-854622-CL" → "CL" (Kleding)
  • "PROD-854623-FD" → "FD" (Voeding)
  • "PROD-854624-TY" → "TY" (Speelgoed)

Inzichten: Categorie-extractie maakt analyse van categorie-specifieke voorraadpatronen mogelijk, identificatie van langzaam bewegende producttypes en optimalisatie van bestelpuntinstellingen per productcategorie.

Voorbeeld 5: Jaarindicatoren extraheren uit financiële referenties

Scenario: In een crediteurenproces eindigen factuurnummers met een viercijferig jaar. U wilt het jaar extraheren om betalingspatronen in de tijd te analyseren en verouderde facturen te identificeren.

Instellingen:

  • Nieuwe Attribuutnaam: Invoice_Year
  • Kolomnaam: Invoice_Number
  • Lengte: 4

Output: Creëert een nieuw attribuut "Invoice_Year" met het jaar. Voor factuurnummers:

  • "INV-US-054321-2024" → "2024"
  • "INV-EU-098765-2023" → "2023"
  • "INV-AP-012345-2024" → "2024"
  • "INV-LA-067890-2022" → "2022"

Inzichten: Jaar-extractie maakt trendanalyse van factuurverwerkingstijden mogelijk, identificatie van oude onbetaalde facturen en jaar-op-jaar vergelijking van betalingsprestaties.

Output

De Text End verrijking creëert een nieuw attribuut (case- of evenementniveau, passend bij het bronattribuut) met de geëxtraheerde tekst van het einde van de oorspronkelijke waarden. Het nieuwe attribuut is altijd van string-datatype, ongeacht wat de geëxtraheerde inhoud vertegenwoordigt. Het attribuut wordt automatisch toegevoegd aan de juiste tabel (case of event) en is direct beschikbaar voor gebruik in filters, calculators en andere verrijkingen.

Voor case-attributen wordt de extractie eenmaal per case uitgevoerd en het resultaat op caseniveau opgeslagen. Voor gebeurtenis-attributen wordt de extractie bij elke gebeurtenis gedaan, waardoor u kunt analyseren hoe achtervoegsels kunnen variëren tussen verschillende activiteiten in uw proces. Als de bronwaarde null of leeg is, zal het nieuwe attribuut ook null zijn voor die case of gebeurtenis.

De geëxtraheerde tekst behoudt de exacte tekens van het einde van de bronstring, inclusief speciale tekens, cijfers of leestekens. Dit zorgt ervoor dat betekenisvolle achtervoegsels zoals bestandsextensies (inclusief de punt) of samengestelde codes nauwkeurig worden vastgelegd. De verrijking verwerkt variabele lengte bronteksten soepel - als een bronwaarde korter is dan de opgegeven extractielengte, wordt de hele waarde geretourneerd in plaats van een foutmelding te veroorzaken.


Deze documentatie maakt deel uit van het mindzie Studio process mining platform.