Tekst Vervangen
Overzicht
De Replace Text verrijking is een krachtige data transformatie-operator die zoek-en-vervang bewerkingen uitvoert op tekstattributen door je hele dataset heen. Deze verrijking maakt systematische tekstvervanging mogelijk over case- en eventattributen, zodat je terminologie kunt standaardiseren, systematische fouten corrigeren of dataformaten consistent kunt transformeren. Of je nu verouderde productcodes wilt vervangen, afdelingsnamen wilt standaardiseren of terugkerende typfouten in je procesdata wilt corrigeren, deze verrijking biedt een betrouwbare en efficiënte oplossing voor bulk tekstwijzigingen.
In tegenstelling tot handmatige zoek-en-vervang bewerkingen die het risico lopen dat zaken worden gemist of inconsistenties ontstaan, verwerkt deze verrijking elke instantie van het gespecificeerde tekstpatroon over alle geselecteerde attributen. De verrijking ondersteunt zowel hoofdlettergevoelige als niet-hoofdlettergevoelige vervangingsmodi, waardoor je nauwkeurige controle hebt over hoe tekstmatching plaatsvindt. Deze flexibiliteit is essentieel bij het omgaan met data uit meerdere bronnen waarbij hoofdletters en kleine letters kunnen variëren, zoals bij het integreren van gegevens uit verschillende ERP-systemen of regionale kantoren.
De Replace Text verrijking werkt direct op de stringattributen van je dataset en wijzigt waarden ter plaatse om dataverhoudingen en integriteit te behouden. Deze aanpak zorgt ervoor dat alle vervolganalyses, filters en berekeningen automatisch profiteren van de gestandaardiseerde tekstwaarden zonder dat extra configuratie of gegevensmapping nodig is.
Veelvoorkomende Toepassingen
- Standaardiseren van verschillende afdelings- of locatienamen over verschillende systemen (bijv. "NY Office", "New York", "NYC" vervangen door een standaard "New York Office")
- Bijwerken van verouderde productcodes of SKU's na systeemmigraties of rebranding
- Corrigeren van systematische spelfouten of afkortingen in activiteitennamen voor duidelijkere procesvisualisatie
- Vervangen van gevoelige informatie door geanonimiseerde waarden voor naleving van privacyregelgeving
- Standaardiseren van datum- of tijdformaten in tekstvelden door vervanging van scheidingstekens of opmaaktekens
- Transformeren van statuscodes of afkortingen naar leesbare zakelijke termen voor betere rapportage
- Harmoniseren van leveranciers- of klantnamen die meerdere variaties hebben in de brondataset
Instellingen
Attribute Name: Selecteer het tekstattribuut waarop je de vervangingsbewerking wilt uitvoeren. De dropdown toont alle beschikbare stringattributen van zowel case- als event-level data. Alleen tekst (string) type attributen die niet verborgen of berekend zijn, zijn beschikbaar voor selectie. Kies het specifieke attribuut dat de tekstwaarden bevat die je wilt wijzigen.
Original Text: Voer de exacte tekst in die je wilt zoeken en vervangen binnen het geselecteerde attribuut. Dit is het zoekpatroon dat in je data wordt gematcht. De tekst moet exact overeenkomen (rekening houdend met de instelling Ignore Case) om vervanging te laten plaatsvinden. Laat dit veld leeg als je lege strings wilt vervangen door een specifieke waarde. Veelvoorkomende voorbeelden zijn verouderde codes, spelfouten of inconsistente terminologie.
New Text: Specificeer de vervangende tekst die alle voorkomens van de Original Text zal vervangen. Dit kan elke tekstwaarde zijn, inclusief een lege string als je de originele tekst volledig wilt verwijderen. De nieuwe tekst vervangt elke gematchte instantie binnen de attribuutwaarden. Houd rekening met de impact op vervolgprocessen en zorg dat de nieuwe tekst de dataintegriteit en betekenis behoudt.
Ignore Case: Schakel deze optie in om hoofdletterongevoelige matching uit te voeren bij het zoeken naar de Original Text. Wanneer aangevinkt, zal de verrijking tekst matchen ongeacht hoofd- of kleine letters (bijv. "approved", "Approved" en "APPROVED" worden allemaal gematcht). Wanneer uitgevinkt, worden alleen exacte hoofdletterovereenkomsten vervangen. Deze instelling is vooral handig bij inconsistente hoofdlettergebruik door handmatige datainvoer of verschillende bronsystemen.
Voorbeelden
Voorbeeld 1: Standaardiseren van Afdelingsnamen in Inkooporders
Scenario: Een multinational moet afdelingsnamen standaardiseren in hun inkoopsysteem waarbij "Information Technology", "IT Dept", "I.T." en "InfoTech" allemaal naar dezelfde afdeling verwijzen, wat gefragmenteerde bestedanalyse en goedkeuringsproblemen veroorzaakt.
Instellingen:
- Attribute Name: Department
- Original Text: IT Dept
- New Text: Information Technology
- Ignore Case: Aangevinkt
Output: De verrijking vervangt alle voorkomens van "IT Dept" (en variaties zoals "it dept", "It Dept") door "Information Technology" in het Department attribuut. Na meerdere bewerkingen met verschillende originele teksten ("I.T.", "InfoTech", etc.) zijn alle afdelingsverwijzingen gestandaardiseerd.
Voor: | Case ID | Department | Amount | |---------|------------|--------| | PO-001 | IT Dept | $5,000 | | PO-002 | Information Technology | $3,000 | | PO-003 | it dept | $2,500 | | PO-004 | I.T. | $4,000 |
Na: | Case ID | Department | Amount | |---------|------------|--------| | PO-001 | Information Technology | $5,000 | | PO-002 | Information Technology | $3,000 | | PO-003 | Information Technology | $2,500 | | PO-004 | Information Technology | $4,000 |
Inzichten: Na standaardisatie ontdekte het bedrijf dat Information Technology eigenlijk $14.500 aan inkooporders vertegenwoordigde in plaats van vier afzonderlijke afdelingen met onduidelijke bestedingspatronen. Dit stelde hen in staat om het budget beter te beheren en kansen voor volumekortingen bij leveranciers te ontdekken.
Voorbeeld 2: Bijwerken van Productcodes na Systeemmigratie
Scenario: Een detailhandel ging over op een nieuw voorraadbeheersysteem met bijgewerkte productcoderingen, waarbij alle oude formatcodes (bijv. "PROD-") vervangen moesten worden door nieuwe formatcodes (bijv. "SKU-") in historische orderdata voor nauwkeurige voorraadvereffening.
Instellingen:
- Attribute Name: Product_Code
- Original Text: PROD-
- New Text: SKU-
- Ignore Case: Uitgevinkt
Output: Alle productcodes die beginnen met "PROD-" worden bijgewerkt naar beginnen met "SKU-", waarbij de numerieke delen worden behouden en het prefix wordt aangepast aan het nieuwe systeem.
Voor: | Case ID | Product_Code | Quantity | Order_Date | |---------|--------------|----------|------------| | ORD-501 | PROD-12345 | 10 | 2024-01-15 | | ORD-502 | PROD-67890 | 5 | 2024-01-16 | | ORD-503 | prod-12345 | 3 | 2024-01-16 | | ORD-504 | PROD-54321 | 8 | 2024-01-17 |
Na: | Case ID | Product_Code | Quantity | Order_Date | |---------|--------------|----------|------------| | ORD-501 | SKU-12345 | 10 | 2024-01-15 | | ORD-502 | SKU-67890 | 5 | 2024-01-16 | | ORD-503 | prod-12345 | 3 | 2024-01-16 | | ORD-504 | SKU-54321 | 8 | 2024-01-17 |
Inzichten: Let op dat "prod-12345" niet werd vervangen omdat de zoekactie hoofdlettergevoelig was. Dit hielp bij het identificeren van 47 orders met onjuiste kleine-letter productcodes die aparte kwaliteitsonderzoeken vereisten, waarmee een specifieke datainvoerfout bij één magazijnlocatie werd blootgelegd.
Voorbeeld 3: Anonimiseren van Klantnamen voor Naleving
Scenario: Een zorgverlener moet patiëntnamen anonimiseren in hun afsprakenschema procesdata voor onderzoeksdoeleinden, terwijl het onderscheid tussen verschillende patiënten behouden blijft.
Instellingen:
- Attribute Name: Patient_Name
- Original Text: Smith, John
- New Text: Patient_001
- Ignore Case: Uitgevinkt
Output: Specifieke patiëntnamen worden vervangen door geanonimiseerde identificaties, waardoor procesanalyse mogelijk is terwijl patiëntprivacy wordt beschermd volgens HIPAA-eisen.
Voor: | Case ID | Patient_Name | Appointment_Type | Department | |---------|--------------|------------------|------------| | APT-101 | Smith, John | Initial Consultation | Cardiology | | APT-102 | Jones, Mary | Follow-up | Orthopedics | | APT-103 | Smith, John | Test Results | Cardiology | | APT-104 | Brown, David | Emergency | Emergency |
Na (eerste vervanging): | Case ID | Patient_Name | Appointment_Type | Department | |---------|--------------|------------------|------------| | APT-101 | Patient_001 | Initial Consultation | Cardiology | | APT-102 | Jones, Mary | Follow-up | Orthopedics | | APT-103 | Patient_001 | Test Results | Cardiology | | APT-104 | Brown, David | Emergency | Emergency |
Inzichten: Het anonimisatietraject behield de relatie tussen afspraken van dezelfde patiënt terwijl persoonlijk identificeerbare informatie werd verwijderd. Procesmining toonde aan dat patiënten met initiële cardiologieconsulten een opvolgingspercentage van 73% hadden binnen 30 dagen.
Voorbeeld 4: Corrigeren van Typos in Activiteitennamen in Productie
Scenario: Het MES-systeem van een productiefabriek heeft inconsistente activiteitennamen waar operators soms "Quaility Check" typen in plaats van "Quality Check", wat procesconformiteitscontroles onterecht afwijkingen liet aangeven.
Instellingen:
- Attribute Name: Activity
- Original Text: Quaility Check
- New Text: Quality Check
- Ignore Case: Aangevinkt
Output: Alle verkeerd gespelde instanties van kwaliteitscontroles worden gecorrigeerd, ongeacht hoofdlettergebruik, voor accurate procesontdekking en conformiteitsanalyse.
Event Data Voor: | Case ID | Activity | Timestamp | Resource | |---------|----------|-----------|----------| | WO-801 | Material Receipt | 2024-02-01 08:00 | Warehouse | | WO-801 | Quaility Check | 2024-02-01 09:15 | QC Team | | WO-801 | Assembly Start | 2024-02-01 10:00 | Line 1 | | WO-802 | Material Receipt | 2024-02-01 08:30 | Warehouse | | WO-802 | QUAILITY CHECK | 2024-02-01 09:45 | QC Team |
Event Data Na: | Case ID | Activity | Timestamp | Resource | |---------|----------|-----------|----------| | WO-801 | Material Receipt | 2024-02-01 08:00 | Warehouse | | WO-801 | Quality Check | 2024-02-01 09:15 | QC Team | | WO-801 | Assembly Start | 2024-02-01 10:00 | Line 1 | | WO-802 | Material Receipt | 2024-02-01 08:30 | Warehouse | | WO-802 | Quality Check | 2024-02-01 09:45 | QC Team |
Inzichten: Na correctie toonde conformiteitscontrole dat 98% van de werkorders het standaardproces met kwaliteitscontroles correct volgde, in tegenstelling tot 67% vóór correctie. Dit onthulde dat het waargenomen procesnalevingsprobleem eigenlijk een datakwaliteitsprobleem was.
Voorbeeld 5: Standaardiseren van Statuscodes Over Systemen
Scenario: Een logistiek bedrijf integreert verzendgegevens van drie verschillende vervoerdersystemen, ieder met eigen codes voor leveringsstatus ("DLVRD", "Delivered", "COMPLETE"), wat standaardisatie vereist voor uniforme track-en-trace dashboards.
Instellingen:
- Attribute Name: Delivery_Status
- Original Text: DLVRD
- New Text: Delivered
- Ignore Case: Uitgevinkt
Output: Vervoerderspecifieke statuscodes worden vervangen door gestandaardiseerde zakelijke termen, wat consistente statusrapportage over alle verzendbronnen mogelijk maakt.
Voor: | Case ID | Carrier | Delivery_Status | Delivery_Date | |---------|---------|-----------------|---------------| | SHP-901 | CarrierA | DLVRD | 2024-03-01 | | SHP-902 | CarrierB | Delivered | 2024-03-01 | | SHP-903 | CarrierC | COMPLETE | 2024-03-01 | | SHP-904 | CarrierA | DLVRD | 2024-03-02 |
Na (eerste vervanging): | Case ID | Carrier | Delivery_Status | Delivery_Date | |---------|---------|-----------------|---------------| | SHP-901 | CarrierA | Delivered | 2024-03-01 | | SHP-902 | CarrierB | Delivered | 2024-03-01 | | SHP-903 | CarrierC | COMPLETE | 2024-03-01 | | SHP-904 | CarrierA | Delivered | 2024-03-02 |
Inzichten: Na aanvullende vervangingen voor "COMPLETE" en andere variaties kon het logistieke team accuraat rapporteren dat 94% van de zendingen op tijd geleverd werden, in tegenstelling tot gefragmenteerde rapportage per vervoerder die het totale prestatieniveau verborgen hield.
Output
De Replace Text verrijking wijzigt de geselecteerde attribuutwaarden direct binnen je dataset en voert daarbij plaatselijke vervanging uit van de opgegeven tekstpatronen. De verrijking behoudt de originele attribuutstructuur en datatype terwijl alleen de tekstinhoud die overeenkomt met je zoekcriteria wordt bijgewerkt.
Voor caseattributen vindt de vervanging één keer per case plaats, waarbij de attribuutwaarde wordt aangepast die aan elke case is gekoppeld. Voor eventattributen wordt de vervanging op elk event in je dataset uitgevoerd, mogelijk meerdere voorkomens binnen dezelfde case updateend. De verrijking behoudt null-waarden en verwerkt alleen niet-null stringwaarden binnen het geselecteerde attribuut.
Na uitvoering behoudt het gewijzigde attribuut zijn originele naam en positie in je dataset maar bevat het bijgewerkte tekstwaarden. Deze wijzigingen beïnvloeden direct alle afhankelijke berekeningen, filters en visualisaties die naar het gewijzigde attribuut verwijzen. De verrijking maakt geen nieuwe attributen of back-up kolommen aan - het transformeert de bestaande data direct volgens jouw specificaties.
De vervangingsbewerking is standaard hoofdlettergevoelig maar kan worden ingesteld op niet-hoofdlettergevoelig zoeken via de Ignore Case optie. Bij hoofdletterongevoelige vervangingen blijft de originele hoofdlettergebruik in niet-gematchte delen behouden, terwijl het gematchte gedeelte volledig wordt vervangen door de opgegeven New Text waarde.
Zie ook
- Trim Text - Verwijder spaties aan het begin en einde van tekstattributen
- Text Start - Haal een specifiek aantal tekens uit het begin van tekstwaarden
- Text End - Haal een specifiek aantal tekens uit het einde van tekstwaarden
- Group Attribute Values - Combineer meerdere attribuutwaarden in gestandaardiseerde categorieën
- Categorize Attribute Values - Maak categorieën gebaseerd op attribuutwaarde bereiken of patronen
- Concatenate Text Attributes - Combineer meerdere tekstattributen in één veld
Deze documentatie maakt deel uit van het mindzie Studio proces mining platform.