Reemplazar Texto
Visión General
El enriquecimiento Reemplazar Texto es un operador de transformación de datos potente que realiza operaciones de búsqueda y reemplazo en atributos de texto a lo largo de su conjunto de datos. Este enriquecimiento permite la sustitución sistemática de texto en atributos de caso y evento, lo que le permite estandarizar terminología, corregir errores sistemáticos o transformar formatos de datos de manera consistente. Ya sea que necesite reemplazar códigos de productos obsoletos, estandarizar nombres de departamentos o corregir errores tipográficos recurrentes en sus datos de procesos, este enriquecimiento proporciona una solución confiable y eficiente para modificaciones masivas de texto.
A diferencia de las operaciones manuales de búsqueda y reemplazo que corren el riesgo de pasar por alto ocurrencias o introducir inconsistencias, este enriquecimiento procesa cada instancia del patrón de texto especificado en todos los atributos seleccionados. El enriquecimiento soporta modos de reemplazo sensibles y no sensibles a mayúsculas, brindándole un control preciso sobre cómo se produce la coincidencia de texto. Esta flexibilidad es esencial cuando se trabaja con datos de múltiples fuentes donde las convenciones de capitalización pueden variar, como al integrar datos de diferentes sistemas ERP u oficinas regionales.
El enriquecimiento Reemplazar Texto opera directamente sobre los atributos de tipo cadena de su conjunto de datos, modificando los valores en el lugar para mantener las relaciones e integridad de los datos. Este enfoque asegura que todos los análisis, filtros y cálculos posteriores se beneficien automáticamente de los valores de texto estandarizados sin requerir configuraciones adicionales o pasos de mapeo de datos.
Usos Comunes
- Estandarizar nombres variaciones de departamentos o ubicaciones entre diferentes sistemas (ej., reemplazar "NY Office", "New York", "NYC" por un estándar "New York Office")
- Actualizar códigos de productos o SKUs obsoletos tras migraciones de sistema o iniciativas de rebranding
- Corregir errores ortográficos sistemáticos o abreviaturas en nombres de actividades para una visualización más clara del proceso
- Reemplazar información sensible con valores anonimados para cumplir regulaciones de privacidad de datos
- Estandarizar formatos de fecha u hora en campos de texto reemplazando separadores o caracteres de formato
- Transformar códigos de estado o abreviaturas en términos de negocio legibles para mejores reportes
- Armonizar nombres de proveedores o clientes que tienen múltiples variaciones en los datos fuente
Configuración
Attribute Name: Seleccione el atributo de texto donde desea realizar la operación de reemplazo. El menú desplegable muestra todos los atributos de tipo cadena disponibles tanto a nivel de caso como a nivel de evento. Solo están disponibles para selección los atributos de tipo texto (cadena) que no estén ocultos ni sean campos calculados. Elija el atributo específico que contiene los valores de texto que necesita modificar.
Original Text: Introduzca la cadena de texto exacta que desea buscar y reemplazar dentro del atributo seleccionado. Este es el patrón de búsqueda que se buscará en sus datos. El texto debe coincidir exactamente (considerando la configuración Ignorar Mayúsculas) para que se realice el reemplazo. Deje este campo vacío si desea reemplazar cadenas vacías por un valor específico. Ejemplos comunes incluyen códigos obsoletos, errores ortográficos o terminología inconsistente.
New Text: Especifique el texto de reemplazo que sustituirá todas las ocurrencias del Texto Original. Puede ser cualquier valor de texto, incluida una cadena vacía si desea eliminar completamente el texto original. El nuevo texto reemplazará cada ocurrencia coincidente dentro de los valores del atributo. Considere el impacto en procesos posteriores y asegúrese de que el nuevo texto mantenga la integridad y el significado de los datos.
Ignore Case: Active esta opción para realizar coincidencias sin distinguir mayúsculas o minúsculas al buscar el Texto Original. Si está marcada, el enriquecimiento coincidirá con el texto sin importar diferencias de mayúsculas/minúsculas (por ejemplo, "approved", "Approved" y "APPROVED" se considerarán iguales). Si no está marcada, solo se reemplazarán coincidencias exactas en cuanto a mayúsculas. Esta configuración es particularmente útil cuando se trabaja con capitalización inconsistente por entrada manual de datos o diferentes sistemas fuente.
Ejemplos
Ejemplo 1: Estandarización de Nombres de Departamento en Órdenes de Compra
Escenario: Una corporación multinacional necesita estandarizar nombres de departamentos en su sistema de órdenes de compra donde "Information Technology", "IT Dept", "I.T." y "InfoTech" se refieren al mismo departamento, causando análisis fragmentados de gastos y problemas en el enrutamiento de aprobaciones.
Configuración:
- Attribute Name: Department
- Original Text: IT Dept
- New Text: Information Technology
- Ignore Case: Marcado
Resultado: El enriquecimiento reemplaza todas las ocurrencias de "IT Dept" (y variaciones como "it dept", "It Dept") por "Information Technology" en el atributo Department. Tras realizar varias pasadas con diferentes valores originales ("I.T.", "InfoTech", etc.), todas las referencias al departamento quedan estandarizadas.
Antes: | Case ID | Department | Amount | |---------|------------|--------| | PO-001 | IT Dept | $5,000 | | PO-002 | Information Technology | $3,000 | | PO-003 | it dept | $2,500 | | PO-004 | I.T. | $4,000 |
Después: | Case ID | Department | Amount | |---------|------------|--------| | PO-001 | Information Technology | $5,000 | | PO-002 | Information Technology | $3,000 | | PO-003 | Information Technology | $2,500 | | PO-004 | Information Technology | $4,000 |
Perspectivas: Tras la estandarización, la empresa descubrió que Information Technology realmente representaba $14,500 en órdenes de compra en lugar de aparecer como cuatro departamentos separados con patrones de gasto poco claros. Esto permitió un seguimiento adecuado del presupuesto y reveló oportunidades para descuentos por volumen con proveedores.
Ejemplo 2: Actualización de Códigos de Producto Después de Migración de Sistema
Escenario: Una empresa minorista migró a un nuevo sistema de inventario con estándares actualizados de codificación de productos, requiriendo reemplazar todos los códigos en formato antiguo (ej., "PROD-") por códigos en formato nuevo (ej., "SKU-") a lo largo de datos históricos de pedidos para una conciliación de inventario precisa.
Configuración:
- Attribute Name: Product_Code
- Original Text: PROD-
- New Text: SKU-
- Ignore Case: Desmarcado
Resultado: Todos los códigos de producto que comienzan con "PROD-" se actualizan para comenzar con "SKU-", manteniendo las partes numéricas mientras se actualiza el prefijo para coincidir con el nuevo formato del sistema.
Antes: | Case ID | Product_Code | Quantity | Order_Date | |---------|--------------|----------|------------| | ORD-501 | PROD-12345 | 10 | 2024-01-15 | | ORD-502 | PROD-67890 | 5 | 2024-01-16 | | ORD-503 | prod-12345 | 3 | 2024-01-16 | | ORD-504 | PROD-54321 | 8 | 2024-01-17 |
Después: | Case ID | Product_Code | Quantity | Order_Date | |---------|--------------|----------|------------| | ORD-501 | SKU-12345 | 10 | 2024-01-15 | | ORD-502 | SKU-67890 | 5 | 2024-01-16 | | ORD-503 | prod-12345 | 3 | 2024-01-16 | | ORD-504 | SKU-54321 | 8 | 2024-01-17 |
Perspectivas: Nótese que "prod-12345" no fue reemplazado porque la búsqueda fue sensible a mayúsculas. Esto ayudó a identificar 47 pedidos con códigos de producto en minúsculas incorrectos que requirieron una investigación separada de calidad de datos, revelando un problema específico de entrada en un almacén.
Ejemplo 3: Anonimización de Nombres de Pacientes para Cumplimiento
Escenario: Un proveedor de salud necesita anonimizar nombres de pacientes en sus datos de programación de citas para fines de investigación, manteniendo la capacidad de distinguir entre diferentes pacientes.
Configuración:
- Attribute Name: Patient_Name
- Original Text: Smith, John
- New Text: Patient_001
- Ignore Case: Desmarcado
Resultado: Se reemplazan nombres específicos de pacientes con identificadores anonimizados, permitiendo el análisis del proceso mientras se protege la privacidad del paciente conforme a los requisitos de HIPAA.
Antes: | Case ID | Patient_Name | Appointment_Type | Department | |---------|--------------|------------------|------------| | APT-101 | Smith, John | Initial Consultation | Cardiology | | APT-102 | Jones, Mary | Follow-up | Orthopedics | | APT-103 | Smith, John | Test Results | Cardiology | | APT-104 | Brown, David | Emergency | Emergency |
Después (primer reemplazo): | Case ID | Patient_Name | Appointment_Type | Department | |---------|--------------|------------------|------------| | APT-101 | Patient_001 | Initial Consultation | Cardiology | | APT-102 | Jones, Mary | Follow-up | Orthopedics | | APT-103 | Patient_001 | Test Results | Cardiology | | APT-104 | Brown, David | Emergency | Emergency |
Perspectivas: El proceso de anonimización preservó la relación entre citas para el mismo paciente mientras eliminaba información personal identificable. La minería de procesos reveló que los pacientes con consultas iniciales en cardiología tenían una tasa del 73% de citas de seguimiento dentro de 30 días.
Ejemplo 4: Corrección de Errores Tipográficos en Nombres de Actividad en Manufactura
Escenario: El sistema MES de una planta manufacturera tiene nombres de actividad inconsistentes donde los operadores a veces escriben "Quaility Check" en lugar de "Quality Check", causando que la verificación de conformidad del proceso señale desviaciones incorrectas.
Configuración:
- Attribute Name: Activity
- Original Text: Quaility Check
- New Text: Quality Check
- Ignore Case: Marcado
Resultado: Se corrigen todas las instancias mal escritas de actividades de control de calidad, sin importar variaciones en mayúsculas, asegurando un descubrimiento y análisis de conformidad del proceso precisos.
Datos de Evento Antes: | Case ID | Activity | Timestamp | Resource | |---------|----------|-----------|----------| | WO-801 | Material Receipt | 2024-02-01 08:00 | Warehouse | | WO-801 | Quaility Check | 2024-02-01 09:15 | QC Team | | WO-801 | Assembly Start | 2024-02-01 10:00 | Line 1 | | WO-802 | Material Receipt | 2024-02-01 08:30 | Warehouse | | WO-802 | QUAILITY CHECK | 2024-02-01 09:45 | QC Team |
Datos de Evento Después: | Case ID | Activity | Timestamp | Resource | |---------|----------|-----------|----------| | WO-801 | Material Receipt | 2024-02-01 08:00 | Warehouse | | WO-801 | Quality Check | 2024-02-01 09:15 | QC Team | | WO-801 | Assembly Start | 2024-02-01 10:00 | Line 1 | | WO-802 | Material Receipt | 2024-02-01 08:30 | Warehouse | | WO-802 | Quality Check | 2024-02-01 09:45 | QC Team |
Perspectivas: Tras la corrección, la verificación de conformidad mostró que el 98% de las órdenes de trabajo siguieron adecuadamente el proceso estándar con controles de calidad, en lugar del 67% mostrado antes de la corrección. Esto reveló que el problema percibido de cumplimiento del proceso era en realidad un problema de calidad de datos.
Ejemplo 5: Estandarización de Códigos de Estado Entre Sistemas
Escenario: Una empresa logística integra datos de envíos de tres sistemas de transportistas diferentes, cada uno usando códigos distintos para el estado de entrega ("DLVRD", "Delivered", "COMPLETE"), requiriendo estandarización para paneles de seguimiento unificados.
Configuración:
- Attribute Name: Delivery_Status
- Original Text: DLVRD
- New Text: Delivered
- Ignore Case: Desmarcado
Resultado: Se reemplazan los códigos de estado específicos de cada transportista por términos de negocio estandarizados, permitiendo reportes de estado consistentes en todas las fuentes de envíos.
Antes: | Case ID | Carrier | Delivery_Status | Delivery_Date | |---------|---------|-----------------|---------------| | SHP-901 | CarrierA | DLVRD | 2024-03-01 | | SHP-902 | CarrierB | Delivered | 2024-03-01 | | SHP-903 | CarrierC | COMPLETE | 2024-03-01 | | SHP-904 | CarrierA | DLVRD | 2024-03-02 |
Después (primer reemplazo): | Case ID | Carrier | Delivery_Status | Delivery_Date | |---------|---------|-----------------|---------------| | SHP-901 | CarrierA | Delivered | 2024-03-01 | | SHP-902 | CarrierB | Delivered | 2024-03-01 | | SHP-903 | CarrierC | COMPLETE | 2024-03-01 | | SHP-904 | CarrierA | Delivered | 2024-03-02 |
Perspectivas: Tras realizar reemplazos adicionales para "COMPLETE" y otras variaciones, el equipo logístico pudo reportar con precisión que el 94% de los envíos fueron entregados a tiempo, en comparación con reportes fragmentados por sistema de transportista que oscurecían los indicadores generales de desempeño.
Salida
El enriquecimiento Reemplazar Texto modifica los valores del atributo seleccionado directamente dentro de su conjunto de datos, realizando el reemplazo in situ de los patrones de texto especificados. El enriquecimiento mantiene la estructura original del atributo y el tipo de dato mientras actualiza solo el contenido de texto que coincide con sus criterios de búsqueda.
Para atributos de caso, el reemplazo ocurre una vez por caso, afectando el valor del atributo asociado a cada caso. Para atributos de evento, el reemplazo procesa cada evento en su conjunto de datos, potencialmente actualizando múltiples ocurrencias dentro del mismo caso. El enriquecimiento preserva valores nulos y solo procesa valores de cadena no nulos dentro del atributo seleccionado.
Tras la ejecución, el atributo modificado mantiene su nombre original y posición en su conjunto de datos pero contiene los valores de texto actualizados. Estos cambios afectan inmediatamente todos los cálculos dependientes, filtros y visualizaciones que referencian el atributo modificado. El enriquecimiento no crea nuevos atributos ni columnas de respaldo: transforma directamente los datos existentes según sus especificaciones.
La operación de reemplazo es sensible a mayúsculas por defecto pero puede configurarse para coincidencia insensible a mayúsculas utilizando la opción Ignorar Mayúsculas. Al realizar reemplazos insensibles a mayúsculas, se conserva la capitalización original de las porciones del texto que no coinciden, mientras que la porción coincidente se reemplaza completamente con el valor del Nuevo Texto especificado.
Véase También
- Trim Text - Eliminar espacios en blanco al inicio y final de atributos de texto
- Text Start - Extraer un número especificado de caracteres desde el inicio de valores de texto
- Text End - Extraer un número especificado de caracteres desde el final de valores de texto
- Group Attribute Values - Combinar múltiples valores de un atributo en categorías estandarizadas
- Categorize Attribute Values - Crear categorías basadas en rangos o patrones de valores de atributo
- Concatenate Text Attributes - Combinar múltiples atributos de texto en un solo campo
Esta documentación es parte de la plataforma de minería de procesos mindzie Studio.