Texto Final

Visión General

El enriquecimiento Texto Final extrae un número especificado de caracteres desde el final de los valores de atributos de texto, creando un nuevo atributo que contiene el sufijo extraído. Este poderoso operador de manipulación de texto permite aislar y analizar las porciones finales de campos de texto, que a menudo contienen información crítica de identificación, códigos de clasificación o sufijos estandarizados. Al enfocarse en los caracteres más a la derecha de los valores de texto, puede extraer patrones y categorías significativas que comúnmente se añaden al final de identificadores empresariales.

En minería de procesos, el enriquecimiento Texto Final es particularmente valioso para trabajar con códigos estructurados e identificadores donde la porción final tiene un significado específico. Muchos sistemas empresariales utilizan sufijos para denotar categorías, regiones, tipos de producto o indicadores de estado. Por ejemplo, los números de factura pueden terminar con códigos de país, los SKU de productos pueden incluir sufijos de categoría, o los ID de casos pueden contener identificadores de departamento. Este enriquecimiento permite extraer estos finales significativos para análisis, filtrado y detección de variantes de proceso. El operador funciona tanto con atributos de caso como con atributos de evento, proporcionando flexibilidad en cómo extraer y analizar patrones de texto a lo largo de sus datos de proceso.

Usos Comunes

Extraer extensiones de archivos de nombres de documentos para analizar tipos de documentos en procesos de aprobación
Aislar códigos de país o región desde el final de identificadores de clientes o proveedores
Extraer sufijos de departamento o equipo de IDs de casos para análisis organizacional
Recuperar códigos de categoría de productos desde el final de números SKU para análisis de inventario
Identificar números de versión o códigos de revisión desde el final de referencias documentales
Extraer indicadores de estado o banderas añadidas a códigos de transacción
Aislar indicadores de año o período desde números de referencia financiera

Configuración

Nombre del Nuevo Atributo: Especifique el nombre para el nuevo atributo que almacenará el final de texto extraído. Elija un nombre descriptivo que indique claramente qué información se está extrayendo del texto origen. Por ejemplo, use "File_Extension" al extraer tipos de archivo, "Country_Code" al extraer identificadores de ubicación, o "Category_Suffix" al extraer códigos de clasificación. El nombre debe ser único y no puede generar conflicto con atributos existentes en su conjunto de datos.

Nombre de la Columna: Seleccione el atributo de texto del que desea extraer los caracteres finales. Este menú desplegable presenta todos los atributos de texto disponibles tanto a nivel de caso como de evento. El enriquecimiento detecta automáticamente si el atributo seleccionado es de caso o de evento y crea el nuevo atributo en el mismo nivel. Sólo estarán disponibles para selección atributos de texto (tipo string) que no estén ocultos.

Longitud: Especifique el número de caracteres a extraer desde el final del valor de texto. Esto debe ser un entero positivo (valor mínimo 1). Si la longitud especificada supera la longitud real de un valor de texto, se devolverá el valor completo. Por ejemplo, si especifica una longitud de 3 y un valor tiene sólo 2 caracteres, se extraerá el valor completo de 2 caracteres. Considere la longitud máxima esperada del sufijo que desea extraer para evitar capturar caracteres innecesarios.

Ejemplos

Ejemplo 1: Extracción de extensiones de archivo de nombres de documentos

Escenario: En un proceso de aprobación documental, necesita analizar qué tipos de documento se presentan más comúnmente y sus tiempos de procesamiento. Los nombres de documentos se almacenan con sus extensiones de archivo y desea extraer estas extensiones para categorización.

Configuración:

Nombre del Nuevo Atributo: Document_Type
Nombre de la Columna: Document_Name
Longitud: 4

Resultado: Crea un nuevo atributo "Document_Type" que contiene los últimos 4 caracteres de cada nombre de documento. Para casos con nombres de documento:

"Q3_Report_2024.pdf" → ".pdf"
"Contract_Amendment.docx" → "docx"
"Invoice_10245.xlsx" → "xlsx"
"Presentation.ppt" → ".ppt"

Observaciones: Al extraer las extensiones de archivo, puede analizar qué tipos de documento requieren tiempos de aprobación más largos, identificar departamentos que trabajan con formatos de archivo específicos y detectar posibles problemas de cumplimiento con tipos de archivos no autorizados.

Ejemplo 2: Aislamiento de códigos de país de IDs de proveedores

Escenario: En un proceso global de adquisiciones, los IDs de proveedores terminan con códigos de país de dos letras. Necesita extraer estos códigos para analizar patrones de compra por país y asegurar el cumplimiento de políticas de abastecimiento regional.

Configuración:

Nombre del Nuevo Atributo: Supplier_Country
Nombre de la Columna: Supplier_ID
Longitud: 2

Resultado: Crea un nuevo atributo de caso "Supplier_Country" con el código de país. Para proveedores:

"SUP-2024-0145-US" → "US"
"SUP-2024-0892-DE" → "DE"
"SUP-2024-0234-CN" → "CN"
"SUP-2024-0567-BR" → "BR"

Observaciones: Esta extracción permite el análisis geográfico de la distribución de proveedores, cálculo de métricas regionales de compra e identificación del cumplimiento con requisitos locales de abastecimiento.

Ejemplo 3: Extracción de códigos de departamento de IDs de casos

Escenario: En un sistema de registro de pacientes de salud, los IDs de casos incluyen un código de departamento de tres caracteres al final. Necesita extraer estos códigos para analizar el flujo de pacientes entre diferentes departamentos e identificar cuellos de botella.

Configuración:

Nombre del Nuevo Atributo: Department_Code
Nombre de la Columna: Case_ID
Longitud: 3

Resultado: Crea un nuevo atributo "Department_Code" que contiene identificadores de departamento. Para IDs de caso:

"PAT-2024-10523-EMR" → "EMR" (Emergencias)
"PAT-2024-10524-RAD" → "RAD" (Radiología)
"PAT-2024-10525-LAB" → "LAB" (Laboratorio)
"PAT-2024-10526-SUR" → "SUR" (Cirugía)

Observaciones: Extraer códigos de departamento permite analizar patrones de derivación de pacientes, identificar retrasos específicos de departamento y comparar tiempos de procesamiento entre diferentes unidades médicas.

Ejemplo 4: Recuperación de categorías de producto desde números SKU

Escenario: En un proceso de gestión de inventario minorista, los SKU de producto terminan con un código de categoría de dos caracteres. Desea extraer estos códigos para analizar la rotación de inventario por categoría de producto y optimizar niveles de stock.

Configuración:

Nombre del Nuevo Atributo: Product_Category
Nombre de la Columna: SKU_Number
Longitud: 2

Resultado: Crea un nuevo atributo "Product_Category" con códigos de categoría. Para los SKU:

"PROD-854621-EL" → "EL" (Electrónica)
"PROD-854622-CL" → "CL" (Ropa)
"PROD-854623-FD" → "FD" (Alimentos)
"PROD-854624-TY" → "TY" (Juguetes)

Observaciones: La extracción de categoría permite analizar patrones de inventario específicos por categoría, identificar tipos de producto con baja rotación y optimizar puntos de reorden por categoría de producto.

Ejemplo 5: Extracción de indicadores de año desde referencias financieras

Escenario: En un proceso de cuentas por pagar, los números de factura terminan con un año de cuatro dígitos. Necesita extraer el año para analizar patrones de pago a lo largo del tiempo e identificar facturas antigüas.

Configuración:

Nombre del Nuevo Atributo: Invoice_Year
Nombre de la Columna: Invoice_Number
Longitud: 4

Resultado: Crea un nuevo atributo "Invoice_Year" que contiene el año. Para números de factura:

"INV-US-054321-2024" → "2024"
"INV-EU-098765-2023" → "2023"
"INV-AP-012345-2024" → "2024"
"INV-LA-067890-2022" → "2022"

Observaciones: La extracción del año permite analizar tendencias en los tiempos de procesamiento de facturas, identificar facturas impagas antiguas y comparar métricas de rendimiento de pago año tras año.

Resultado

El enriquecimiento Texto Final crea un nuevo atributo (ya sea a nivel de caso o evento, acorde al nivel del atributo fuente) que contiene el texto extraído desde el final de los valores originales. El nuevo atributo es siempre de tipo de dato string, independientemente de lo que represente el contenido extraído. El atributo se añade automáticamente a la tabla correspondiente (caso o evento) y queda disponible de inmediato para su uso en filtros, calculadoras y otros enriquecimientos.

Para atributos de caso, la extracción se realiza una vez por caso, almacenándose el resultado a nivel de caso. Para atributos de evento, la extracción se realiza para cada evento, permitiendo analizar cómo los sufijos pueden variar entre diferentes actividades de su proceso. Si el valor fuente es nulo o vacío, el nuevo atributo también será nulo para ese caso o evento.

El texto extraído preserva exactamente los caracteres del final de la cadena fuente, incluidos caracteres especiales, números o signos de puntuación. Esto garantiza que sufijos significativos como extensiones de archivo (incluyendo el punto) o códigos compuestos sean capturados con precisión. El enriquecimiento gestiona textos de fuente de longitud variable con soltura: si un valor fuente es más corto que la longitud especificada para extracción, se devuelve el valor completo en lugar de generar un error.

Esta documentación es parte de la plataforma de minería de procesos mindzieStudio.