Text Start

Resumen

El enriquecimiento Text Start extrae un número especificado de caracteres desde el inicio del valor de un atributo de texto, creando un nuevo atributo que contiene el prefijo extraído. Este enriquecimiento potente le permite extraer y analizar sistemáticamente las partes iniciales de datos de texto, tales como códigos de producto, identificadores de departamentos, prefijos de ubicación o cualquier otro patrón significativo que aparezca al principio de los valores de atributo.

En minería de procesos, Text Start es invaluable para estandarizar y categorizar datos basándose en prefijos de texto. Por ejemplo, puede extraer los primeros tres caracteres de números de factura para identificar oficinas regionales, obtener códigos de departamento de identificadores de empleados o extraer identificadores de líneas de producto de los SKU. Al crear nuevos atributos con estos prefijos extraídos, puede realizar análisis más detallados, crear agrupaciones significativas y descubrir patrones que podrían estar escondidos en cadenas de texto más largas. Este enriquecimiento funciona con atributos a nivel de caso y a nivel de evento, proporcionando flexibilidad en cómo estructurar y analizar sus datos de proceso.

Usos Comunes

Extraer códigos de departamento de identificadores de empleados (ej., "FIN-12345" a "FIN")
Identificar identificadores regionales de números de factura o códigos de pedido
Obtener prefijos de categoría de productos de códigos SKU para análisis de inventario
Extraer códigos de área de números telefónicos para análisis geográfico
Identificar tipos de documento a partir de identificadores que siguen convenciones de nomenclatura
Crear agrupaciones basadas en prefijos estandarizados en números de referencia
Extraer identificadores de año o mes de códigos de texto basados en fechas

Configuración

Nombre del Nuevo Atributo: El nombre del nuevo atributo que será creado para almacenar el prefijo de texto extraído. Debe ser un nombre descriptivo que indique claramente qué información contiene el atributo. Por ejemplo, si se extraen códigos de departamento de identificadores de empleados, podría llamarse "DepartmentCode" o "EmployeeDept". El nuevo atributo se creará al mismo nivel (caso o evento) que el atributo fuente.

Nombre de la Columna: El atributo de texto fuente del cual desea extraer los caracteres iniciales. Este menú desplegable muestra todos los atributos de texto disponibles en su conjunto de datos que no estén ocultos. El enriquecimiento procesará cada valor en esta columna, extrayendo el número especificado de caracteres desde el inicio. Si un valor es más corto que la longitud especificada, se usará el valor completo.

Longitud: El número de caracteres que se extraerán desde el inicio del valor de texto. Debe ser un entero positivo (1 o mayor). Por ejemplo, configurarlo en 3 extraerá los primeros tres caracteres; configurarlo en 5 extraerá los primeros cinco caracteres. Si el texto fuente es más corto que la longitud especificada, el enriquecimiento usará el texto completo disponible, sin agregar relleno ni errores.

Ejemplos

Ejemplo 1: Extracción de Código de Departamento de IDs de Empleados

Escenario: Una organización de salud utiliza IDs de empleados que comienzan con códigos de departamento (ej., "NUR-45678" para enfermería, "ADM-12345" para administración, "LAB-98765" para laboratorio). Quieren analizar el rendimiento del proceso por departamento.

Configuración:

Nombre del Nuevo Atributo: DepartmentCode
Nombre de la Columna: EmployeeID
Longitud: 3

Resultado: El enriquecimiento crea un nuevo atributo de caso "DepartmentCode" con valores:

Empleado "NUR-45678" → DepartmentCode: "NUR"
Empleado "ADM-12345" → DepartmentCode: "ADM"
Empleado "LAB-98765" → DepartmentCode: "LAB"
Empleado "IT-5432" → DepartmentCode: "IT-" (incluye guion como parte de los primeros 3 caracteres)

Conclusiones: Con los códigos de departamento extraídos, la organización puede filtrar procesos por departamento, comparar tiempos de ciclo entre departamentos e identificar cuellos de botella o problemas de cumplimiento específicos de cada departamento.

Ejemplo 2: Identificación de Oficina Regional a partir de Números de Factura

Escenario: Una corporación multinacional usa números de factura cuyos dos primeros caracteres representan la oficina regional (ej., "US-INV-2024-0001" para Estados Unidos, "EU-INV-2024-0002" para Europa, "AP-INV-2024-0003" para Asia Pacífico).

Configuración:

Nombre del Nuevo Atributo: RegionalOffice
Nombre de la Columna: InvoiceNumber
Longitud: 2

Resultado: El enriquecimiento crea un nuevo atributo de caso "RegionalOffice" con valores:

Factura "US-INV-2024-0001" → RegionalOffice: "US"
Factura "EU-INV-2024-0002" → RegionalOffice: "EU"
Factura "AP-INV-2024-0003" → RegionalOffice: "AP"
Factura "UK-INV-2024-0004" → RegionalOffice: "UK"

Conclusiones: La empresa puede ahora analizar los tiempos de procesamiento de facturas por región, identificar variaciones regionales en flujos de aprobación y comparar el rendimiento entre oficinas para estandarizar mejores prácticas.

Ejemplo 3: Extracción de Línea de Producto a partir de Códigos SKU

Escenario: Una empresa manufacturera usa códigos SKU donde los primeros cuatro caracteres identifican la línea de producto (ej., "ELEC-TV-55-BLK" para electrónica, "FURN-CHR-WD-01" para muebles, "TOYS-DOL-12-PNK" para juguetes).

Configuración:

Nombre del Nuevo Atributo: ProductLine
Nombre de la Columna: SKUCode
Longitud: 4

Resultado: El enriquecimiento crea un nuevo atributo de evento "ProductLine" con valores:

SKU "ELEC-TV-55-BLK" → ProductLine: "ELEC"
SKU "FURN-CHR-WD-01" → ProductLine: "FURN"
SKU "TOYS-DOL-12-PNK" → ProductLine: "TOYS"
SKU "APP-SHT-L-BLU" → ProductLine: "APP-" (nota: código más corto, toma primeros 4 caracteres incluyendo guion)

Conclusiones: El fabricante puede analizar procesos de cumplimiento de pedidos por línea de producto, identificar cuáles tienen tiempos de entrega más largos y optimizar operaciones de almacén basándose en características de la línea de producto.

Ejemplo 4: Clasificación de Tipo de Documento en Compras

Escenario: Un sistema de compras usa IDs de documentos que empiezan con códigos de tres letras que indican el tipo de documento (ej., "POR-2024-0001" para órdenes de compra, "RFQ-2024-0002" para solicitudes de cotización, "CON-2024-0003" para contratos).

Configuración:

Nombre del Nuevo Atributo: DocumentType
Nombre de la Columna: DocumentID
Longitud: 3

Resultado: El enriquecimiento crea un nuevo atributo de caso "DocumentType" con valores:

Documento "POR-2024-0001" → DocumentType: "POR"
Documento "RFQ-2024-0002" → DocumentType: "RFQ"
Documento "CON-2024-0003" → DocumentType: "CON"
Documento "INV-2024-0004" → DocumentType: "INV"

Conclusiones: El equipo de compras puede seguir los tiempos de procesamiento por tipo de documento, asegurar que se sigan los flujos de aprobación adecuados para cada tipo y detectar cuáles tipos de documento experimentan más demoras o retrabajos.

Ejemplo 5: Extracción de Año a partir de Números de Referencia Basados en Fechas

Escenario: Una empresa de servicios financieros usa números de referencia que comienzan con el año (ej., "2024-FIN-00123", "2023-FIN-98765"). Quieren analizar tendencias y volúmenes por año.

Configuración:

Nombre del Nuevo Atributo: ReferenceYear
Nombre de la Columna: ReferenceNumber
Longitud: 4

Resultado: El enriquecimiento crea un nuevo atributo de caso "ReferenceYear" con valores:

Referencia "2024-FIN-00123" → ReferenceYear: "2024"
Referencia "2023-FIN-98765" → ReferenceYear: "2023"
Referencia "2022-FIN-45678" → ReferenceYear: "2022"
Referencia "2021-FIN-12345" → ReferenceYear: "2021"

Conclusiones: La empresa puede seguir volúmenes de transacciones por año, analizar mejoras del proceso año con año, identificar patrones estacionales y medir el impacto de cambios implementados en años específicos.

Salida

El enriquecimiento Text Start crea un nuevo atributo (ya sea a nivel de caso o de evento, coincidiendo con el nivel del atributo fuente) que contiene el prefijo de texto extraído. El nuevo atributo es siempre de tipo String y contendrá los primeros N caracteres de cada valor en la columna fuente, donde N es la longitud especificada.

El enriquecimiento maneja varios escenarios de forma adecuada:

Si el texto fuente es más largo que la longitud especificada, se extrae exactamente el número especificado de caracteres
Si el texto fuente es más corto o igual a la longitud especificada, se usa el texto completo
Si el valor fuente es nulo o está vacío, el nuevo atributo también será nulo para esa fila
Los caracteres especiales, espacios y puntuación se tratan como caracteres regulares y se incluyen en la extracción si están dentro de la longitud especificada

El nuevo atributo puede usarse inmediatamente en enriquecimientos posteriores, filtros y cálculos. Análisis comunes posteriores incluyen usar los prefijos extraídos en el enriquecimiento Group Attribute Values para crear categorías, aplicar filtros para enfocarse en prefijos específicos o usar los prefijos en verificaciones de conformidad para asegurar que se sigan estándares correctos de codificación.

Esta documentación es parte de la plataforma de minería de procesos mindzie Studio.