Ocultar Atributos Vacíos

Descripción General

El enriquecimiento Ocultar Atributos Vacíos es un operador automatizado de limpieza de datos que identifica y elimina todos los atributos (columnas) que no contienen datos en todo su conjunto de datos. Esta poderosa herramienta de limpieza escanea tanto atributos a nivel de caso como a nivel de evento, ocultando automáticamente cualquier columna donde cada fila contenga valores nulos o vacíos. Al eliminar estas columnas vacías, el enriquecimiento simplifica significativamente la vista de su conjunto de datos, reduce el desorden visual en las herramientas de análisis y mejora el rendimiento al trabajar con grandes conjuntos de datos.

Este enriquecimiento es particularmente valioso al importar datos de sistemas empresariales que exportan esquemas fijos con muchos campos opcionales, o al trabajar con conjuntos de datos que han sufrido múltiples transformaciones donde algunos atributos se vuelven obsoletos. A diferencia de la eliminación manual de columnas, que requiere identificar cada columna vacía individualmente, este enriquecimiento realiza una revisión exhaustiva de todo su conjunto de datos en una sola operación. El enriquecimiento conserva todas las columnas que contienen al menos un valor no nulo, asegurando que no se pierdan datos potencialmente útiles mientras maximiza la limpieza y usabilidad de su espacio de trabajo de minería de procesos.

Usos Comunes

  • Limpiar conjuntos de datos importados de sistemas ERP que incluyen cientos de campos opcionales sin datos poblados
  • Simplificar vistas de conjuntos de datos después de operaciones de filtrado que pueden dejar ciertos atributos completamente vacíos
  • Reducir el desorden visual en los paneles de atributos de casos y eventos para enfocarse en datos significativos
  • Mejorar el rendimiento y reducir el uso de memoria al trabajar con conjuntos de datos amplios que contienen muchas columnas sin uso
  • Preparar conjuntos de datos para exportación o compartición eliminando columnas vacías irrelevantes
  • Limpiar después de transformaciones de datos que consolidan múltiples atributos en nuevos campos calculados
  • Optimizar la verificación de conformidad eliminando atributos que no aportan valor analítico

Configuración

Este enriquecimiento opera automáticamente sin requerir configuración. Escanea todos los atributos no calculados y no ocultos en su conjunto de datos, eliminando únicamente aquellos que están completamente vacíos en todos los casos y eventos.

Ejemplos

Ejemplo 1: Limpieza de Exportación de Sistema ERP

Escenario: Una empresa manufacturera exporta datos de procesamiento de pedidos desde SAP con más de 200 campos estándar, pero su implementación específica utiliza solo unos 60 campos, dejando más de 140 columnas completamente vacías y dificultando el análisis.

Antes del Enriquecimiento: El conjunto de datos contiene 215 atributos totales incluyendo:

  • Atributos de Caso: 125 columnas (75 vacías)
  • Atributos de Evento: 90 columnas (65 vacías)
  • Ejemplos de columnas vacías: Legacy_System_ID, Deprecated_Cost_Center, Old_Warehouse_Code, Custom_Field_1 a Custom_Field_50

Después del Enriquecimiento: Conjunto de datos simplificado a 75 atributos significativos:

  • Atributos de Caso: 50 columnas (todas contienen datos)
  • Atributos de Evento: 25 columnas (todas contienen datos)
  • Todas las columnas vacías ocultadas automáticamente de la vista

Resultado: El enriquecimiento eliminó 140 columnas vacías mientras preservaba las 75 columnas que contenían al menos un valor. La vista del conjunto de datos ahora se centra solo en atributos con datos reales, facilitando la navegación y el análisis.

Perspectivas: Tras la limpieza, los analistas pudieron identificar rápidamente los atributos relevantes para minería de procesos. La vista simplificada reveló que el procesamiento de pedidos involucraba exactamente 12 atributos clave para la toma de decisiones, que antes estaban ocultos entre cientos de campos vacíos. El rendimiento mejoró en un 40% al cargar el conjunto de datos debido a la reducción de la sobrecarga de memoria.

Ejemplo 2: Limpieza Postfiltrado en Salud

Escenario: Un hospital filtra su conjunto de datos de tratamiento de pacientes para analizar solo casos del departamento de urgencias, lo que provoca que muchos atributos especializados de otras unidades queden completamente vacíos debido a que los casos de urgencias no usan esos campos.

Antes del Enriquecimiento: Después de filtrar solo casos de urgencias:

  • Atributos Totales: 180
  • Atributos Poblados: Emergency_Triage_Level, Emergency_Wait_Time, Emergency_Treatment
  • Atributos Vacíos: ICU_Ventilator_Settings, Surgery_Type, Rehabilitation_Plan, Oncology_Stage, y otros 85 campos especializados de departamentos

Después del Enriquecimiento:

  • Atributos Visibles Totales: 92
  • Todos los atributos contienen datos relevantes del departamento de urgencias
  • 88 atributos vacíos de departamentos especializados ocultados

Resultado: El enriquecimiento identificó y ocultó automáticamente todos los atributos vacíos tras aplicar el filtro de urgencias. Los atributos restantes contienen datos pertinentes a casos de urgencias.

Perspectivas: El conjunto de datos limpio permitió a los gestores del departamento de urgencias concentrarse en sus KPIs específicos sin distracciones de campos irrelevantes. El tiempo de análisis disminuyó un 60% al no tener que desplazarse por columnas vacías para encontrar datos relevantes.

Ejemplo 3: Consolidación de Procesos Financieros

Escenario: Un banco fusiona datos de procesamiento de facturas de tres sistemas diferentes, cada uno con estructuras de campo únicas, lo que genera muchos atributos específicos para cada sistema que están vacíos en los casos de los otros sistemas.

Antes del Enriquecimiento: Conjunto de datos fusionado con 340 atributos:

  • Campos comunes (usados por todos sistemas): 45 atributos
  • Campos específicos del Sistema A: 95 atributos (vacíos para casos de Sistemas B y C)
  • Campos específicos del Sistema B: 110 atributos (vacíos para casos de Sistemas A y C)
  • Campos específicos del Sistema C: 90 atributos (vacíos para casos de Sistemas A y B)

Después del Enriquecimiento: Conjunto de datos enfocado con 45 atributos comunes visibles, más solo los atributos específicos de sistema que contienen datos para la selección actual de casos.

Resultado: El enriquecimiento eliminó todas las columnas completamente vacías, dejando solo los 45 campos comunes que todos los sistemas llenan. Los atributos específicos de sistema vacíos en todo el conjunto fusionado se ocultaron automáticamente.

Perspectivas: La consolidación reveló que a pesar de las diferentes estructuras, los tres sistemas capturaban los mismos 45 atributos principales del proceso. Este descubrimiento permitió al banco estandarizar su procesamiento de facturas en todos los sistemas y reducir la complejidad en un 85 %.

Ejemplo 4: Preparación de Datos de Compras

Escenario: El conjunto de datos de compras de una empresa minorista incluye atributos para varios niveles de aprobación y códigos especiales de manejo, pero muchos campos solo se usan para artículos de alto valor o regulados, quedando vacíos para compras rutinarias.

Antes del Enriquecimiento: Conjunto con 150 atributos incluyendo:

  • Campos estándar: PO_Number, Supplier, Amount, Create_Date (siempre poblados)
  • Campos condicionales: VP_Approval, Legal_Review, Hazmat_Code, Export_License, Compliance_Check (95 % vacíos)
  • Campos legado: Old_Vendor_Code, Previous_System_Ref (100 % vacíos tras migración)

Después del Enriquecimiento: Conjunto simplificado con 67 atributos activos:

  • Se retuvieron todos los campos estándar de compras
  • Se retuvieron los campos condicionales con al menos un valor
  • Se eliminaron los campos legado completamente vacíos

Resultado: El enriquecimiento ocultó 83 atributos sin datos, incluyendo todos los campos legado y de aprobación condicional que nunca se usaron en el conjunto actual. Los atributos restantes aportan al análisis del proceso.

Perspectivas: Tras la limpieza, el equipo de compras descubrió que solo el 5 % de las compras requería aprobaciones especiales, lo que permitió simplificar el proceso para el 95 % de compras rutinarias. La vista simplificada facilitó identificar estos casos de alta complejidad para análisis separados.

Ejemplo 5: Control de Calidad en Manufactura

Escenario: Un fabricante de piezas automotrices exporta datos de control de calidad con cientos de campos de medición, pero cada línea de producción solo usa mediciones específicas relevantes para sus piezas, dejando muchos campos vacíos.

Antes del Enriquecimiento: Conjunto de calidad con 450 atributos:

  • Campos comunes: Part_Number, Production_Line, Timestamp, Pass_Fail (siempre poblados)
  • Mediciones específicas por línea: más de 200 campos por línea (vacíos para otras líneas)
  • Mediciones obsoletas: más de 50 métricas antiguas ya no recogidas

Después del Enriquecimiento: Conjunto relevante con 125 atributos:

  • Se conservaron todos los campos comunes
  • Solo se retuvieron las mediciones con datos
  • Todos los campos obsoletos y sin uso fueron ocultados

Resultado: El enriquecimiento eliminó 325 columnas vacías de medición mientras preservaba las 125 columnas con datos reales de calidad. La vista para cada línea de producción muestra ahora solo las mediciones relevantes.

Perspectivas: La limpieza reveló que, a pesar de tener 450 posibles mediciones, cada línea monitoreaba activamente solo 20-30 métricas críticas de calidad. Este hallazgo llevó a un programa de mejora focalizada que redujo las tasas de defecto en un 15 % al concentrarse en las mediciones que realmente importaban.

Resultado

El enriquecimiento Ocultar Atributos Vacíos modifica la visibilidad de las columnas existentes sin eliminar datos:

Columnas Ocultas:

  • Atributos de caso donde cada fila de caso contiene valores nulos/vacíos
  • Atributos de evento donde cada fila de evento contiene valores nulos/vacíos
  • Las columnas se marcan como ocultas pero no se eliminan del conjunto de datos
  • El estado oculto puede revertirse si es necesario mediante la gestión de columnas

Columnas Preservadas:

  • Todas las columnas que contienen al menos un valor no nulo
  • Todas las columnas calculadas (creadas por otros enriquecimientos)
  • Todas las columnas ya marcadas como ocultas (sin procesamiento redundante)
  • Columnas del sistema como ID de caso y nombres de Actividad

Impacto en el Rendimiento:

  • Reducción del uso de memoria al cargar conjuntos de datos
  • Renderizado más rápido de listas y filtros de atributos
  • Mejor rendimiento en consultas sobre conjuntos de columnas simplificados
  • Archivos de exportación más limpios al compartir conjuntos de datos

Los efectos del enriquecimiento son visibles inmediatamente en los paneles de atributos de caso y evento, donde las columnas vacías ya no aparecen. Esto crea un espacio de trabajo enfocado y eficiente para el análisis de procesos.

Véase También


Esta documentación forma parte de la plataforma de minería de procesos mindzie Studio.