La arquitectura de tejido de datos es fundamental para modernizar la gestión y la integración de datos

11 de mayo de 2021

Autor: Ashutosh Gupta

Los responsables de análisis de datos deben conocer los pilares básicos de la arquitectura de tejido de datos para conseguir una integración de datos basada en procesos automatizados.

La agilidad en la gestión de datos ha ganado posiciones como principal prioridad estratégica de las organizaciones, en un entorno cada vez más diverso, distribuido y complejo. Para reducir los errores humanos y los costes generales es necesario que los responsables de análisis de datos dejen atrás ciertas prácticas de gestión de datos tradicionales y opten por soluciones modernas, como la integración de datos basada en la inteligencia artificial (IA).

Descargar ahora: Guía fundamental para comprender la importancia del tejido de datos

“El nuevo concepto de diseño conocido como ‘tejido de datos’ puede ofrecer una solución robusta para los constantes desafíos de la gestión de datos, como los ciclos de integración de datos de elevado coste y bajo valor, el frecuente mantenimiento que requieren las integraciones más tempranas, o la creciente demanda de intercambio de datos en tiempo real y motivada por acontecimientos, entre otros”, afirma Mark Beyer, destacado analista VP de Gartner.  

Descargar el ebook: Visión de liderazgo para los responsables de análisis de datos en 2022

¿Qué es el tejido de datos?

En Gartner entendemos el tejido de datos como un concepto de diseño que actúa como una capa (tejido) integrada de datos y procesos de conexión. El tejido de datos utiliza un análisis continuo de los activos de metadatos existentes, detectables y deducidos para apoyar el diseño, la implementación y el uso de datos integrados y reutilizables en todo tipo de entornos, incluidas las plataformas híbridas y las multinubes. 

El tejido de datos aprovecha tanto las capacidades humanas como las automatizadas para acceder a los datos in situ o ayudar a su consolidación cuando resulta pertinente. Identifica y conecta constantemente los datos de aplicaciones diversas para descubrir relaciones únicas y comercialmente pertinentes entre los puntos de datos disponibles. El conocimiento obtenido apoya la toma de decisiones rediseñada, ya que aporta más valor que las prácticas de gestión de datos tradicionales, gracias a la rapidez de acceso y comprensión.  

A modo de ejemplo, un director de cadena de suministro que utilice el tejido de datos puede añadir de forma más rápida los activos de datos recién encontrados a las relaciones ya conocidas entre retrasos de suministro y retrasos en la producción, además de mejorar las decisiones con los datos nuevos (o correspondientes a nuevos proveedores o nuevos clientes).

Más información: Las 10 principales tendencias de análisis de datos de Gartner para 2022

Imagina el tejido de datos como si fuera un coche autónomo

Piensa en dos situaciones hipotéticas. En la primera, el conductor está activo y totalmente atento a la ruta, y la intervención del elemento autónomo del coche es mínima o inexistente. En la segunda, el conductor está algo soñoliento y su atención disminuye, de modo que el coche activa inmediatamente el modo de semiautonomía y aplica los cambios de rumbo necesarios. 

Ambas situaciones sintetizan el funcionamiento del tejido de datos. Al principio supervisa los canales de datos como un observador pasivo y empieza a proponer alternativas mucho más productivas. Una vez que ambas partes, el “conductor” de los datos y el machine learning, se han familiarizado con las situaciones repetitivas, se complementan mutuamente mediante la automatización de las tareas de improvisación (que requieren muchas horas manuales) y liberan a los responsables para que puedan centrarse en la innovación.

Más información: El intercambio de datos es una necesidad empresarial para acelerar el negocio digital

Todo lo que deben saber los responsables de análisis de datos sobre el tejido de datos 

  • El tejido de datos no es una simple combinación de tecnologías tradicionales y modernas, sino un concepto de diseño que cambia el enfoque sobre las cargas de trabajo humanas y automatizadas. 
  • Las nuevas tecnologías y las que pronto llegarán, como los gráficos de conocimiento semántico, la gestión activa de metadatos y el machine learning integrado, son imprescindibles para conseguir un diseño de tejido de datos. 
  • El diseño optimiza la gestión de datos mediante la automatización de tareas repetitivas como el análisis de perfiles de conjuntos de datos, el descubrimiento y ajuste de esquemas para las nuevas fuentes de datos y, en su nivel más avanzado, la reparación de los trabajos anómalos de integración de datos. 
  • Ninguna de las actuales soluciones independientes es capaz de facilitar una arquitectura de tejido de datos completa. Los responsables de análisis de datos pueden asegurar una extraordinaria arquitectura de tejido de datos si fusionan las soluciones integradas y las adquiridas. A modo de ejemplo, pueden optar por una plataforma prometedora de gestión de datos que posea el 65-70 % de las capacidades necesarias para componer un tejido de datos. Las demás capacidades se pueden obtener con una solución propia.

¿Cómo pueden conseguir los responsables de análisis de datos una arquitectura de tejido de datos que aporte valor comercial?

Para generar valor comercial mediante el diseño del tejido de datos, los responsables de análisis de datos deben dotarse de una sólida base tecnológica, identificar las capacidades esenciales necesarias y evaluar las herramientas existentes de gestión de datos. 

Más información: Cómo DataOps amplifica el valor comercial del análisis de datos

A continuación presentamos los pilares fundamentales de arquitectura de tejido de datos que todo responsable de análisis de datos debe conocer.

N.º 1 El tejido de datos debe recopilar y analizar metadatos de todo tipo

La información contextual sienta las bases para un diseño de tejido de datos dinámico. Debería disponerse de un mecanismo (como una reserva de datos perfectamente conectada) que permita al tejido de datos identificar, conectar y analizar todo tipo de metadatos, por ejemplo técnicos, comerciales, operativos y sociales.

Pilares fundamentales de la arquitectura de tejido de datos

N.º 2 El tejido de datos debe convertir los metadatos pasivos en activos

Para un intercambio de datos fluido, es importante que las empresas activen los metadatos. Para conseguirlo, el tejido de datos debe: 

  • Analizar continuamente los metadatos disponibles en busca de indicadores clave y estadísticas que ayuden a generar después un modelo gráfico. 
  • Representar gráficamente los metadatos, de una forma fácil de interpretar, basada en sus relaciones exclusivas y pertinentes para la empresa. 
  • Aprovechar los indicadores de metadatos clave para permitir que los algoritmos de inteligencia artificial y machine learning (IA/ML) aprendan con el tiempo y generen masivamente predicciones avanzadas en relación con la gestión y la integración de datos.

Descarga el ebook: El futuro de las decisiones

N.º 3 El tejido de datos debe crear y mantener gráficos de conocimiento 

Los gráficos de conocimiento ayudan a los responsables de análisis de datos a deducir valor comercial, mediante el enriquecimiento de los datos con semántica. 

La capa de semántica del gráfico de conocimiento facilita y hace más intuitiva la interpretación, lo que ayuda a los responsables de análisis de datos en su proceso. Añade profundidad y significado al gráfico de uso y contenido de los datos, de modo que los algoritmos de IA/ML pueden utilizar la información para fines de análisis y otros usos operativos. 

Las normas y herramientas de integración que suelen utilizar los profesionales de la integración de datos y los ingenieros de datos pueden asegurar el fácil acceso y aprovechamiento del gráfico de conocimiento. Los responsables de análisis de datos deben aprovechar todo esto si no quieren que la adopción del tejido de datos sufra constantes interrupciones. 

N.º 4 El tejido de datos necesita el respaldo de una robusta integración de datos 

El tejido de datos debe ser compatible con diferentes estilos de entrega de datos (incluidos, entre otros, los procesos ETL, el streaming, la replicación, la mensajería y la virtualización de datos o los microservicios de datos). Así como también debe poder admitir todo tipo de datos de los usuarios, incluidos usuarios de Tecnología de la Información (para requisitos de integración complejos) y usuarios comerciales (para preparación de datos de autoservicio).

Drive stronger performance on your mission-critical priorities.