BI Workflow

Como los datos se encuentran aislados en silos de información y almacenados de forma que no pueden ser accedidos o integrados en otras herramientas, el primer paso es construir los conectores que extraerán esta información y la inyectarán como entrada en el workflow -proceso de ingesta-.

  • Ingesta: los datos de los diferentes silos se envían a un sistema escalable y de alta disponibilidad, como un bus de datos, donde se encolan para almacenarlos. El sistema de ingesta debe interoperar con distintas tecnologías y aceptar cualquier formato, ya sean datos estructurados o no estructurados (videos, PDFs, fotografías, etc.).
  • Almacenamiento: el primer almacenamiento para los datos, o data lake, unifica y guarda los datos provenientes de los distintos silos en un único repositorio, de manera que en las etapas posteriores el analista de datos tendrá una única fuente de verdad sobre la que lanzar consultas y procesar. El datalake soporta todos los tipos de datos y se mantienen en su forma bruta en el “Schema on Read”. Es decir, el que consulta los datos debe conocer el formato de los datos que consulta. El datalake se adapta a los cambios y es posible añadir nuevos orígenes de datos poco tiempo.
  • Prep & Train: los datos “sin esquema” del datalake deben ser procesados y, limpiados y desambiguados. En esta etapa, los datos se normalizan, se convierten a tipos conocidos o a valores de catálogos predefinidos, se eliminan duplicados, se cruzan unos con otros y se completan los elementos que faltan. En el proceso, es posible empezar a incorporar Inteligencia Artificial para generar nuevos datos inferidos a partir de los procesados, como campos descriptivos, de diagnóstico o predictivos.
  • Model & Server: los datos estructurados se persisten nuevamente en un sistema de almacenamiento de gran tamaño y capacidad de consulta, llamado Data Warehouse. Puede ser el mismo que se emplea como Data Lake u otro como una base de datos relacional. En esta etapa se diseñan y construyen los servicios de análisis y las consultas específicas que generan la información que utilizaremos en nuestras decisiones. Como el Data Warehouse mantiene un esquema y estructura de datos para consultar información concisa y concreta, es más lento a la hora de incorporar nuevos tipos de datos o consultas, pero la información que arroja es de mayor valor.
  • Uso: el propósito del BI es disponer de paneles o elementos informativos en los que conozcamos la situación actual y las previsiones acerca de los principales KPIs del negocio. La forma habitual de consulta suele ser mediante paneles o dashboard donde se muestran gráficas y big numbers específicos. También se pueden crear alertas que se disparen automáticamente a los responsables de un departamento cuando se dan ciertas circunstancias, o incluso recomendaciones prescriptivas (acciones a realizar para mejorar las previsiones del negocio).

Recuerda que Business Intelligence nos habilita para tomar mejores decisiones, pero la primera buena decisión es, sin duda, empezar a aplicar Business Intelligence en nuestra empresa, ¡y para eso hay que saber en qué consiste!

¿Te gusta esta página? Recomienda este sitio en tus redes sociales