01 01 Arquitectura BI
01 01 Arquitectura BI
01 01 Arquitectura BI
ARQUITECTURA DE
BUSINESS INTELLIGENCE
(BI)
FUENTE: https://www.captio.net/blog/como-y-porque-
implementar-una-arquitectura-bi
Esquema ETL
FUENTE:
https://docs.microsoft.com/es-es/power-bi/guidance/center-of-
excellence-business-intelligence-solution-architecture
Esquema
FUENTE: https://todobi.com/comparativa-de-las-15-mejores-
soluciones-de-data-warehouse/
Arquitectura de BI básica
CRM DB 1
Data
Warehouse
ETL & Stage OLAP Reporting
ERP DB 2
Data Marts
Excels DB 3
FUENTE: https://www.youtube.com/watch?
v=4fJojpYHNKg&ab_channel=BusinessIntelligenceLATAM
Sistemas transaccionales:
Los sistemas transaccionales son las diferentes plataformas que utiliza una
empresa para llevar control de sus operaciones de manera digital.
Como pueden ser:
➢ Sistemas ERP (SAP, Dynamics, etc). Permiten tener un control del
abastecimiento de materias primas, procesos productivos, cobros,
entre otros ejemplos.
➢ CRM (Salesforce, PeopleSoft, etc). Estas herramientas nos permiten
llevar un control de ventas, campañas de marketing y servicios de
soporte al cliente.
➢ Plataformas en la nube. Herramientas alojada en la nube que nos
ayudan dentro de algún área o con alguna tarea en particular.
➢ Archivos (Excels, etc).
➢ Generalmente en una empresa se obtendrá los datos de los sistemas
transaccional pero existen otro métodos de recolección como API
externas o web scraping/crawling.
FUENTE: https://www.youtube.com/watch?
v=4fJojpYHNKg&ab_channel=BusinessIntelligenceLATAM
ETL & Stage
ETL & Stage. La primera parte del proceso se denomina ETL (Extraction,
Transformation and Load). En esta se extrae datos proveniente de las
sistemas transaccionales u otros orígenes y se transforman con el fin de ser
unificados en la etapa de Stage. Estos datos pueden provenir de diferentes
fuentes y es importante es parte del proceso para limpiar y homogeneizar la
información.
FUENTE: https://www.youtube.com/watch?
v=4fJojpYHNKg&ab_channel=BusinessIntelligenceLATAM
Data Warehouse
FUENTE: https://www.talend.com/es/resources/what-is-data-
mart/
Data Warehouse
El procesamiento analítico clásico de datos basado en transacciones se realiza en el
data warehouse como siempre se ha hecho. Nada ha cambiado ahí. Pero ahora
puede hacerse analítica sobre datos contextualizados, y esa forma de análisis es
nueva. La mayoría de las organizaciones, hasta ahora no habían podido basar su
toma de decisiones en datos textuales no estructurados. Y ahora hay una nueva
forma de análisis posible en un Data Warehouse: la posibilidad de la mezcla de
análisis. El análisis combinado se realiza mediante una combinación de datos
transaccionales estructurados y datos contextuales no estructurados.
Existen muchas otras formas de análisis que también son posibles. Estas formas
incluyen análisis predictivo y prescriptivo, así como tecnologías de machine
learning y otras que están cambiando la forma en que los datos son administrados y
analizados. El data warehouse ha sido durante mucho tiempo un elemento básico de
la arquitectura de datos empresarial y sigue teniendo tiene un gran futuro en el nuevo
mundo de Big Data y la analítica avanzada.
FUENTE: https://www.powerdata.es/data-warehouse
Data Warehouse - Arquitectura
La arquitectura de un data warehouse puede ser dividida en tres estructuras
simplificadas:
1. Básica.
2. Básica con un área de ensayo.
3. Básica con área de ensayo y data marts.
FUENTE: https://www.powerdata.es/data-warehouse
Data Warehouse - Estructuras
En un data warehouse se separan los datos del proceso de negocios en: hechos y
dimensiones. Los hechos contienen datos medibles, cuantitativos, relacionados con
la transacción del negocio, y las dimensiones son atributos que describen los datos
indicados en los hechos (una especie de meta-datos, o sea datos que describen otros
datos).
FUENTE: https://www.powerdata.es/data-warehouse
Data Warehouse - Estructuras
Ejemplo de Tablas de dimensiones:
● Tablas de tiempo, describen el tiempo al más pequeño nivel de granularidad de
tiempo para el cual los eventos se registran en el esquema estrella.
● Tablas de dimensión Geográficas describen datos de localización, tales como
país, región, provincia, estado, o ciudad.
● Tablas de dimensión de Productos describen los productos
● Tablas de dimensiones de Empleados describen los empleados, por ejemplo, los
vendedores.
● Tablas de dimensión de Rangos, describen rangos de tiempo, valores de dólar,
u otras cantidades medibles para simplificar los reportes.
FUENTE: https://es.wikipedia.org/wiki/Esquema_en_estrella
Data Warehouse - Modelo Estrella
FUENTE: https://es.wikipedia.org/wiki/Esquema_en_estrella
Data Warehouse - Modelo Copo de nieve
FUENTE: https://es.wikipedia.org/wiki/Esquema_en_copo_de_nieve
Data Warehouse en la nube
Los data warehouses están atravesando actualmente dos transformaciones muy
importantes que tienen el potencial de impulsar niveles significativos de innovación
empresarial:
● La primera área de transformación es el impulso para aumentar la agilidad
general. La gran mayoría de los departamentos de TI están experimentando un
rápido aumento de la demanda de datos. Esta rápida expansión de los
volúmenes y fuentes de datos significa que los equipos de TI necesitan invertir
más tiempo y esfuerzo asegurando que el rendimiento de las consultas
permanezca constante y necesitan proporcionar cada vez más entornos para
equipos individuales para validar el valor comercial de los nuevos conjuntos de
datos.
● La segunda área de transformación gira en torno a la necesidad de mejorar
el control de costes. Existe una creciente necesidad de hacer más con cada
vez menos recursos, al mismo tiempo que se garantiza que todos los datos
sensibles y estratégicos estén completamente asegurados, a lo largo de todo el
ciclo de vida, de la manera más rentable.
FUENTE: https://www.powerdata.es/data-warehouse
Data Warehouse en la nube
La importancia de la nube para el data warehouse está directamente vinculado a tres
factores clave:
● Mejora de la agilidad. Muchos data warehouses están embarcados en una fase
de actualización. Con mucho trabajo puesto ahora en torno al big data, las
empresas buscan aprovechar los nuevos flujos de datos y nuevos tipos de
análisis más ricos para apoyar e impulsar nuevas áreas. Es más rápido, más
fácil y más eficiente iniciar estos nuevos proyectos centrados en los datos
utilizando los servicios en la nube.
● Mayor control de costes. Muchos equipos de TI están buscando maneras de
consolidar los data marts existentes, cada uno ejecutándose en hardware
dedicado o incluso en hardware propietario, en un único entorno integrado. Los
servicios en la nube de calidad ofrecen la oportunidad de solicitar y dar de baja
la infraestructura, acorde a las necesidades que tenga nuestra empresa.
● Co-Localización para una carga más rápida. La mayoría de los data
warehouses generan datos directamente desde aplicaciones clave, como
entrada de pedidos, ventas, finanzas y fabricación. Por lo tanto, tiene mucho
sentido ubicar conjuntamente el data warehouse junto con los sistemas fuente
que ya se estén ejecutándose en la nube. La ubicación conjunta ofrece una
carga de datos más rápida, lo que significa que los usuarios obtienen un acceso
más oportuno a sus datos.
FUENTE: https://www.powerdata.es/data-warehouse
Data Marts
FUENTE: https://www.talend.com/es/resources/what-is-data-
mart/
Data Warehouse VS Data Lakes
FUENTE: https://blog.powerdata.es/el-valor-de-la-gestion-de-
datos/data-lake-vs-data-warehouse.-veamos-sus-principales-
diferencias
Cubos OLAP
FUENTE: https://www.youtube.com/watch?v=MD-
qd4Kdu_E&ab_channel=AuriboxTraining
Reporting
En la etapa de reporting utilizaremos diferentes herramientas de
visualización que nos facilitaran la explicación de los hallazgos que hemos
encontrado durante el proceso de análisis de datos.
● Modelos empresariales
● Modelos semánticos de BI
● Modelos de Machine Learning (ML)
FUENTE:
https://docs.microsoft.com/es-es/power-bi/guidance/center-of-
excellence-business-intelligence-solution-architecture
Big Data vs Data Warehouse vs BI
● Big Data. Llamamos big data a un gran volumen de datos con una variedad,
complejidad y velocidad de crecimiento enorme y que además tienen la
característica de no ser estructurados. Eso significa que no son relacionales,
estando además fuera del entorno corporativo. Es un tipo de tecnología que te
permite analizar los datos en tiempo real y puede provenir de diferentes fuentes
y formas, tales como mensajería instantánea, redes sociales, registros de
grabaciones, imágenes, mensajes de correo electrónico, etc.
● Data Warehouse. Por otro lado, un data warehouse almacena datos
consolidados de diversas fuentes o sistemas de la empresa. Se trata de datos
estructurados, que tiene como objetivo principal ser precisos y de alta calidad
para de esta forma poder dar soporte a la toma de decisiones de la empresa. Se
trata de conseguir tener todos los datos juntos para después poder dividirlos
para hacer un análisis de determinados sectores o estrategias.
● Business Intelligence. Son los datos recogidos del data warehouse, que llegan
de forma exacta y útil para ayudar a la toma de decisiones. Business
Intelligence transforma los datos en información útil para analizar no sólo los
negocios, sino también las principales estrategias corporativas.
FUENTE: https://www.powerdata.es/data-warehouse