01 01 Arquitectura BI

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 23

INTRODUCCIÓN A LA

ARQUITECTURA DE
BUSINESS INTELLIGENCE
(BI)

Manuel Pérez - 6/10/2021


Proceso de análisis de datos

1. Identificar la información que se quiere obtener.


2. Identificar los orígenes de datos.
3. Crear un modelo de datos.
4. Crear infraestructura de base de datos (DWH) y proceso de carga
(ETL).
5. Implementar el modelo de datos, el sistema de reporting y cuadros de
mando.

FUENTE: https://www.captio.net/blog/como-y-porque-
implementar-una-arquitectura-bi
Esquema ETL

FUENTE:
https://docs.microsoft.com/es-es/power-bi/guidance/center-of-
excellence-business-intelligence-solution-architecture
Esquema

FUENTE: https://todobi.com/comparativa-de-las-15-mejores-
soluciones-de-data-warehouse/
Arquitectura de BI básica

CRM DB 1
Data
Warehouse
ETL & Stage OLAP Reporting
ERP DB 2

Data Marts

Excels DB 3

Transaccional Data Warehouse

FUENTE: https://www.youtube.com/watch?
v=4fJojpYHNKg&ab_channel=BusinessIntelligenceLATAM
Sistemas transaccionales:

Los sistemas transaccionales son las diferentes plataformas que utiliza una
empresa para llevar control de sus operaciones de manera digital.
Como pueden ser:
➢ Sistemas ERP (SAP, Dynamics, etc). Permiten tener un control del
abastecimiento de materias primas, procesos productivos, cobros,
entre otros ejemplos.
➢ CRM (Salesforce, PeopleSoft, etc). Estas herramientas nos permiten
llevar un control de ventas, campañas de marketing y servicios de
soporte al cliente.
➢ Plataformas en la nube. Herramientas alojada en la nube que nos
ayudan dentro de algún área o con alguna tarea en particular.
➢ Archivos (Excels, etc).
➢ Generalmente en una empresa se obtendrá los datos de los sistemas
transaccional pero existen otro métodos de recolección como API
externas o web scraping/crawling.
FUENTE: https://www.youtube.com/watch?
v=4fJojpYHNKg&ab_channel=BusinessIntelligenceLATAM
ETL & Stage

ETL & Stage. La primera parte del proceso se denomina ETL (Extraction,
Transformation and Load). En esta se extrae datos proveniente de las
sistemas transaccionales u otros orígenes y se transforman con el fin de ser
unificados en la etapa de Stage. Estos datos pueden provenir de diferentes
fuentes y es importante es parte del proceso para limpiar y homogeneizar la
información.

En el Stage se realiza una copia de los datos que se encontraban dentro de


los sistemas transaccionales luego del ETL (se recomienda que sean
copias planas). Es una base de datos temporal y volátil, que se utiliza como
paso intermedio, previo a su carga en nuestro data warehouse.

FUENTE: https://www.youtube.com/watch?
v=4fJojpYHNKg&ab_channel=BusinessIntelligenceLATAM
Data Warehouse

Data Warehouse. Es una base de datos diseñada y focalizada para el


negocio donde la información va a estar estandarizada y unificada.
Previamente se hicieron transformaciones para que los datos respondan las
preguntas que tenemos a través de cálculos, estadísticas y agregaciones.
Es la versión final de nuestros datos.

Normalmente, un data warehouse se aloja en un servidor corporativo o


cada vez más, en la nube. Los datos de diferentes aplicaciones de
procesamiento de transacciones Online (OLTP) y otras fuentes se extraen
selectivamente para su uso por aplicaciones analíticas y de consultas por
usuarios.

FUENTE: https://www.talend.com/es/resources/what-is-data-
mart/
Data Warehouse
El procesamiento analítico clásico de datos basado en transacciones se realiza en el
data warehouse como siempre se ha hecho. Nada ha cambiado ahí. Pero ahora
puede hacerse analítica sobre datos contextualizados, y esa forma de análisis es
nueva. La mayoría de las organizaciones, hasta ahora no habían podido basar su
toma de decisiones en datos textuales no estructurados. Y ahora hay una nueva
forma de análisis posible en un Data Warehouse: la posibilidad de la mezcla de
análisis. El análisis combinado se realiza mediante una combinación de datos
transaccionales estructurados y datos contextuales no estructurados.

Existen muchas otras formas de análisis que también son posibles. Estas formas
incluyen análisis predictivo y prescriptivo, así como tecnologías de machine
learning y otras que están cambiando la forma en que los datos son administrados y
analizados. El data warehouse ha sido durante mucho tiempo un elemento básico de
la arquitectura de datos empresarial y sigue teniendo tiene un gran futuro en el nuevo
mundo de Big Data y la analítica avanzada.

FUENTE: https://www.powerdata.es/data-warehouse
Data Warehouse - Arquitectura
La arquitectura de un data warehouse puede ser dividida en tres estructuras
simplificadas:
1. Básica.
2. Básica con un área de ensayo.
3. Básica con área de ensayo y data marts.

● Con una estructura básica, sistemas operativos y archivos planos


proporcionan datos en bruto que se almacenan junto con metadatos. Los
usuarios finales pueden acceder a ellos para su análisis, generación de informes
y minería.
● Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y
el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes
de entrar en el almacén. Es posible personalizar la arquitectura del almacén
para diferentes grupos dentro de la organización.
● Se puede hacer agregando data marts, que son sistemas diseñados para una
línea de negocio en particular. Se pueden tener data marts separados para
ventas, inventario y compras, por ejemplo, y los usuarios finales pueden acceder
a datos de uno o de todos los data marts del departamento.

FUENTE: https://www.powerdata.es/data-warehouse
Data Warehouse - Estructuras
En un data warehouse se separan los datos del proceso de negocios en: hechos y
dimensiones. Los hechos contienen datos medibles, cuantitativos, relacionados con
la transacción del negocio, y las dimensiones son atributos que describen los datos
indicados en los hechos (una especie de meta-datos, o sea datos que describen otros
datos).

Ejemplo de Tablas de hechos:


● Tablas de hechos transaccionales registran hechos relativos a eventos
específicos (por ejemplo, el evento de una venta).
● Tablas de hechos Snapshot registran hechos en un punto dado en el tiempo -
con un intervalo específico para realizar la medición sobre la entidad objeto de
observación (por ejemplo, Detalles de una cuenta al final del mes).
● Tablas Snapshot Acumulativas registran hechos agregados -acumulados- a un
punto dado en el tiempo (por ejemplo, ventas totales mensuales para un
producto dado).

FUENTE: https://www.powerdata.es/data-warehouse
Data Warehouse - Estructuras
Ejemplo de Tablas de dimensiones:
● Tablas de tiempo, describen el tiempo al más pequeño nivel de granularidad de
tiempo para el cual los eventos se registran en el esquema estrella.
● Tablas de dimensión Geográficas describen datos de localización, tales como
país, región, provincia, estado, o ciudad.
● Tablas de dimensión de Productos describen los productos
● Tablas de dimensiones de Empleados describen los empleados, por ejemplo, los
vendedores.
● Tablas de dimensión de Rangos, describen rangos de tiempo, valores de dólar,
u otras cantidades medibles para simplificar los reportes.

Los Data Warehouse pueden poseer diferentes diseños:


● Modelo Estrella.
● Modelo Copo de nieve.

FUENTE: https://es.wikipedia.org/wiki/Esquema_en_estrella
Data Warehouse - Modelo Estrella

El Esquema en estrella es un modelo de datos que tiene una


tabla de hechos (o tabla fact) que contiene los datos para el análisis, rodeada de las
tablas de dimensiones. Este aspecto, de tabla de hechos (o central) más grande
rodeada de radios o tablas más pequeñas es lo que asemeja a una estrella, dándole
nombre a este tipo de construcciones.

FUENTE: https://es.wikipedia.org/wiki/Esquema_en_estrella
Data Warehouse - Modelo Copo de nieve

El Esquema en copo de nieve es una estructura algo más compleja que el


esquema en estrella. Se da cuando alguna de las dimensiones se implementa con
más de una tabla de datos. La finalidad es normalizar las tablas y así reducir el
espacio de almacenamiento al eliminar la redundancia de datos; pero tiene la
contrapartida de generar peores rendimientos al tener que crear más tablas de
dimensiones y más relaciones entre las tablas (JOINs) lo que tiene un impacto directo
sobre el rendimiento.

FUENTE: https://es.wikipedia.org/wiki/Esquema_en_copo_de_nieve
Data Warehouse en la nube
Los data warehouses están atravesando actualmente dos transformaciones muy
importantes que tienen el potencial de impulsar niveles significativos de innovación
empresarial:
● La primera área de transformación es el impulso para aumentar la agilidad
general. La gran mayoría de los departamentos de TI están experimentando un
rápido aumento de la demanda de datos. Esta rápida expansión de los
volúmenes y fuentes de datos significa que los equipos de TI necesitan invertir
más tiempo y esfuerzo asegurando que el rendimiento de las consultas
permanezca constante y necesitan proporcionar cada vez más entornos para
equipos individuales para validar el valor comercial de los nuevos conjuntos de
datos.
● La segunda área de transformación gira en torno a la necesidad de mejorar
el control de costes. Existe una creciente necesidad de hacer más con cada
vez menos recursos, al mismo tiempo que se garantiza que todos los datos
sensibles y estratégicos estén completamente asegurados, a lo largo de todo el
ciclo de vida, de la manera más rentable.

La nube está demostrando ser un facilitador dominante. Permite a las organizaciones


enfrentarse de forma activa a los desafíos que presentan estas dos transformaciones
clave.

FUENTE: https://www.powerdata.es/data-warehouse
Data Warehouse en la nube
La importancia de la nube para el data warehouse está directamente vinculado a tres
factores clave:
● Mejora de la agilidad. Muchos data warehouses están embarcados en una fase
de actualización. Con mucho trabajo puesto ahora en torno al big data, las
empresas buscan aprovechar los nuevos flujos de datos y nuevos tipos de
análisis más ricos para apoyar e impulsar nuevas áreas. Es más rápido, más
fácil y más eficiente iniciar estos nuevos proyectos centrados en los datos
utilizando los servicios en la nube.
● Mayor control de costes. Muchos equipos de TI están buscando maneras de
consolidar los data marts existentes, cada uno ejecutándose en hardware
dedicado o incluso en hardware propietario, en un único entorno integrado. Los
servicios en la nube de calidad ofrecen la oportunidad de solicitar y dar de baja
la infraestructura, acorde a las necesidades que tenga nuestra empresa.
● Co-Localización para una carga más rápida. La mayoría de los data
warehouses generan datos directamente desde aplicaciones clave, como
entrada de pedidos, ventas, finanzas y fabricación. Por lo tanto, tiene mucho
sentido ubicar conjuntamente el data warehouse junto con los sistemas fuente
que ya se estén ejecutándose en la nube. La ubicación conjunta ofrece una
carga de datos más rápida, lo que significa que los usuarios obtienen un acceso
más oportuno a sus datos.

FUENTE: https://www.powerdata.es/data-warehouse
Data Marts

Data Marts. Es una base de datos centrada en un ámbito que muchas


veces es un segmento aislado de un almacén de datos de empresa. El
subconjunto de datos contenido en un data mart suele alinearse con una
unidad comercial concreta, como Ventas, Finanzas o Marketing. Los data
marts aceleran los procesos comerciales al dar acceso a la información en
un almacén de datos o un data store operativo en cuestión de días, y no
meses o períodos más largos. Como un data mart tan solo contiene los
datos aplicables a un ámbito comercial concreto, resulta una forma rentable
de obtener información explotable rápidamente.

FUENTE: https://www.talend.com/es/resources/what-is-data-
mart/
Data Warehouse VS Data Lakes

Data Lake vs Data Warehouse:


● El lago de datos conserva todos los datos, a diferencia del almacén
de datos, donde se dedica una parte importante de tiempo a decidir
qué datos incluir y no incluir en el almacén.
● Un Data Lake admite todos los tipos de datos, independientemente
de su tipo, formato o procedencia y sin necesidad de normalizar su
estructura.
● El Data Lake puede nutrir a todos los usuarios de la organización,
incluyendo a esos perfiles técnicos con exigencias de análisis más
avanzadas, que son quienes recurren a capacidades como análisis
estadístico y modelado predictivo.
● A diferencia del Data Warehouse, el Data Lakes se adapta
fácilmente a los cambios. El diseño del almacén es un proceso
complejo y, la actualidad de los negocios, en ocasiones no puede
esperar tanto tiempo.

FUENTE: https://blog.powerdata.es/el-valor-de-la-gestion-de-
datos/data-lake-vs-data-warehouse.-veamos-sus-principales-
diferencias
Cubos OLAP

Proporcionan velocidad y flexibilidad para realizar consultas complejas


desde diferentes perspectivas. Son herramientas que proporcionan una
presentación multidimensional de un data mart, organizando y resumiendo
los datos de las consultas analíticas.
Un cubo puede tener varias dimensiones. Por ejemplo: Un cubo podría
tener 3 dimensiones:
● Fecha de venta
● Línea de producto
● Continente en el cual fue vendido.
A su vez, cada dimensión tiene asociada una jerarquía, pero podría tener
más. Como ejemplo, la dimensión "fecha" podría tener como primera
jerarquía trimestres y como segunda jerarquía meses.
Las información que se encuentra dentro de cada cruce de dimensiones se
llaman medidas y generalmente es numérica y agregable.

FUENTE: https://www.youtube.com/watch?v=MD-
qd4Kdu_E&ab_channel=AuriboxTraining
Reporting
En la etapa de reporting utilizaremos diferentes herramientas de
visualización que nos facilitaran la explicación de los hallazgos que hemos
encontrado durante el proceso de análisis de datos.

Es importante siempre conocer el público objetivo de estos hallazgos


(también llamados insights) para adaptar los resultados de nuestro análisis
al entendimiento de este grupo de personas.

Estos hallazgos se pueden presentar de varias maneras:


● Reportes
● Dashboards
● Tablas
● Gráficos
Diferentes tipos de modelos

Los modelos de datos proporcionan control sobre cómo se estructuran los


datos y cómo se accede a ellos. En el caso de servicios de negocio y
consumidores de datos, los modelos de datos son la interfaz de la
plataforma de BI.

Una plataforma de BI puede ofrecer tres tipos diferentes de modelos:

● Modelos empresariales
● Modelos semánticos de BI
● Modelos de Machine Learning (ML)

FUENTE:
https://docs.microsoft.com/es-es/power-bi/guidance/center-of-
excellence-business-intelligence-solution-architecture
Big Data vs Data Warehouse vs BI
● Big Data. Llamamos big data a un gran volumen de datos con una variedad,
complejidad y velocidad de crecimiento enorme y que además tienen la
característica de no ser estructurados. Eso significa que no son relacionales,
estando además fuera del entorno corporativo. Es un tipo de tecnología que te
permite analizar los datos en tiempo real y puede provenir de diferentes fuentes
y formas, tales como mensajería instantánea, redes sociales, registros de
grabaciones, imágenes, mensajes de correo electrónico, etc.
● Data Warehouse. Por otro lado, un data warehouse almacena datos
consolidados de diversas fuentes o sistemas de la empresa. Se trata de datos
estructurados, que tiene como objetivo principal ser precisos y de alta calidad
para de esta forma poder dar soporte a la toma de decisiones de la empresa. Se
trata de conseguir tener todos los datos juntos para después poder dividirlos
para hacer un análisis de determinados sectores o estrategias.
● Business Intelligence. Son los datos recogidos del data warehouse, que llegan
de forma exacta y útil para ayudar a la toma de decisiones. Business
Intelligence transforma los datos en información útil para analizar no sólo los
negocios, sino también las principales estrategias corporativas.

FUENTE: https://www.powerdata.es/data-warehouse

También podría gustarte