Business Inteiligence
Business Inteiligence
Business Inteiligence
Business Analytics
Comprensión de las soluciones utilizadas para construir modelos de análisis y
simulaciones para crear escenarios, comprender realidades y predecir estados
futuros.
Big Data
Se entiende por Big Data el conjunto de estrategias, tecnologías y sistemas para
el almacenamiento, procesamiento, análisis y visualización de conjuntos de datos
complejos, que frecuentemente, pero no siempre, viene definida por volumen,
velocidad y variedad.
FUENTES DE DATOS
1
Qlik View, QlikSesion, Tableau, Power Bl, Domo, Pentaho, MicroStrategy, Business Object.
Los datos son estructurados (tablas, bases de datos), semiestructurados (texto, logs,
xml, etc.) o no estructurados (texto, vídeo, audio, imágenes, redes sociales) 2.
Fuentes Internas. Los datos son capturados pos sistemas operacionales (CRM, ERP,
GIS, SCM) relacionados con operaciones de negocio y procesos (compras, ventas, etc).
Fuente externas. Partners, proveedores de datos, Internet, gobiernos y corporaciones
nacionales y locales, organizaciones de investigación de mercados o científicas, datos
demográficos.
PROCESO ETL
Extracción es el proceso de identificación y recolección de datos relevantes o
significativos de diferentes fuentes.
Los datos extraídos se envían a unárea de almacenamiento temporal que se
llama Data Staging, que es previa al proceso de transformación y limpieza.
Transformación es el proceso de conversión de los datos, utilizando un conjunto
de reglas de negocio, aplicando un conjunto de reglas de unificación de datos básicos
(misma dimensión) para transformar los datos desde el origen al destino (Staging
Area)
Carga de los datos delárea de staging en el repositorio destino (Data Warehouse y
Data Marts), normalmente a través de un almacén de datos operacional (ODS).
CAPA DE METADATOS
2
Se calcula que los datos no estructurados corresponden, aproximadamente, a un 90 % de toda la
información disponible por las organizaciones y empresas.
3
Un proceso ELT transforma y carga en el Data Warehouse e una sola operación. Este es el almacén
general que contiene todos los datos, que segregará en almacenes independientes según
departamentos, áreas, funciones, etc. (data marts). Los Data Marts, o Data Warehouses
departamentales, son un subconjunto de los almacenes de datos enfocados y de valor para un
departamento determinado de la empresa, para un conjunto de usuarios o, incluso, para un análisis de
datos específico.
La capa describe dónde se utilizan y almacenan los datos, las fuentes de datos, qué
cambios se realizan a los datos, almacenan información técnica, así como reglas de
negocio y definiciones de datos de todas las capas.
Recolección de datos4.
EL sistema se conecta a las fuentes y extrae datos. Puede hacerlo:
Batch (por lotes): se conecta periódicamente y actualiza las bases de datos.
Streaming: conexión en tiempo real de forma continua a la fuente de datos.
La Inteligencia de Negocios (Bl) realiza el análisis del pasado (histórico) para describir y
diagnosticar. En esta capa incluye: análisis descriptivo (¿Qué paso?: análisis de la
información histórica) y análisis de diagnostico (¿Por qué sucedió?: análisis de
retrospección).
5
Existen diferentes arquitecturas de Inteligencia de Negocios de los proveedores de soluciones (Oracle,
SAS, IBM, Microstrategy, SAP, Microsoft) y modelos de expertos y consultores de Inteligencia de
Negocios.
6
La herramienta de Microsoft de Bl y Analítica es Microsoft Cortana Analytics. Las empresas
proveedoras de Inteligencia de Negocios líderes en 2016 son Microsoft, Qlik y Tableau.
ANALÍTICA DE DATOS: CONCEPTOS Y TIPOS
Analítica descriptiva
Es un análisis de la información histórica. Se consultan y visualizan datos de manera
agregada provenientes de los diferentes indicadores de negocio, con el objeto de
obtener una visión de lo que ha pasado y lo que está pasando.
Permite a una organización responder ¿qué está pasando? ¿qué ha pasado?, y tomar
decisiones basadas en los resultados.
Analítica predictiva
aplicación de técnicas matemáticas y estadísticas avanzadas, así como el aprendizaje
automático (machine Iearning), para predecir datos necesarios pero que no se
visualizan directamente y están ausentes.
Se suele realizar tras el análisis descriptivo y permite predecir los posibles escenarios
futuros. Busca extraer conocimiento de los datos en forma de patrones, tendencias o
modelos, que nos proporcionan una cierta certeza sobre situaciones potenciales
futuras. La Analítica predictiva realiza las predicciones de datos que fortalecen las
decisiones del negocio. Responde a las preguntas ¿qué va a pasar? ¿qué es lo que
podría pasar?
Analítica Prescriptiva
El modelo de analítica prescriptiva lleva a efecto una integración completa con el
negocio, mediante la propuesta de recomendaciones sobre las acciones que se han de
seguir para reducir costes o mejorar los beneficios tratando de conseguir, en todos los
casos, un incremento del retorno de la inversión (ROI). Encargada de la automatización
de la toma de decisiones (El sistema prescriptivo recopila información del negocio,
predice, sobre la base de dicha información, el impacto que tendrán las diferentes
políticas o acciones que se vayan a tomar y selecciona la política por seguir con un
mayor retorno de inversión mediante el proceso de optimización. Emite informes de
impacto en escenarios futuros para prevenir, actualiza de forma proactiva las
recomendaciones basadas en sucesos cambiantes.
Responde a preguntas tales como: ¿Qué hacer para que pase? ¿Qué necesito hacer?
¿Cómo podemos hacer que algo suceda?
CAPÍTULO 3.
TRANSFORMACIÓN DIGITAL EN ORGANIZACIONES Y EMPRESAS (ECONOMÍA
COLABORATIVA, EXPERIENCIA DE CLIENTE Y BLOCKCHAIN).
Algunas ventajas:
Permite una mejor y más rápida adaptabilidad a los cambios de contextos
Posibilita la competitividad mediante la innovación
Permite la flexibilidad del trabajo remoto
Big data y Analytics permiten medir todo.
Orientada al internet de las cosas, IoT (el mayor disruptor de los negocios en el
futuro).
Un modelo para realizar la digitalización de una empresa que se compone de
doceámbitos o dominios en los que la digitalización impacta a las empresas: Marketing
digital: Comercio digital. Redes sociales. Analíticas. Procesos digitales. Colaboración
digital. Innovación digital. Habilidades digitales. Conocimiento digital. Roles digitales.
Plataforma digital. Puesto de trabajo digital.
ECONOMÍA COLABORATIVA
«Un modelo de relaciones y conjuntos de iniciativas basadas en redes horizontales con
la participación de una comunidad y que tiene efectos en todos losámbitos de la
sociedad».
Modelo CoCoMaFiGoSi. Todas las iniciativas forman parte de los bloques: consumo
colaborativo (blablacar), conocimiento abierto (Mooc), makers (Arduino, raspberry pi),
finanzas (crowfounding), Gobierno (transpariencia), sistemas de inrtercambio de
valores (Timerepublik).
EXPERIENCIA DE CLIENTE
Evolución natural del CRM y fundamental en Inteligencia de Negocios. Conjunto de
experiencias (recuerdo/percepción) que (man)tiene un cliente con una marca durante
el tiempo en que haya una relación de servicio. El producto de las percepciones de un
cliente después de interactuar.
7
En su obra «Digitalízate».
La recopilación, proceso y análisis de los datos extraídos durante el recorrido de un
cliente en la gestión empresarial requiere la integración de la Inteligencia de Negocios
para mejorar la experiencia de cliente. Se hace necesario un conocimiento exhaustivo,
automatizado y en continua actualización, para generar un ciclo de personalización
constante. La recopilación de datos en cada punto de interacción del recorrido del
cliente aporta una foto instantánea del rendimiento integral.
8
Especialmente mediante la microsegmentación, entendida como la agrupación de clientes que
comparten características similares (sociodemográficas, geográficas, preferencias, etc.), sobre los que
incidiremos a partir de objetivos.
9
Las comunicaciones y transacciones entre computadoras se encriptan (cifran) e incluyen un sello de
tiempo, en fracciones de segundo, para evitar que puedan hacerse dos operaciones iguales a la vez
(como hacer dos pagos con el mismo dinero o que dos personas un mismo objeto). El sellado de tiempo
detecta la primera transacción y la segunda se rechaza.
PARTE II
INFRAESTRUCTURAS Y ARQUITECTURA
DE INTELIGENCIA DE NEGOCIOS
CAPITULO 4
ALMACENES DE DATOS: DATA WAREHOUSE, OLAP Y DATA LAKE
GOBIERNO DE DATOS
El ciclo de vida de los datos está muy relacionado con la gestión del conocimiento, ya
que la transformación de los datos en conocimiento (las aplicaciones o soluciones que
utilizan eficazmente la información) se realiza en varias etapas. Comienza con la
captura de colecciones de datos que proceden de distintas fuentes (datos internos,
externos y personales o de usuarios finales), y su almacenamiento en bases de datos. A
continuación, serán preprocesados para adaptarse al formato de un Data Warehouse o
un Data Mart, donde se alojarán definitivamente. Luego, Los usuarios acceden allí y
recogen los datos, una muestra, que necesitan para su análisis. El análisis de datos se
realiza con técnicas de análisis y herramientas de Minería de Datos, que obtienen
patrones para corregir la interpretación mediante resultados (visualización de datos,
apoyo a la decisión y herramientas de gestión del conocimiento) y el uso de
herramientas o soluciones (sistemas de información) como CRM, ERP, SCM o comercio
electrónico.
Bases de Datos12
Centralizadas (más lentas y vulnerables: si se rompe, lo hace para todos).
Distribuidas
o Particionadas: cada posición tiene una parte de la base de datos.
o Replicadas: bases de datos completas en diferentes localizaciones13.
DATA WAREHOUSE
Es un gran almacén o depósito de datos, donde se integran datos procedentes de
varias fuentes: internas (procedentes de los sistemas transaccionales de los diferentes
departamentos de la empresa, tales como recursos humanos, marketing, ingenierías,
etc.), externas y personales. Repositorio de gran capacidad de datos históricos que se
organizan por temas para el apoyo en la toma de decisiones.
Proveedores
Características
Orientado a temas o entidades (vendedor, cliente, producto, precio, etc.).
Integrado. Los datos que se producen en las diferentes fuentes se integran y
homogenizan a medida que se cargan en un Data Warehouse.
Almacenar años de datos, es decir, datos históricos de varios años.
No volátil. Después de que los datos se han introducido en un Data
Warehouse, los usuarios no pueden cambiar o actualizar los datos 14.
Multidimensional: Las bases de datos relaciónales almacenan datos en tablas
bidimensionales. Los DW tienen una estructura de cubos, cuyas aristas serian
las dimensiones del negocio, temas o quizá las entidades.
Basados en la Web.
Cliente / servidor. Tienen esta estructura de acceso.
Tiempo real. Permiten su uso constantemente actualizado.
Metadatos. Un Data Warehouse contiene metadatos (datos que generan
datos), que facilitan la gestión de datos complejos.
Complejos de implantar15 y costosos.
DATE MART
12
Los mejores proveedores son: Microsoft, Oracle, Amazon y SAP.
13
Presentan el problema de la actualización: la consistencia falla cuando se modifican los registros.
14
Los datos se actualizan, pero solo a través de procesos de carga (entrada).
15
Para su implantación, dos a tres meses para un Data Mart, y no menos de seis a nueve meses para un
Data Warehouse. Conviene centralizar cuando el volumen de datos crezca.
Almacén de datos departamental o funcional, de un tamaño más pequeño y aplicado a
un departamento específico, en lugar del Data Warehouse global de la empresa.
Pueden ser dependientes (de un DW), ofreciendo más consistencia, o independientes
(se nutren directamente de las fuentes).
Están hechos para necesidades específicas (no tanto para analítica de negocio). 16
16
Sistemas operacionales/transaccionales: OLTP, son las bases de datos bidimensionales tradicionales.
17
Los proveedores que mejor integran todas las herramientas (adquisición de datos para Inteligencia de
Negocios, Analítica y Data Warehousing; Gestión de datos maestros; Consistencia de datos entre
aplicaciones comerciales; Compartición de datos entre empresas; Gestión de datos en Lagos de Datos;
Migración de datos) según Gartner, 2018, son: IBM, SAP, SAS, Oracle, Informática y Talend.
Consistencia. De formato y contenido tras procedimientos de integración.
Oportunos. Deben actualizarse según los objetivos del análisis.
No redundantes, significativos y accesibles.
CUBOS OLAP
Un cubo OLAP es una base de datos que posee varias dimensiones, que amplía las
posibilidades que hasta el momento ofrecían las conocidas hojas de calculo. Una base
de datos multidimensional puede contener varios cubos o vectores (hipercubos). Las
herramientas OLAP19: MOLAP, ROLAP, HOLAP y DOLAP (sistemas OLAP de escritorio).
MOLAP: base de datos multidimensional. Los datos se organizan en una
estructura tipo cubo que el usuario puede rotar. Es muy adecuado para
resúmenes e informes financieros.
ROLAP: base de datos relacional. Puede crear vistas multidimensionales
(proporciona la función analítica), pero no de estructura cubo de datos.
HOLAP: Almacena algunos datos en un motor relacional, y otros, en una base
de datos multidimensional. Trata de combinar las ventajas de MOLAP y ROLAP.
Por ejemplo, cuando se necesita información tipo resúmenes, HOLAP potencia
la tecnología de cubos para el desempeño más rápido. Cuando se necesita una
información detallada, HOLAP se apoya en los datos relacionales.
19
Proveedores de OLAP: Microsoft, Business Object, Qlik, etc.
1. Los almacenes de datos (Data Warehouse y Data Mart) soportados por bases de
datos relacionales, que soportan datos estructurados organizados en filas y columnas
(tablas).
2. Sistemas de Big Data que soportan grandes volúmenes de datos estructurados, no
estructurados y semiestructurados, basados esencialmente en marcos de trabajo
Hadoop y, cada vez con mayor frecuencia, Spark.
Un modelo de datos ─ciclo de vida del dato o cadena de valor del dato─ contiene: los
tipos de datos empresariales que su empresa va a registrar, el modo de
almacenamiento, el proceso y el modo de acceso a dichos datos. Se rige por las 5 uves:
20
A diferencia del Lago (permite almacenar datos sin procesar y luego aplicar incrementalmente la
estructura, según los requisitos analíticos), es un repositorio de datos estructurados, modelados,
integrados, de múltiples fuentes, organizados para la recreación de informes analíticos.
Modelo de las 7 V:
Ejemplos: Europa, Madrid, Barcelona, Zaragoza, País Vasco, Canarias, España, Aragón,
la plataforma Civio
BASES DE DATOS