Ilovepdf Merged

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 194

INTRODUCCION A DATA ANALYTICS

FUNDAMENTOS DE INTELIGENCIA DE NEGOCIOS


Los arqueólogos marcan el inicio de la estadística en el antiguo Egipto, los Egipcios documentaban
sus cálculos y teorías en papiro (su propia hoja de trabajo)
CUAL FUE EL ORIGEN DEL DATA ANALYSIS
BUSINESS INTELLIGENCE (BI)

 Business Intelligence (BI) o Inteligencia de Negocios comprende un conjunto de técnicas y herramientas que
ayudan a las empresas a una mejor toma de decisiones, pues permite que las organizaciones accedan a gran
cantidad de información. Este proceso inicia con un análisis de todas las operaciones de la empresa para
determinar los puntos claves que permiten impulsar el negocio; luego, se realiza el procesamiento y la
organización de datos que facilitan la toma de decisiones; y finalmente, se monitorean los resultados.
DATA

 Es una colección de hechos/ elementos, que puede incluir:


 Números
 Imágenes
 Videos
 Palabras
 Mediciones
 Observaciones
 etc
DATA ANALYSIS

 Es la colección, transformación y organización de


datos (Data) con el fin de visualizar conclusiones,
hacer predicciones y conducir a una toma de
decisiones informada.
 Todos usamos y creamos datos todos los días, por
ejemplo usamos datos cuando:
 ha leído un review de articulo antes de hacer una compra
en amazon? Eso es analisis de datos!
 Utiliza un fitness tracker para contar para contar los pasos
en el día, eso también es análisis de datos!
 Creamos datos cuando hacemos uso de nuestros
dispositivos y navegamos en internet, hacemos un post
en social media, usamos Spotify, Google maps, etc
 Google procesa 40,000 búsquedas por segundo y 3,5
billones al día, 1,2 trillones en el año
PROCESO DE ANALISIS DE DATOS BASADO EN GOOGLE

Se pregunta usando Acceso a los datos Conectar los Convertir y Responder a través Resultados.
la técnica SMART objetivos al analisis formatear datos, de dashboards,
de datos y limpiar la analizar procesos y utilizar herramientas
Preparar datos data buscar por feedback para comunicar y Actúe sobre los
Preguntas para recopilando y presentar la datos y utilice los
ASK

PREPARE

ANALYZE

SHARE

ACT
PROCESS
definir el problema almacenando la información resultados del
información. Procesar datos Analice los datos análisis
limpiando y para encontrar
Incluye la meta, comprobando la patrones, relaciones Comparte datos con
objetivos y Incluye la información y tendencias tu audiencia Incluye las
preguntas generación de datos, soluciones a trabajar
recolección, para resolver el
almacenamiento y Incluye la limpieza e Incluye la Incluye comunicar e problema
administración de integridad de datos exploración de interpretar
datos datos, visualización y resultados
análisis
USOS DE LA INFORMACIÓN

Identificar Tomar
Mejorar Lanzar nuevos Servir a
oportunidades decisiones
procesos productos clientes
y tendencias bien analizadas
DATA ANALYSIS AND BUSINESS ANALYTICS

DATA ANALYSIS Tipos de Business analytics


Descriptivo Interpreta datos históricos para identificar tendencias o
 Con el analisis de datos se: patrones
 Recolectan
 Transforman y Predictivo Toma la información y la usa para pronosticar futuros
resultados
 Organizan
Los datos con el fin de: Diagnostico Se utiliza para identificar la causa raíz de un problema

 obtener conclusiones
 hacer predicciones y Prescriptivo Utiliza pruebas y otras técnicas para determinar qué
resultado producirá el mejor resultado en un escenario
 conducir a la tomar decisiones informada en particular
BUSINESS ANALYTICS VS DATA SCIENCE

Business Analytics Data Science


 se enfoca en convertir los datos sin procesar en
conclusiones significativas mediante el uso de
algoritmos y modelos estadísticos.
 Su objetivo principal es es extraer información
significativa de los datos para guiar las decisiones  los científicos de datos se enfocan en la limpieza de
organizacionales datos, la programación y el modelado estadístico.
 Los analistas de negocios participan en tareas como  Tiene 3 disciplinas:
elaboración de presupuestos, pronósticos y desarrollo  Machine learning
de productos
 Estadística
 Analítica
LAS 3 DISCIPLINAS DE DATA SCIENCE:
MACHINE LEARNING, ESTADÍSTICA Y ANALÍTICA

Data science
Machine Learning and AI
• Se desea automatizar y tomar muchísimas decisiones en circunstancias inciertas

Estadística
• Se desea tomar decisiones en circunstancias inciertas

Analítica
• No se sabe cuantas decisiones se desean obtener, se desea explorar y entender su negocio.
DATA ANALYST (ANALISTA DE DATOS)
DATA SCIENTIST (CIENTIFICO DE DATOS)
DATA SPECIALIST/ ENGINEER (INGENIERO DE DATOS)

Data Analyst
 Encuentra respuestas a preguntas existentes
mediante la creacion de conocimientos a partir de
fuentes de datos

Data Scientist

 Crea nuevas preguntas a partir de datos puros

Data Engineer
 Maneja base de datos, código, recuperación de datos
DATA ECOSYSTEM

 Se constituye de varios elementos que interactúan


mutuamente para producir, administrar, almacenar,
organizar, analizar y compartir datos.
 En estos elementos se incluye el hardware,
herramientas de software y personas que los usan
CLOUD

 Los datos también se almacenan online en lugar del


disco duro de una computadora local.
 Cloud (la nube) es el termino que se usa para
describir una localización virtual.
Posteo de nuevos Estadísticas de Tasa de Datos de redes
empleos empleo y sueldos sociales de prospectos

DATA ECOSYSTEM DE UN DEPARTAMENTO DE RECURSO HUMANO QUE PUEDE SER


UTILIZADO POR UN ANALISTA DE DATOS PARA MEJORAR EL RECLUTAMIENTO Y RETENCIÓN
PENSAMIENTO ANALÍTICO
Curiosidad
Analizar el contexto
Pensamiento lógico / técnico
Diseño de datos (organizar)
Skills
Estrategia de datos
ANALYTICAL SKILLS Cualidades y características asociadas con resolver problemas a partir de hechos
Visualización
Estrategia
Orientado a solución de problemas
Identificar correlaciones
elementos
Pensar en “big picture”

ANALYTICAL THINKING Aspectos a trabajar


HERRAMIENTAS PARA ANALISIS DE DATOS

Lenguaje de Software de
Hojas de calculo Bases de datos
consultas (Queries) visualización
Planear: El negocio decide que
tipo de datos necesita, quien
será el responsable y que desea
obtener

Destruir: mecanismo para


destruir datos que ya no son Capturar: Recolecta datos de
útiles a lo largo de un tiempo diferentes fuentes
en particular (políticas)

Analizar: los datos se usan


Archivar: datos en información
para resolver problemas, tomar
que la compañía tiene
decisiones o impulsar toma de
usualmente en bases de datos
decisiones

Administrar: Donde se
almacenan los datos,
mecanismo, seguridad,
mantenimiento apropiado.

FASES DE LOS DATOS EN EL CICLO DE Los datos pasan por diferentes etapas
VIDA
REVIEW

Etapas ASK Preguntar Etapas Planear


del del
proceso PREPARE Preparar Capturar
de ciclo
analisis PROCESS Procesar de Administrar
de vida
datos de los
ANALYZE Analizar Analizar
datos
SHARE Compartir Archivar
ACT Actuar Destruir
Para analizar:
Cómo se relacionan ambos ciclos?
De qué forma son similares?
De qué forma son diferentes?
FUENTE:
DATA FOUNDATIONS GOOGLE CAREERS GRACIAS
Fundamentos de
Inteligencia de Negocios

Semana 1
Identificar el concepto
OBJETIVO de Inteligencia de
negocios
Introducción al BI
• El progreso y la evolución hacen que las sociedades estén en
un constante cambio.
• Los nuevos modelos económicos generadores de riquezas,
obligan a las empresas a realizar un esfuerzo de mejora
continua, acercándose todo lo posible al usuario y
consumidor.
• Necesidad de dotar a las diferentes organizaciones de una
mente superior capaz de dar respuestas concretas y
prácticas, para conseguir optimizar al máximo toda actividad
empresarial.
Introducción al BI
• De la misma manera que el cuerpo humano ingiere
alimentos, las empresas requieren de información para
nutrirse, alimentarse y crecer en el mundo de los negocios
que avanza velozmente.
• Los datos son elementos de incalculable valor para que las
empresas ganen competitividad y velocidad en este nuevo
paradigma económico.
• Almacén de las empresas, en la era de la Información y del
Conocimiento.
Introducción al BI
• Las organizaciones necesitan tomar decisiones de manera
cada vez más eficiente y rápida.
• Decisiones fundamentadas en datos.
• No es suficiente apoyarse en tareas manuales para el análisis
de datos
• Las organizaciones deben apoyarse en los sistemas de
inteligencia de negocio como estrategia angular para
desarrollar sus estrategias de datos.
Introducción al BI
• La gestión de una organización se fundamenta en tomar
decisiones adecuadas respecto a clientes, productos,
empleados, proveedores y procesos de negocio.
• Una nueva forma de competir que se fundamenta en tomar
decisiones basadas en datos y evidencias dejando atrás la
intuición.
• Combina diferentes estrategias para generar valor de
negocio: business intelligence (BI), business analytics y big
data.
• El objetivo es poder tomar mejores y más rápidas decisiones
informadas de negocio.
Introducción al BI
• Aunque vivimos en la era de los datos complejos, conocida
como big data, y la progresiva automatización de nuestras
capacidades predictivas, la inteligencia de negocio sigue
siendo relevante.
• No todas las organizaciones han logrado alcanzar el éxito
esperado.
La pirámide organizacional
• Toda empresa, organización o negocio nace con unos
objetivos alcanzables mediante un trabajo organizado.
• Esta planificación transforma horizontalmente las
actividades necesarias para conseguir los objetivos del
negocio, en tareas concretas y bien definidas.
• También queda establecido un orden jerárquico para la
toma de decisiones que serán representados en diferentes
niveles:
Orden Jerárquico de Toma de Decisiones
Nivel Superior Nivel Medio Nivel Inferior
ESTRATÉGICO TÁCTICO OPERATIVO

• En este nivel es donde se • En este nivel intermedio • Los profesionales que


crean las estrategias para se planifica y coordina integran este nivel son
perseguir los objetivos todos aquellos trabajos los encargados de
de las empresas. Lo de los diferentes ejecutar aquellas tareas
conforman los altos departamentos de la que se coordinan y
cargos de la empresa, que programan desde el nivel
organización, quienes posteriormente se táctico. Lo conforma la
tienen poder para desarrollarán en el masa de empleados de la
establecer las políticas de siguiente plano inferior. organización.
las organizaciones. Los profesionales que
conforman y actúan en
este nivel son aquellos
que gerencian cada
departamento o área.
Valor en las compañías
la necesidad de
concebir ventajas
competitivas, basadas
en la información y el
conocimiento.

Los negocios compiten


diariamente en un
universo empresarial
complejo y globalizado.
¿Que es inteligencia de Negocios?
Business Intelligence o también llamado la Inteligencia de negocios Hace referencia al
manejo optimizado de los datos que almacena, recopila y analiza una organización,
siendo capaz de transformarlos en decisiones estratégicas que permitan el diseño de
acciones orientadas a alcanzar el éxito empresarial.

Business Intelligence es conjunto de metodologías, aplicaciones, prácticas y capacidades


enfocadas a la creación y administración de información que permite tomar mejores
decisiones a los usuarios de una organización.

La Inteligencia de Negocios aplicada a cualquier organización opera como una fuerza


transformadora del ecosistema empresarial, generando nuevos impulsos y
oportunidades de negocio.
¿Que es inteligencia de Negocios?
Por tanto, esta inteligencia de negocios influye directamente en las decisiones que se toman en
el nivel superior o estratégico y que determinan el rumbo de la empresa, pero también es
necesaria la aplicación del Business Intelligence en otros estamentos de la organización.

«Lo que no se define no se puede medir. Lo que no se mide, no se puede mejorar. Lo que no se
mejora, se degrada siempre».

William Thomson
Business Intelligence en el nivel estratégico
- A este nivel, el Business Intelligence facilita y confiere a la alta
dirección contar con información, analizarla y monitorear las
tendencias y evoluciones; de esta manera puede valorar el nivel de
consecución de los objetivos estratégicos de la organización, tomando
En definitiva
rápidas decisiones.
afecta en la
Business Intelligence en el nivel táctico totalidad del
- El Business Intelligence permite que la gerencia que se encuentra
en este nivel, junto con los analistas de datos, puedan hacer uso de
sistema de
herramientas analíticas para poder llegar a conclusiones, accediendo
a información sin necesidad de recurrir a otros estamentos.
gestión
empresarial:
Business Intelligence en el nivel operativo
- Facilita a los empleados información directa y clara sobre los
procedimientos a seguir mediante instrucciones precisas. Esta
información se representa mediante informes con datos actualizados.
Algunas de las tecnologías que forman parte de
la business intelligence son estas:
• Data warehouse.
• Reporting.
• Análisis OLAP (online analytical processing).
• Análisis visual.
• Análisis predictivo.
• Cuadro de mando.
• Cuadro de mando integral.
• Minería de datos.
• Gestión del rendimiento.
• Previsiones.
• Reglas de negocio.
• Dashboards.
• Integración de datos (que incluye extract,
transform and load; ETL).
Ejemplo Práctico
El ejemplo servirá para comprender que es una solución de Business Intelligence. Tanto la organización
como la situación expuestas a continuación son ficticias. aunque la problemática y la necesidad son
similares a las de muchas empresas: contar con la información que permita tomar decisiones respecto a su
quehacer.

Viajes Mercurio es una antigua agencia de viajes, de alto prestigio y con oficinas en todas las grandes
ciudades del país, que ha perdido su clientela de forma progresiva debido a la proliferación de empresas del
mismo rubro y la competencia de los departamentos de viajes de grandes cadenas comerciales.
Muchos de los agentes conocen a sus clientes habituales. recuerdan sus intereses. su nivel económico y su
disponibilidad de tiempo. Pero esto no es suficiente. Cuando un agente no se encuentra. o bien cuando se
incorporan nuevos agentes, se repiten las situaciones en las que el cliente debe explicar, por ejemplo. que sus
vacaciones son solo de quince días en agosto y que los quince días restantes los utilizará, como siempre. en
Navidad, para Viajar a Chicago donde vive su hijo. En agosto desea tomar, como todos los años, un tour a
Sudamérica. Una vez más deberá explicar que son cuatro personas: su esposa, sus suegros y él. Y como ellos
ya son personas mayores, el tour no puede ser agotador.
Ejemplo Práctico
Cuando el agente que lo atiende empieza a detallar todos los destinos posibles, el deberá explicarle que hace mucho
tiempo dejaron de interesarle las ruinas, y que, como ya ha dicho en otras ocasiones, ahora lo que desea es tomar el sol
en una playa tranquila, con vegetación exuberante y con la posibilidad de recorrer pueblos y comprar artesanías típicas.
Dicho esto, el agente selecciona solo los tours que cumplen con esas características, pero él ya ha recorrido Brasil de
norte a sur, también Ecuador, México y Costa Rica. Las alternativas se reducen cada vez más hasta llegar a las dos últimas
posibilidades: un tour a la isla de Pascua, pero las fechas de salida no coinciden con las de sus vacaciones, y un tour a
Uruguay, donde solo quedan cupos para dos personas. Desilusionado, el cliente pregunta ahora por los pasajes a Chicago,
ya que seguramente es hora de reservarlos, pero ¡sorpresa! No se sabe qué ha sucedido este año, pero todos los vuelos
están copados para esa fecha.
Preocupados por la situación, los directivos de la agencia se embarcan en un proyecto de Business Intelligence y durante
la fase de análisis descubren que deben crear una base de datos donde registren, por un lado, la información de sus
prestaciones [tours, venta y reserva de pasajes, hoteles, etcétera) y, por otro, la información de sus clientes: preferencias,
exigencias, disponibilidades de tiempo y económicas, predilecciones de líneas áreas y necesidades adicionales, como
asistencia en vuelos o viaje con animales de compañía. También la composición familiar y la historia de los servicios
utilizados.
Ejemplo Práctico
Como resultado del proyecto, al año siguiente el cliente recibe por correo folletos con información de todos los tours a
playas tropicales que él no conoce y que se realizarán en las fechas en que el toma sus vacaciones. Y para su sorpresa,
recibe también una carta indicándole que se le han reservado dos pasajes para viajar a Chicago en Navidad y que él solo
debe telefonear para confirmarlos. Adicionalmente, la empresa se da cuenta de que existen segmentos de la población
que no están incluidos en sus prestaciones como son el turismo de aventura y lugares no turísticos y puede así captar
nuevos clientes.
El siguiente
diagrama,
creado por
Forrester
Research
(Una de las
principales
empresas de
prospección
del mercado),
ilustra las
diferentes
tecnologías y
aspectos que
forman parte
de la
inteligencia de
negocio:
Las principales características que limitan
estos sistemas son:
• Gran rigidez a la hora de extraer datos
• Necesidad de conocimientos técnicos
• Deterioro en el rendimiento de los sistemas de
información
• Falta de integración que implica islas de datos
• Datos erróneos, obsoletos o incompletos.
• Problemas para adecuar la información a cada usuario.
• Ausencia de información histórica
Diferencias entre business intelligence,
business analytics y big data
Business analytics
Se entiende por business analytics el conjunto de estrategias, tecnologías y
sistemas que permiten analizar el rendimiento pasado de una organización
para poder predecir comportamientos futuros, así como para detectar
patrones ocultos en la información.

Big data.
Se entiende por big data el conjunto de estrategias, tecnologías y sistemas
para el almacenamiento, procesamiento, análisis y visualización de conjuntos
de datos complejos, que frecuentemente, pero no siempre, viene definida por
volumen, velocidad y variedad.
La siguiente
tabla describe
las diferencias
entre estas
estrategias:
La siguiente gráfica
permite identificar
casos de uso
respecto a la
complejidad del
dato y las
capacidades
analíticas que
desarrollar en la
organización.
Beneficios de un sistema de business
intelligence
• Crear un círculo virtuoso de la información
• Proporcionar una visión única, conformada, histórica, persistente y de calidad de toda la información
relevante para la organización.
• Crear, manejar y mantener métricas, indicadores claves de rendimiento (key performance indicador; KPI) e
indicadores claves de metas (key goal indicator; KGI) fundamentales para la empresa.
• Habilitar el acceso a información actualizada.
• Reducir el diferencial de orientación de negocio entre el departamento TI y la organización.
• Mejor comprensión y documentación de los sistemas de información en el contexto de una organización.
• Mejor compresión de las opiniones y necesidades de los potenciales clientes a partir del análisis de redes
sociales.
• Mejora de la competitividad de la organización como resultado de ser capaces de:
– Diferenciar lo relevante de lo superfluo.
– Acceder más rápido a información.
– Tener mayor agilidad en la toma de las decisiones.
¿Cuándo es necesaria la inteligencia de
negocio?
Existen situaciones en las que la implantación de un sistema de business
intelligence resulta adecuada:

• La toma de decisiones se realiza de manera intuitiva en la organización.


• Identificación de problemas de calidad de información.
• Uso de Excel como repositorios de información corporativos o de usuario.
Lo que se conoce como Excel caos.
¿Cuándo es necesaria la inteligencia de
negocio?
• Necesidad de cruzar información de manera ágil entre
departamentos.
• Evitar silos de información.
• Las campañas de marketing no son efectivas por la información
base usada.
• Existe demasiada información en la organización para ser
analizada de la manera habitual. Se ha alcanzado la masa crítica
de datos.
• Es necesario automatizar los procesos de extracción y
distribución de información.
Los sistemas de business intelligence
buscan responder a las preguntas:
• ¿Qué pasó?
• ¿Qué pasa ahora?
• ¿Por qué pasó?
• ¿Qué pasará?
Bibliografía

Curto Díaz, J. (2016). Introducción al business intelligence. Barcelona, Editorial UOC.


Recuperado de https://elibro.net/es/ereader/unitechn/101030?.

López Benítez, Y. (2018). Business Intelligence. ADGG102PO. Antequera (Málaga), IC


Editorial. Recuperado de https://elibro.net/es/ereader/unitechn/124393?.
Fundamentos de
Inteligencia de Negocios

Semana 2
Comprender y explicar la
OBJETIVO importancia de tener una
estrategia de BI
Porque necesita una empresa un
sistema de BI?
Información

Depurar la información

Integrar los datos

Visualizar la información

Analizar la información

Gestionar la toma de Gestionar la ejecución de las


Decisiones decisiones
Implementación exitosa de BI
Implementar y generar una
iniciativa de BI puede ser largo,
costoso y propenso al fracaso.
Aunque suele asociarse al sector
privado empresarial, el BI aplica
a cualquier organización que
tenga bases de datos ya sea una
empresa, un organismo o una
institución pública.
Conceptos de Importancia en BI
BASE DE DATOS
https://youtu.be/knVwokXITGI
Algunos conceptos de importancia de BI
1. Fuente de Datos: Los datos pueden provenir externamente de la relación que se mantenga con los
clientes de una empresa (CRM) o bien son datos propios de la misma que administran los recursos e
información de la organización (ERP).
2. ETL: son las iniciales que responden a los conceptos de Extract = Ex- traer, Transform = Transformar y
Load = Cargar y que definen el conjunto de procesos de extracción y transformación de datos, con el fin
de poder ser cargados para su almacenaje como un sistema de organización de información.
3. Data Warehouse: Es en los diferentes Data Warehouse de las organizaciones donde se acumulan y
clasifican las diferentes fuentes de datos, por tanto, una empresa acumula sus datos en un contendor
llamado Data Warehouse.
4. Data Marts: son un subconjunto de datos, almacenados en pequeños contendores, clasificados por
contener datos específicos de cada área de la organización.
5. Informes: son la representación detallada de información extraída de los datos o materia prima inicial,
pueden ser mostrados mediante gráficas u otros tipos de muestra. Aportan información valiosa para la
empresa y muy útil para la optimización de toma de decisiones.
Conceptos de Importancia en BI

DATAWAREHOUSE, DATA LAKE, DATA MART

https://youtu.be/LZ17kISv5Ag

NUBE https://youtu.be/h4Af5bbFAq0
Ejercicio de Clase
Escriba en un documento de Word los siguientes conceptos:
1. Que es una Base de Datos?
2. Que es un gestor de Base de Datos?
3. Cómo se clasifican las Bases de Datos?
4. Que es una Base de Datos Relacional?
5. Que es un software ERP y CRM?
6. Que es un Datawarehouse?
7. Que es un Data Mart?
8. Que entiende por almacenamiento en la Nube?

Luego suba su trabajo en el enlace en la plataforma


Estrategia de business intelligence
Desplegar un proyecto de
inteligencia de negocio en el seno
de una organización no es un
proceso sencillo. Las buenas
prácticas indican que, para llegar a
buen puerto, es necesario tener una
estrategia de inteligencia de
negocio que coordine las
tecnologías, el uso, los procesos de
madurez, la metodología que
emplear, etc.
¿Cómo detectar que
no existe una
estrategia?
• Es posible detectar que no existe una
estrategia definida a través de los
siguientes puntos y percepciones en el
seno de una organización:
• Los usuarios identifican el
departamento de informática
(information technology; IT)
como el origen de sus problemas
de inteligencia de negocio.
• La dirección considera que la
inteligencia de negocio es otro
centro de costos.
¿Cómo detectar que
no existe una
estrategia?
• El departamento de IT
continúa preguntando a los
usuarios finales sobre las
necesidades de los informes.
• El sistema de BI está
soportado por help desk.
• No hay diferencia entre BI y
gestión del rendimiento.
• No es posible medir el uso del
sistema de inteligencia de
negocio.
¿Cómo detectar que no
existe una estrategia?
• No es posible medir el retorno de la inversión (return
on invest; ROI) del proyecto de business intelligence.
• Se considera que la estrategia para el data
warehouse es la misma que para que el sistema de
inteligencia de negocio.
• No hay un plan para desarrollar, contratar, retener y
crecer el equipo de BI.
• No se sabe si la empresa tiene una estrategia para el
BI.
• No existe un responsable funcional (o bien el
asignado no es el adecuado).
• No existe un centro de competencia.
• Existen múltiples soluciones en la organización
distribuidas en diferentes departamentos que repiten
funcionalidad.
¿Cómo detectar que no existe una
estrategia?
• No hay un plan de formación real y consistente de uso de las
herramientas.
• Alguien cree que es un éxito que la información consolidada esté a
disposición de los usuarios finales al cabo de dos semanas.
• Los usuarios creen que la información del data warehouse no es
correcta.
• No existe una cultura analítica en la que el dato y los hechos son
relevantes para tomar decisiones sea cual sea el nivel de la
organización.
Desarrollo de una estrategia de
negocio Crear un centro de competencia (o de excelencia) de BI
(BICC).

El desarrollo de una
estrategia de negocio es un Establecer los estándares de BI en la organización.
proceso a largo plazo que
incluye múltiples actividades,
entre las que es conveniente
destacar: Identificar qué procesos de negocio necesitan diferentes
aplicaciones analíticas que trabajen de manera continua para
asegurar que no existen silos de funcionalidad.
Desarrollo de una estrategia de
negocio
Desarrollar un framework de métricas a nivel empresarial como el pilar de una gestión del rendimiento a nivel
corporativo.

Incluir los resultados de aplicaciones analíticas (minería de datos u otras) en los procesos de negocio

Revisar y evaluar el portafolio actual de soluciones en un contexto de riesgo / recompensas.

Considerar inversiones tácticas cuyo retorno de inversión estén dentro de un periodo de tiempo de un año

Aprender de los éxitos y fracasos de otras empresas


El hype cycle de Gartner

Es una representación gráfica de la madurez, adopción


y aplicación de negocio de una o varias tecnologías
específicas.
Las etapas que
componen el
ciclo son las
siguientes:

• Disparador tecnológico.
• Pico de expectativa inflada.
• Valle de la desilusión.
• La pendiente de tolerancia.
• Plateau de productividad.
Business
intelligence
maturity model
• El BIMM (business intelligence maturity
model) es un modelo de madurez que
permite clasificar nuestra organización
desde el punto de vista del grado de
madurez de implantación de sistemas
business intelligence en ella (en relación
directa con frameworks como COBIT6)

• Aunque existen distintos modelos de


madurez, como el modelo Delta analítico
de Thomas Davenport o el de TDWI.
Modelo de
Madurez
COBIT
Fase 1: No existe BI.

Fase 2: No existe BI, pero los datos son accesibles.

Modelo de
Madurez BI Fase 3: Aparición de procesos formales de toma
de decisiones basada en datos.

Fase 4: Data warehouse.

Fase 5: El data warehouse crece y el reporting se


formaliza.
Fase 6: Despliegue de
OLAP.
Modelo de
Madurez BI
Fase 7: El business
intelligence se
formaliza
Soluciones open source
business intelligence
• El open source es una filosofía de desarrollo de
software que cumple los siguientes principios:

• Abierto: la comunidad tiene libre acceso, uso


y participación del código fuente, así como la
posibilidad de uso de foros para proporcionar
feedback.
• Transparencia: la comunidad tiene acceso al
roadmap, documentación, defectos y agenda
de las milestones.
• Early & often: la información se publica de
manera frecuente y pronto a través de
repositorios públicos (incluyendo el código
fuente).
Soluciones open source
business intelligence

• El open source ya no es una tendencia


emergente, sino que es un enfoque que tiene un
impacto profundo y una presencia importante en
todos los sectores, tal y como comentaban los
analistas de Gartner (Plummer y otros, 2008):
• «2012, el 80 % del SW comercial incluirá algún
componente open source. Incluir componentes
open source en los productos para abaratar
costes es considerado la mínima estrategia que
las compañías pueden llevar a cabo para
mantener su ventaja competitiva en 5 años».
Virtual Gartner IT Symposium/Xpo™ 2020

Las tendencias de este año se encuentran en tres temas: centralidad de personas,


independencia de lugar y delivery resiliente.
• Centralidad de personas (People Centricity) : A pesar de que la pandemia cambió cómo
las personas trabajan e interactúan con las organizaciones, siguen en el centro de todos los
negocios. Necesitando procesos digitalizados para poder funcionar en el entorno actual.
• Independencia de lugar (Location Independence): el COVID-19 ha trasladado donde
empleados, proveedores, clientes y ecosistemas organizativos existen físicamente. La
independización de lugar requiere un cambio de tecnología para poder sostener esta
nueva versión de negocio.
• Delivery resiliente (Resilient Delivery): Ya sea una pandemia o una recesión, la volatilidad
existe en el mundo. Organizaciones que están preparadas para pivotar y adaptarse
resistirán todo tipo de disrupciones.
Primera tendencia:
Internet of Behaviors
• El IoB puede recolectar, combinar y procesar información de

muchas fuentes incluyendo: Información comercial del cliente;

información del ciudadano procesada por el sector público y agencias

del gobierno; redes sociales, despliegues de dominio público de

reconocimiento facial; y seguimiento de ubicación. La creciente

sofisticación de la tecnología que procesa esta información ha

habilitado que esta tendencia crezca.

• El IoB tiene implicaciones sociales y éticas dependiendo de las

metas y resultados de usos individuales. Los mismos dispositivos

“wearable” que usan las compañías de seguro para seguir las

actividades físicas para reducir premiums también podrían ser usadas

para monitorear compras de víveres; muchos artículos insalubres

incrementarían los premiums. Las Leyes de privacidad, que varían de

región a región, tendrían un gran impacto en la adopción y escala del

IoB.
Segunda tendencia: Experiencia total
La experiencia total combina la Por ejemplo, una compañía de telecomunicaciones transformó
multiexperiencia, experiencia con el cliente, toda su experiencia del cliente en un esfuerzo para mejorar la
experiencia del empleado y experiencia de seguridad y satisfacción. Primero, desplegó un sistema de citas
usuario para transformar el resultado del a través de una app ya existente. Cuando los clientes llegaban
negocio. La meta es mejorar la experiencia para su cita y se acercaban dentro de 75 pies de la tienda,
general donde todas estas piezas se reciben dos cosas: 1) una notificación para guiarlos a través del
intersectan, tecnología, empleados y proceso de check-in y 2) una alerta haciéndoles saber cuanto
usuarios. Esta tendencia habilita la tiempo sería antes de poder entrar seguramente a la tienda y
capitalización de disruptores de COVID-19 a mantener distanciamiento social.
las organizaciones La compañía también ajustó su servicio para incluir más kioskos
digitales y permitir a los empleados usar sus propias tablets
para co-navegar los aparatos de los clientes sin tener que
tocarlos físicamente. El resultado fue uno más seguro,
transparente e experiencia global integrada para los clientes y
empleados.
Tercera tendencia:
Computación que mejora la
privacidad
• Privacy Enhancing Computation cuenta con
tres tecnologías que protegen la información
mientras es utilizada. La primera provee un
ambiente de confianza en el cual la información
sensible puede ser procesada o analizada. La
segunda lleva a cabo el procesamiento y la
analítica de una manera descentralizada. La
tercera encripta información y algoritmos antes
del procesamiento o la analítica.
• Esta tendencia permite que las organizaciones
colaboren en la investigación de forma segura en
múltiples regiones y con competidores sin tener
que sacrificar la confidencialidad. Este
acercamiento está diseñado específicamente
para la creciente necesidad de compartir
información manteniendo la privacidad o
seguridad.
Cuarta tendencia: Nube distribuida
La nube distribuida es donde los servicios de nube son distribuidos a diferentes ubicaciones físicas, pero la
operación, gobernancia y evolución permanecen bajo la responsabilidad del proveedor público de la nube.

Permitir que las organizaciones tengan estos servicios


físicamente más cerca ayuda a escenarios de baja latencia,
reduce el costo de información y ayuda a acomodar leyes
que dictan que la información debe permanecer en una
área geográfica específica. Sin embargo, también significa
que las organizaciones siguen beneficiándose de la nube
pública y no manejan su propia nube privada, lo que
puede ser complejo y costoso. La nube distribuida es el
futuro de la nube.
Quinta tendencia: Operaciones en cualquier
lugar
Un modelo de operaciones en cualquier lugar será vital
para que los negocios superen exitosamente el COVID-19.

El modelo para operaciones en cualquier lugar es “digital


first, remote first”, por ejemplo: bancos que solo son
móviles, pero que manejan todo desde transferir fondos
hasta abrir cuentas sin interacción física. "Digital" debería
ser la opción por defecto todo el tiempo. Eso no quiere
decir que el espacio físico no tenga su propio espacio,
pero debería ser mejorado digitalmente, por ejemplo,
check-out sin contacto de una tienda física, así sean físicas
o digitales las capacidades deben ser provistas
transparentemente.
Sexta tendencia: Malla de ciberseguridad

• La malla de ciberseguridad es un enfoque


arquitectónico distribuido para un control de
ciberseguridad escalable, flexible y confiable.
• La malla de ciberseguridad esencialmente
permite que el perímetro de seguridad sea
definido alrededor de la identidad de una
persona u objeto. Permite un enfoque de
seguridad más modular y receptivo al centralizar
la orquestación de políticas y distribuir la
aplicación de políticas. Al convertirse la
protección del perímetro menos significante, el
enfoque de seguridad de una “ciudad
amurallada” debe evolucionar a las necesidades
actuales.
Séptima tendencia: Negocios componibles inteligentes

Un negocio componible inteligente es uno que puede adaptarse y fundamentalmente


reorganizarse en base a una situación actual. Cuando las organizaciones aceleran las
estrategias digitales de negocios para lograr la transformación digital de forma más rápida,
necesitan ser ágiles y tomar decisiones rápidas basadas en la información actualmente
disponible.
Para hacer esto exitosamente, las organizaciones deben permitir mejor acceso a la
información, aumentar esa información con mejor visión y tener la habilidad de responder
rápidamente a las implicaciones de esa visión. Esto también incluirá incrementar la
autonomía y democratización en toda la organización, permitiendo que partes del negocio
reaccionen rápidamente en vez de estar atascados por culpa de procesos ineficientes.
Octava tendencia:
AI engineering
• Una robusta estrategia de Al
engineering facilitará el
rendimiento, escalabilidad,
interpretabilidad y fiabilidad de los
modelos Al al tiempo que se provee
el valor total de las inversiones en
Al. Los proyectos Al usualmente
enfrentan problemas con la
mantenibilidad, escalabilidad y
gobernanza, lo cual los convierte en
un desafío para la mayoría de las
organizaciones.
Novena tendencia: La
hiperautomatización

• La hiperautomatización es la idea
de que cualquier cosa que puede
ser automatizada en una
organización debería ser
automatizada. La
hiperautomatización está impulsada
por organizaciones que tienen
procesos de negocio legacy que no
están optimizados, lo que crea
problemas enormemente costosos y
extensos para las organizaciones.
Soluciones open source business intelligence
Top Herramientas Business Intelligence
•Pentaho (Kettle, Mondrian, JFreeReport and Weka. Versions OS y
Enterprise)
•Talend (ETL, Data quality and MDM. Versions OS y Enterprise)
•LinceBI (Kettle, Mondrian, STDashboard, STCard and STPivot)
•Jasper Reports (iReport. Versions OS y Enterprise)
•Power BI
Investigar: En que consiste la herramienta, que ofrece? Es totalmente gratuita o hay opción de pago?
Investigue empresas que utilizan esta herramienta y cómo ha sido la experiencia para ellas.
Bibliografía

Curto Díaz, J. (2016). Introducción al business intelligence. Barcelona, Editorial UOC.


Recuperado de https://elibro.net/es/ereader/unitechn/101030?.

López Benítez, Y. (2018). Business Intelligence. ADGG102PO. Antequera (Málaga), IC


Editorial. Recuperado de https://elibro.net/es/ereader/unitechn/124393?.
DATAWAREHOUSE
ALMACEN Y DISEÑO
OBJETIVO: COMPRENDER Y EXPLICAR EL CONCEPTO DE DATA WAREHOUSE Y SU DISEÑO
FACTS: FLORENCE NIGHTINGALE

 Enfermera durante la guerra de 1850


 Una analista de datos
 Miles de soldados morían cada día
 Examinó datos para reducir el numero de muertes
 La mayoría de soldados morían de situaciones que podían ser
prevenibles.
 Para demostrar esto creo un grafico que mostraría a los
administradores del hospital el numero de muertes en varios
meses.
 Estos resultados contribuyeron a realizar grandes cambios en
cuanto a los cuidados paliativos hospitalarios.
INTRODUCCIÓN

 El concepto y el enfoque de la inteligencia de negocio ha evolucionado bastante en los últimos años y


convive con otras estrategias. Uno de los conceptos que más ha evolucionado ha sido el repositorio o
almacén de datos, también conocido como data warehouse
 La importancia del data warehouse dentro del BI es máxima por ser el repositorio de la información
relevante para la organización.
 De su diseño óptimo depende parte del éxito de la comprensión del rendimiento de la organización y
del despliegue de un sistema de inteligencia de negocio.
EL NÚCLEO DE UN SISTEMA DE INTELIGENCIA DE NEGOCIO: EL
DATA WAREHOUSE

 Un data warehouse es un repositorio de datos que proporciona una visión global, común e integrada de los
datos de la organización, independiente de cómo se vayan a utilizar posteriormente por los consumidores o
usuarios.
 Tiene las propiedades siguientes:
 •Estable
 •Coherente
 •Fiable
 •Con información histórica.

 Al abarcar un ámbito global de la organización y con un amplio alcance histórico, el volumen de datos puede
ser muy grande (centenas de terabytes). Las bases de datos relacionales son el soporte técnico más
comúnmente usado para almacenar las estructuras de estos datos y sus grandes volúmenes.
 Big data =
TECNOLOGÍA enfocada a gran
solución de datos
 Data Warehouse=
ARQUITECTURA que soporta a gran
almacén de datos

DATA WAREHOUSE Y BIG DATA


Es una ARQUITECTURA que sirve como cimiento firme en la construcción de un sistema gerencial
DATA WAREHOUSE que integra todas las diferentes fuentes de datos de las que se alimenta.
DATAWAREHOUSE

 Un Data Warehouse es una base de datos


corporativa en la que se integra información
depurada de las diversas fuentes que hay en la
organización. Dicha información debe ser
homogénea y fiable, se almacena de forma que
permita su análisis desde muy diversas
perspectivas, y que a su vez dé unos tiempos de
respuesta óptimos. Para ello la información se
encuentra altamente desnormalizada y
modelada de una forma bastante diferente a los
sistemas transaccionales, principalmente se
utilizan los modelos en estrella (star schema) y
en copo de nieve (snowflake schema)
DATA WAREHOUSE
CARACTERÍSTICAS DE UN DATA WAREHOUSE

Organiza una Incluye datos Proporciona La

Variable en el tiempo

No volátil
Integrado
Orientado a un tema

colección de de múltiples información información


información orígenes y histórica de es
en torno a presenta distintos persistente
un tema consistencia hechos de sólo de
central. de datos. interés lectura para
los usuarios
finales
DATA MART

 Kimball determinó que para él un Data Warehouse no era más que un conjunto de los Data Marts de
una organización. Un Data Mart es una copia de las transacciones específicamente estructurada para
la consulta y el análisis. Defiende por tanto una metodología Bottom-up a la hora de diseñar un
almacen de datos.
 La diferencia de Data Warehouse y Data Marts es solamente en cuanto al alcance. Mientras que un
Data Warehouse es un sistema centralizado con datos globales de la empresa y de todos sus procesos
operacionales, un Data Mart es un subconjunto temático de datos, orientado a un proceso o un área de
negocio específica.
MODELADO DIMENSIONAL

 El Modelado Dimensional es utilizado hoy en día en la mayoría de las soluciones de BI. Es una mezcla
correcta de normalización y desnormalización, comúnmente llamada Normalización Dimensional. Se
utiliza tanto para el diseño de Data Marts como de Data Warehouses.
 Básicamente hay dos tipos de tablas:
• Tablas de Dimensión (Dimension Tables)
• Tablas de Hechos (Fact Tables)
TABLAS DE HECHOS (FACT TABLES)

 Una tabla de hechos en un sistema que contiene


todos los hechos o la información de un negocio y que
puede ser sometida a actividades de análisis e informes
cuando sea necesario.
 Los Hechos en modelado dimensional están
compuestos por los detalles del proceso de negocio a
analizar, contienen datos numéricos y medidas
(métricas) de Negocio a analizar. Contienen también
elementos (claves externas) para contextualizar dichas
medidas, como por ejemplo el producto, la fecha, el
cliente, la cuenta contable, etc.
 Un sistema de Data Warehouse puede tener una o más
tablas, dependiendo del tipo de modelo utilizado para
diseñarlo.
TIPOS DE TABLAS DE HECHO

Tablas Transaccionales

Tablas de Vista periódica

Tablas de acumulados
TABLAS DE HECHO (FACT TABLES)

TRANSACCIONAL Es una visión fundamental y básica de las operaciones de negocio. Se utiliza para

Tablas representar la ocurrencia de un evento en cualquier punto instantáneo del tiempo.

de VISTA DE PERIODICA La vista rápida o periódica de la tabla de hechos te ofrece una visión del estado de las
cosas en un momento determinado, es algo como una «imagen del momento». En ella se representa el

hecho
rendimiento de una actividad al final de cada día o de una semana o de un mes, o de cualquier otro intervalo
de tiempo, a diferencia de la tabla de hechos transaccionales, en la que se añade una nueva fila por la
ocurrencia de cada evento.

ACUMULADO Se utilizan para representar la actividad de cualquier proceso que tenga un inicio y un final
bien definidos y claros.
ELEMENTOS DE UNA TABLA DE HECHO

• Clave principal: identifica de forma única cada fila. Al igual que en los sistemas transaccionales toda tabla
debe tener una clave principal, en una tabla de hechos puede tenerla o no, y esto tiene sus pros y sus contras,
pero ambas posturas son defendibles.
• Claves externas (Foreign Keys): apuntan hacia las claves principales (claves subrogadas) de cada una de las
dimensiones que tienen relación con dicha tabla de hechos.
• Medidas (Measures): representan columnas que contienen datos cuantificables, numéricos, que se pueden
agregar. Por ejemplo, cantidad, importe, precio, margen, número de operaciones, etc.
• Metadatos y linaje: nos permite obtener información adicional sobre la fila, como por ejemplo, que día se
incorporó al Data Warehouse, de qué origen proviene (si tenemos varias fuentes), etc. No es necesario para el
usuario de negocio, pero es interesante analizar en cada tabla de hechos qué nos aporta y si merece pena
introducir algunas columnas de este tipo.
TABLAS DE DIMENSIONES

 Las Dimensiones en el modelado dimensional nos


permiten contextualizar los hechos, agregando
diferentes perspectivas de análisis a ellos.
 Si una agregación de una medida dos devuelve el
valor 17.538 unidades, por sí sólo no nos dice
nada, en cambio, si le agregamos las perspectivas
tiempo, tienda y cliente, podríamos de decir que
“hemos vendido 17.538 unidades en el mes de
marzo de 2012, en la tienda de Murcia al cliente
Juan López García”.
 Las Tablas de Dimensiones son las almacenan la
información de las dimensiones. Una dimensión
contiene una serie de atributos o características,
por las cuales podemos agrupar, rebanar o filtrar la
información.
DIMENSIÓN DE CAMBIO LENTO, SLOWLY CHANGING
DIMENSION (SCD)

 En el data warehouse un SCD es una dimensión que contiene datos relativamente estáticos que podrían cambiar lenta o
de forma impredecible en lugar de una forma típica.Alguno ejemplos comunes de SCD están en las entidades como ser
ubicación geográfica, clientes o productos.
 Pueden ser de los siguientes tipos
 SCD TIPO 0 que retiene el original
 SCD 1 sobre escribe
 SCD 2 agrega una nueva línea
 SCD 3 agrega un nuevo atributo
 SCD 4 agrega una tabla histórica
 SCD 5 técnica que realiza una mini dimensión (4+1)
 SCD 6 Combina(1+2+3=
 SCD 7 hibrido
TIPOS DE DIMENSIONES: SCD TIPO 0

 No se tiene en cuenta la gestión de los cambios


históricos y no se realiza esfuerzo alguno. Nunca
se cambia la información, ni se reescribe.
TIPOS DE DIMENSIONES: SCD TIPO 1

 No se guardan históricos. La nueva información


sobrescribe la antigua siempre. Principalmente la
sobre escritura se realiza por errores de calidad
de datos. Este tipo de dimensiones es fácil de
mantener y son usadas cuando la información
histórica no es importante.
TIPOS DE DIMENSIONES: SCD TIPO 2

 Toda la información histórica se guarda en el


data warehouse. Cuando hay un cambio se crea
una nueva entrada con su fecha e identificador
único apropiadas. A partir de ese momento será
el valor usado para las futuras entradas. Las
antiguas usarán el valor anterior.
TIPOS DE DIMENSIONES: SCD TIPO 3

 Toda la información histórica se guarda en el


data warehouse. En este caso se crean nuevas
columnas con los valores antiguos y los actuales
son remplazados con los nuevos.
SCD 4, 5, 6

 SCD 4 Se le conoce habitualmente como tablas históricas. Existe una tabla con datos actuales y otra con los
antiguos
 SCD 5 Combina las históricas con la tipo 1
 SCD 6 es hibrida porque combina la 1 2 y 3 con el fin de reducir el tamaño de las consultas temporales
ARQUITECTURA DE UN DATA WAREHOUSE

 Existen principalmente tres enfoques en la arquitectura corporativa de un data warehouse:


 1.Enterprise bus architecture(o data warehousevirtual/federado)
 2.Corporateinformationfactory(o enterprisedatawarehouse)
 3.Enterprisedatawarehouse2.0
ENTERPRISE BUS ARCHITECTURE
(O DATA WAREHOUSE VIRTUAL/FEDERADO)

 También conocido como MD (multi dimensional


architecture), consiste en una arquitectura
basada en data mart sin dependientes federados
que pueden hacer uso de una staging área en el
caso de ser necesario. Federados significa que se
hace uso de una herramienta EII (Enterprise
information integration) para realizar las
consultas como si se tratara de un único data
warehouse. Puede existir en el caso de ser
necesario un ODS.
CORPORATE INFORMATION FACTORY (O ENTERPRISEDATA
WAREHOUSE)

 consiste en una arquitectura en la que existe un data


warehouse corporativo y unos data marts (o incluso cubos
OLAP, procesamiento analítico en línea ) dependientes de
este El acceso a datos se realiza a los data marts o a la
ODS (almacén operacional de datos) en caso de existir,
pero nunca al propio data warehouse Puede existir en el
caso de ser necesaria una staging área
ENTERPRISE DATA WAREHOUSE 2.0

 Enterprisedatawarehouse2.0 consiste en la revisión


de la metodología de Bill Inmon para incluir toda la
experiencia de los últimos veinte años. El punto
diferencial es quese separa la información por la
edad de esta y la clasifica por su uso. Se caracteriza
por completar tanto la inclusión de información
estructurada como no estructurada y por focalizarse
en tener el objetivo de responder a todas las
necesidades actuales de negocio. Es una propuesta
para evitar que la factoría de información crezca de
manera desordenada. El siguiente gráfico representa
una arquitectura completa:
ARQUITECTURAS DW ALTERNATIVAS
MÉTRICAS

 Son los indicadores de un proceso de negocio,


aquellos conceptos cuantificables que permiten
medir nuestro proceso de negocio. Por ejemplo, en
venta tenemos su importe.
TIPOS DE MÉTRICAS

 Podemos distinguir diferentes tipos de medidas basadas en el tipo de información que recopilan, así como su
funcionalidad asociada:
 Métricas: valores que recogen el proceso de una actividad o sus resultados. Estas medidas proceden del
resultado de la actividad del negocio:
 Metricas de realización de actividad (LEADING) miden la realización de una actividad. Ejemplo la participación de una persona en un
evento.
 Metricas de resultado de una actividad (LAGGING) recogen los resultados de una actividad. Ejemplo la cantidad de puntos de un
jugador en un partido
 Indicadores clave: Son los valores correspondientes que hay que alcanzar, y que suponen el grado de
asunción de los objetivos. Estas medidas proporcionan información sobre el rendimiento de una
actividad o consecución de meta:
 Key Performance Indicator (KPI)
 Key Goal Indicator (KGI)
KPI

 Indicadores clave de rendimiento. Más allá de la


eficacia, se definen unos valores que nos
explican en qué rango óptimo de rendimiento
nos deberíamos situar al alcanzar los objetivos.
Son métricas del proceso.
KPI
KGI

 Indicadores Clave de Objetivo. Definen mediciones el


impacto de un proceso en el contexto de la empresa,
ayuda a la dirección general a saber si ha alcanzado
sus requisitos de negocio, y se expresan por lo
general en términos de criterios de información
KRI

 Un indicador de riesgo clave es una


medida que se utiliza en la gestión
para indicar qué tan riesgosa es una
actividad. Los indicadores clave de
riesgo son métricas que utilizan las
organizaciones para proporcionar una
señal temprana de exposición al riesgo
creciente en diversas áreas de la
empresa
KPI KGI KRI

 E scenario: Mi peso actual es de 100KG


 KGI = Quiero alcanzar un peso de 80KG. Necesito reducir mi peso en 20KG
 KPI = Cada semana se mide el peso
 Semana 1 = 99kg se redujo 1 KG, kpi = 5%
 Semana 2 = 98kg se redujo 2 KG, kpi = 10%
 KRI = Si mi peso esta entre 1’’ y 90 KG el riesgo es alto, Si mi peso esta entre 89 y 80 mi riesgo medio, Si mi peso
es menos de 80 mi riesgo es bajo.
ARQUITECTURA DW

 Todos los factores que caracterizan el data warehouse tienen su base en una arquitectura
formada por capas o niveles. Esta varía dependiendo de la utilidad que se le dé al almacén
de datos en la organización. Sin embargo, en líneas generales, la arquitectura del DWH
se conforma por:
1. Fuentes de datos
2. ETL
3. Almacén de datos
4. Data marts
5. Explotación de los datos
COMPONENTES EN EL CONTEXTO

ODS (Operational Data Store)


o Staging Area: es la capa
intermedia que servirá como
almacenamiento entre los
sistemas fuente y el Data
Warehouse. Su misión es
ofrecer la posibilidad
de gestionar los datos con el
formato y estructura de origen
para facilitar la integración y
transformación hacia el
modelo desnormalizado que
poseen los Datamarts y el
Data Warehouse.
RESUMEN
BIBLIOGRAFÍA
CURTO DÍAZ, J. (2016).
INTRODUCCIÓN AL
BUSINESSINTELLIGENCE.
BARCELONA, EDITORIAL UOC.
RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/U
NITECHN/101030?.
LÓPEZ BENÍTEZ, Y. (2018). BUSINESS
INTELLIGENCE. ADGG102PO.
ANTEQUERA (MÁLAGA), IC
EDITORIAL. RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/U
NITECHN/124393?.
BASE DE DATOS
FASES DE UN SISTEMA BI
INTEGRACION DE LOS DATOS

La integración puede darse en cuatro grandes áreas


 Integración de datos proporciona una visión única de todos los datos de negocio se encuentren donde se
encuentren Este es el ámbito del presente documento y, en particular, en el contexto de la inteligencia de negocio
 Integración de aplicaciones proporciona una visión unificada de todas las aplicaciones tanto internas como
externas a la empresa Esta integración se consigue mediante la coordinación de los flujos de eventos (mensaje o
datos) entre aplicaciones
 Integración de procesos de negocio proporciona una visión unificada de todos los procesos de negocio Su
principal ventaja es que las consideraciones de diseño del análisis e implementación de los procesos de negocio
son aislados del desarrollo de las aplicaciones
 Integración de la interacción de los usuarios: proporción a una interfaz segura y personalizada al usuario del
negocio (datos, aplicaciones y procesos de negocio).
DW

 Un data warehouse funciona como un


almacenamiento multipropósito para diferentes
casos de uso. Cuando los datos llegan al warehouse
("almacén"), ya han sido modelados y
estructurados para un propósito específico, lo que
significa que están listos para su análisis.
 Como organización, se optaría por un data
warehouse cuando se tienen cantidades masivas
de datos de los sistemas operacionales que
necesitan estar disponibles para la presentación de
informes y su análisis.
DATA MART

 Un data mart es una subsección del data warehouse,


creado específicamente para una función de negocio
concreta, propósito o comunidad de usuarios. La idea
es proporcionar a los interesados los datos más
pertinentes para ellos, cuando los necesiten.
 Por ejemplo, los equipos de ventas o financieros que
acceden a los datos para elaborar sus informes y
proyecciones trimestrales. Dado que un data mart
ofrece capacidades analíticas para un área restringida
del data warehouse, ofrece seguridad aislada y
rendimiento aislado.
 El papel más importante de un data mart es la
generación de informes y análisis específicos de la
empresa.
DATA LAKE

 Un data lake es un repositorio de almacenamiento que


puede albergar grandes cantidades de datos
estructurados, semiestructurados y no estructurados
en su formato nativo, clasificados y etiquetados con
metadatos.
 Así, mientras que un data warehouse almacena datos
procesados para una necesidad específica, un data
lake es un conjunto de datos en bruto donde cada
elemento de datos recibe un identificador único y es
etiquetado con metaetiquetas para su uso posterior.
 Se optaría por un data lake si se generan, o se tiene
acceso a, grandes volúmenes de datos de forma
continua, pero no se quiere restringir a casos de uso
específicos o predefinidos.
EXTRACCION TRANSFORMACION Y CARGA ETL

 ETL es la forma en que los datos en bruto se


convierten en datos listos para el análisis. Es un
proceso automatizado en el que se recogen datos
en bruto de fuentes identificadas, se extrae la
información que se ajusta a las necesidades de
información y análisis, se limpia, estandariza y
transforma esos datos en un formato que se puede
utilizar en el contexto de la organización, y se carga
en un repositorio de datos.
ETL : EXTRACCION

 La Extracción es el paso en el que se recopilan los


datos desde las ubicaciones de las fuentes para su
transformación. La extracción de datos podría ser a
través de Procesamiento por lotes, lo que significa
que los datos de origen se mueven en grandes
fragmentos desde la fuente hasta el sistema de
destino a intervalos programados.
 Las herramientas para el procesamiento por lotes
incluyen Stitch y Blendo.
ETL : TRANSFORMACIÓN

 El procesamiento de flujos, que significa que los datos de la fuente


se extraen en tiempo real de la misma y se transforman mientras
están en tránsito y antes de que se carguen en el repositorio de
datos.
 Entre las herramientas para el procesamiento de flujos figuran
Apache Samza, Apache Storm y Apache Kafka.
 La transformación implica la ejecución de reglas y funciones que
convierten los datos en bruto en datos que pueden utilizarse para
el análisis. Por ejemplo
 haciendo que los formatos de fecha y las unidades de medida sean
consistentes en todos los datos de origen,
 eliminando los datos duplicados,
 filtrando los datos que no se necesitan,
 enriqueciendo los datos, por ejemplo, dividiendo el nombre
completo en nombre, segundo nombre y apellidos,
 estableciendo relaciones clave entre las tablas,
 aplicando reglas de negocio y validaciones de datos.
ETL : CARGA

 La carga es el paso en el que los datos procesados


se transportan a un sistema de destino o a un
repositorio de datos. Podría ser:
 Carga inicial, es decir, rellenar todos los datos del
repositorio,
 Carga incremental, es decir, aplicar periódicamente
actualizaciones y modificaciones continuas según
sea necesario; o
 Refresco completo, es decir, borrar el contenido de
una o más tablas y volver a cargarlas con
datos actualizados.
DIFERENTES TIPOS DE DATOS EXISTENTES:

 Estructurados: contenidos en bases de datos.


 Semiestructurados: en formatos legibles para máquinas, si bien no están completamente estructurados: HTML,
que pueden obtenerse mediante técnicas estándar de extracción de datos.
 No estructurados: en formatos legibles para humanos, pero no para máquinas: HTML no tabulado,Videos,
post...,que pueden obtenerse mediante técnicas avanzadas como text mining u otras
ETL Y DATA PIPELINES

 Es habitual ver que los términos ETL y data pipelines se usan indistintamente. Y aunque ambos mueven datos
desde el origen hasta el destino, data pipeline es un término más amplio que abarca todo el viaje de mover
datos de un sistema a otro, en el que ETL es un subconjunto.
 Los data pipelines pueden diseñarse para el procesamiento por lotes, para la transmisión de datos, y una
combinación de datos por lotes y en streaming. En el caso de los datos en streaming, el procesamiento o
transformación de datos ocurre en un flujo continuo.
 Esto es particularmente útil para datos que necesitan una actualización constante, como los datos de un
sensor que monitorea el tráfico.
DATA PIPELINES

 Un data pipeline es un sistema de alto rendimiento que soporta tanto consultas por lotes de larga
duración como consultas interactivas más pequeñas.
 El destino de un data pipeline suele ser un data lake, aunque los datos también pueden cargarse en
diferentes destinos, como en otra aplicación o en una herramienta de visualización.
 Existen varias soluciones disponibles para data pipelines, siendo las más populares Apache Beam y
DataFlow.
BIG DATA

 Ernst and Young ofrece la siguiente definición: big data


se refiere a los volúmenes dinámicos, grandes y las V velocidad
dispares de datos creados por personas, herramientas
y máquinas. Requiere una tecnología nueva, del
innovadora y escalable para recopilar, alojar y
procesar analíticamente la enorme cantidad de datos big volumen
recopilados con el fin de obtener percepciones del
negocio en tiempo real que se relacionen con data.
consumidores, riesgo, beneficios, rendimiento, gestión
de la productividad y un mayor valor para el
variedad
accionista.
 No existe una definición única de big data, pero hay
ciertos elementos que son comunes a las diferentes
veracidad
definiciones, como velocidad, volumen, variedad,
veracidad y valor.
valor
LAS V DEL BIG DATA
 La velocidad es la rapidez con la que se acumulan los datos. Los datos se generan extremadamente rápido en un proceso que nunca
se detiene. Las tecnologías de streaming en tiempo real o cercano a él, las locales y las basadas en la nube pueden procesar la
información muy rápidamente.
 El volumen es la escala de los datos o el aumento de la cantidad de datos almacenados. Los motores del volumen son el aumento de
los orígenes de datos, los sensores de mayor resolución y la infraestructura escalable.
 La variedad es la diversidad de los datos. Los datos estructurados encajan perfectamente en filas y columnas en las bases de datos
relacionales, mientras que los datos no estructurados no están organizados de forma predefinida, como los tweets, entradas de
blog, imágenes, números y vídeo. La variedad también refleja que los datos provienen de diferentes fuentes; máquinas, personas y
procesos, tanto internos como externos a las organizaciones. Los generadores son las tecnologías móviles, redes sociales,
tecnologías vestibles ("wearables"), geotecnologías, video, y muchas, muchas más.
 La veracidad es la calidad y el origen de los datos y su conformidad con los hechos y la exactitud. Los atributos incluyen la
consistencia, completitud, integridad y ambigüedad.
 Valor es nuestra capacidad y necesidad de convertir los datos en valor. Valor no es sólo ganancias. Puede tener beneficios médicos o
sociales, así como satisfacción del cliente, del empleado o personal. La principal razón por la que la gente invierte tiempo en
entender el big data es para obtener valor de él
 Herramientas como Apache Spark, Hadoop y su ecosistema proporcionan formas de extraer, cargar, analizar y
procesar los datos mediante recursos de computación distribuidos, proporcionando nuevas percepciones y
conocimientos. Esto brinda a las organizaciones más formas de conectar con sus clientes y enriquecer los
servicios que ofrecen.
 La próxima vez que te pongas tu reloj inteligente, desbloquees tu smartphone o hagas un seguimiento de tu
entrenamiento, recuerda que tus datos están comenzando un viaje que podría llevarlos alrededor del mundo,
pasando por un análisis de big data y volviendo a ti.
LAS FUENTES DE DATOS

 Las Fuentes de Datos pueden ser internas o externas a la organización y pueden ser primarias, secundarias o
terciarias, dependiendo de si se obtienen los datos directamente de la fuente original, se recuperan de fuentes
de datos externas disponibles o se compran a agregadores de datos.
 Algunas de las fuentes de datos de las que podrías estar reuniendo datos son las bases de datos, la web, las
redes sociales, las plataformas interactivas, los dispositivos de sensores, los intercambios de datos, las
encuestas y los estudios de observación.
 Los datos identificados y reunidos de las diversas fuentes de datos se combinan utilizando diversos
instrumentos y métodos para proporcionar una única interfaz que permita consultar y manipular los datos.
 Los datos que se identifican, la fuente de ellos y las prácticas que se emplean para reunirlos, tiene
repercusiones en la calidad, la seguridad y la privacidad, que deben considerarse en esta etapa.
 Si se utiliza una base de datos relacional como sistema de destino, sólo podrás almacenar datos
estructurados, como datos de sistemas OLTP, hojas de cálculo, formularios online, sensores, registros de red y
web. Los datos estructurados también se pueden almacenar en NoSQL.
 Los datos semiestructurados son datos que tienen algunas propiedades de organización pero no un
esquema rígido, como por ejemplo, datos de correos electrónicos, XML, archivos comprimidos, ejecutables
binarios y protocolos TCP/IP. Los datos semi-estructurados pueden almacenarse en clústeres NoSQL. XML y
JSON se utilizan habitualmente para almacenar e intercambiar datos semiestructurados. JSON es también el
tipo de datos preferido para los servicios web.
 Los datos no estructurados son los que no tienen una estructura y no pueden organizarse en un esquema,
como los datos de las páginas web, fuentes de redes sociales, imágenes, vídeos, documentos, registros de
medios y encuestas. Las bases de datos NoSQL y los Data Lakes constituyen una buena opción para almacenar
y manipular grandes volúmenes de datos no estructurados.
DATA WRANGLING

 Data wrangling, también conocido como data


munging, es un proceso iterativo que implica Descubrimiento
la exploración, transformación y validación de los
datos, y hacerlos disponibles para un análisis
creíble y significativo. Transformación
 Data wrangling comprende una gama de tareas
relacionadas con la preparación de los datos para
su análisis. Por lo general, se trata de un proceso de Validación y
cuatro pasos que implica: Descubrimiento,
Transformación, Validación y Publicación.
Publicación.
DATA WRANGLING

 Los conjuntos de datos recogidos de fuentes dispares pueden tener varios problemas, como valores faltantes,
inexactitudes, duplicados, delimitadores incorrectos o ausentes, registros incoherentes y parámetros
insuficientes.
 En algunos casos, los datos pueden corregirse manual o automáticamente con la ayuda de herramientas y
scripts de data wrangling, pero si no pueden repararse, deben eliminarse del conjunto de datos. Aunque los
términos Data Cleaning ("limpieza de datos") y Data Wrangling se utilizan a veces indistintamente, es
importante tener en cuenta que la limpieza de datos es sólo un subconjunto de todo el proceso de Data
Wrangling.
BIBLIOGRAFÍA
CURTO DÍAZ, J. (2016). INTRODUCCIÓN AL
BUSINESSINTELLIGENCE. BARCELONA, EDITORIAL UOC.
RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/101030?.
LÓPEZ BENÍTEZ, Y. (2018). BUSINESS INTELLIGENCE.
ADGG102PO. ANTEQUERA (MÁLAGA), IC EDITORIAL.
RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/124393?.
CONESA CARALT, J. Y CURTO DÍAZ, J. (2013). INTRODUCCIÓN
AL BUSINESS INTELLIGENCE. BARCELONA, SPAIN: EDITORIAL
UOC. RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/56524?.

INTRODUCCIÓN AL ANÁLISIS DE DATOS IBM SKILLS NETWORK


VISUALIZACION DE LOS DATOS
HERRAMIENTAS DE VISUALIZACIÓN, INFORMES, TRANSFORMACIÓN
DISEÑO DE INFORMES

 El punto de entrada tradicional para una herramienta de inteligencia de negocio en el


contexto de una organización es la necesidad de informes operacionales
 A lo largo de la vida de una empresa, la cantidad de datos que se generan por su
actividad de negocio crece de modo exponencial y esa información se guarda tanto
en las bases de datos de las aplicaciones de negocio como en ficheros en múltiples
formatos Es necesario generar y distribuir informes para conocer el estado del
negocio y poder tomar decisiones a todos los niveles operativo, táctico y estratégico
INFORMES E INTELIGENCIA DE NEGOCIOS

 Las herramientas de informes (o también llamadas de


reporting) permiten responder principalmente a la pregunta de
¿ qué pasó Dado que esa es la primera pregunta que se
formulan los usuarios de negocio la gran mayoría de las
soluciones de business intelligence del mercado incluyen un
motor de generación de informes
INFORMES

 Es un documento por medio del


cual se presentan los resultados
de uno o varios procesos de
negocios Suele contener texto
acompañado de elementos como
tablas o gráficos para agilizar la
comprensión de la información
presentada
PLATAFORMA DE REPORTING

 Plataforma de reporting es aquella


solución que permite diseñar y
gestionar (Distribuir planificar y
administrar) informes en el
contexto de una organización o
en una de sus áreas
TIPOS DE INFORMES

 Existen diferentes tipos de


informes en función de la ESTÁTICOS: PARAMÉTRICOS: AD HOC:

• tienen un • presentan • Son creados por


interacción ofrecida al formato pre
establecido
parámetros de
entrada y
el usuario final a
partir de la capa
usuario final y la inamovible permiten
múltiples
de metadatos
que permite usar
consultas. el lenguaje de
independencia respecto al negocio propio

departamento de IT
ELEMENTOS DE UN INFORME
Texto : que describe el estado del proceso de negocio, proporciona las descripciones necesarias para entender el
Elementos resto de los elementos del informe, así como etiquetas (Títulos) o metadatos (Fecha de

de un Tablas : Que tiene forma de matriz y permite presentar una gran cantidad de información.

informe
Gráficos: que persiguen el objetivo de mostrar información con un alto impacto visual que sirva para obtener
información agregada con mucha más rapidez que a través de tablas.

Mapas: que permiten mostrar información

Métricas: que permiten conocer cuantitativamente el estado de un proceso de negocio.

Alertas visuales y automáticas: que permiten definir avisos automáticos de los cambios de estado de un proceso de
negocio. Estas alertas están formadas por elementos gráficos, como fechas, iconos o colores resultados y deben
estar automatizadas en función de reglas de negocio encapsuladas en el cuadro de mando.
 La visualización de datos es la disciplina de comunicar información mediante el uso de elementos
visuales como gráficos, diagramas y mapas. Su objetivo es hacer que la información sea fácil de comprender,
interpretar y retener.
 Utilizando la visualización de datos, se puede proporcionar un resumen de las relaciones, tendencias
y patrones ocultos en los datos, que, aunque no imposible, sería muy difícil de descifrar a partir de un volcado
de datos. Para que la visualización de datos resulte de valor, hay que elegir la visualización que
más eficazmente haga llegar los resultados a la audiencia.
GRÁFICOS

 En el proceso de confección de un informe, uno de los puntos más


complicados es la selección del tipo de gráfico Debemos empezar
primero por la definición formal de este concepto Se entiende por
gráfico la representación visual de una serie de datos

 El gráfico puede ser una herramienta eficaz, ya que:


 Permite presentar la información de manera clara, sencilla y precisa
 Facilita la comparación de datos y habilita destacar tendencias y diferencias
CLASIFICACIÓN DE LOS GRÁFICOS

 El uso de gráfico va a depender del tipo de dato, que podemos clasificar


en
 Cualitativos Se refieren a cualidades o modalidades que no pueden expresarse
numéricamente. Pueden ser:
 ordinales (Siguen un orden)
 o categóricos (Sin orden)

 Cuantitativos Se refieren a cantidades o valores numéricos Pueden ser:


 discretos (Toman valores enteros)
 o continuos (Toman cualquier valor en un intervalo)
CRITERIOS PARA SELECCIÓN DE GRÁFICOS

▪ Preguntar qué se desea mostrar.


▪ Existen varias opciones: comparación, distribución, relación o
composición.
▪ Identificar el tipo de dato:
▪ Cuantitativo o cualitativos
▪ Necesidad de trabajar con una o más variables.
▪ Apalancarse en otras dimensiones: temporales o geográficas.
TIPO DE GRAFICO A ELEGIR
TIPOS DE GRÁFICOS PARA VISUALIZAR DATOS: BARRAS

 Las gráficas de barras son excelentes


para comparar conjuntos de datos
relacionados o partes de un todo.
 Por ejemplo, en esta gráfica de barras,
puedes ver los números de población
de 10 países diferentes y cómo se
comparan entre sí.
TIPOS DE GRÁFICOS PARA VISUALIZAR DATOS: COLUMNAS

 Las Gráficas de Columna comparan los valores uno al


lado del otro. Se pueden utilizar con bastante eficacia
para mostrar cambios a lo largo del tiempo.
 Por ejemplo, mostrando cómo las visitas a las páginas
y el tiempo de las sesiones de usuario de tu sitio web
está cambiando mes a mes.
 Aunque son similares, excepto por la orientación, las
gráficas de barras y las gráficas de columnas no
siempre se pueden utilizar indistintamente.
 Por ejemplo, una gráfica de columnas puede ser más
adecuada para mostrar valores negativos y positivos.
TIPOS DE GRÁFICOS PARA VISUALIZAR DATOS: PASTEL

 Las gráficas de tarta muestran el desglose de una


entidad en sus subpartes y la proporción de
las subpartes en relación con cada una de ellas.
 Cada porción de la tarta representa un valor
estático o una categoría, y la suma de todas las
categorías es igual al cien por cien.
 En este ejemplo, en una campaña de marketing con
cuatro canales de comercialización -redes sociales,
publicidad nativa, influencers pagados y eventos en
directo- se puede ver el número total de clientes
potenciales que genera cada canal.
TIPOS DE GRÁFICOS PARA VISUALIZAR DATOS: LINEA

 Las Gráficas de Líneas muestran tendencias.


 Son excelentes para mostrar cómo cambia el valor
de un dato en relación con una variable
continua. Por ejemplo, cómo ha cambiado la venta
de un producto, o de varios productos, a lo largo
del tiempo, donde el tiempo es la variable
continua.
 Las gráficas de líneas pueden utilizarse para
comprender las tendencias, patrones y variaciones
en los datos; también, para comparar conjuntos de
datos diferentes pero relacionados con diversas
series.
TIPOS DE GRÁFICOS PARA VISUALIZAR DATOS: TREEMAPS
 Los treemap son perfectos para mostrar gran cantidad
de datos de estructura jerárquica (estructura de árbol).

 El espacio de la visualización está dividido en


rectángulos a los que se les asigna un tamaño y un
orden en función de una variable cuantitativa. Los
niveles de la jerarquía del treemap se visualizan como
rectángulos que contienen otros rectángulos. Cada
conjunto de rectángulos del mismo nivel de la jerarquía
representa una columna o una expresión de una tabla
de datos. Cada rectángulo individual de un nivel de la
jerarquía representa una categoría de una columna.
 ejemplo:
 Un rectángulo que representa un continente puede
contener varios rectángulos que representen países de ese
continente. Cada rectángulo que represente un país puede
contener a su vez rectángulos que representen ciudades de
esos países.
TIPOS DE GRÁFICOS PARA VISUALIZAR DATOS: SCATTER
(DISPERSIÓN)

 Un diagrama de este tipo se utiliza para


comparar dos conjuntos de valores de
datos numéricos y muestra la relación
entre esos conjuntos.
 Un diagrama de dispersión combina los dos
conjuntos de valores en los ejes X y Y en
sencillos puntos y después se muestran en
grupos dentro de la gráfica. Por esta razón
los veras a veces ser llamadas gráficas xy.
Dentro de su uso se incluye la
comparación de valores estadísticos
científicos o de ingeniería.
HISTOGRAMAS

 Un histograma es un gráfico que


muestra la distribución de los datos
agrupados en contenedores. A pesar
que pueda parecer un gráfica de barras
es totalmente diferente, una gráfica de
barras se usa para comparar datos, un
histograma para la mostrar la
distribución de esos datos
MAPA DE CALOR

 Es una representación gráfica de los datos


donde los valores individuales contenidos
en una matriz se representan como
colores.
 Muestra la magnitud de un fenómeno
como color en dos dimensiones. La
variación en el color puede ser por matiz o
intensidad, dando señales visuales obvias al
lector sobre cómo el fenómeno se agrupa
o varía en el espacio.
CICLO DE VIDA DE LOS INFORMES
Identificar
• Determinar los aspectos de negocio
relevantes para su comprensión e
identificar las métricas que
representan dichos aspectos

Mejorar Medir
• Consiste en implementar las mejoras • Consiste en desarrollar o revisar los
recopiladas en el punto anterior en el sistemas de información que recopilan
sistema de reporting . Estas mejoras la información necesaria para las
pueden ser en forma, contenido, métricas. Revisar
distribución, calidad del dato, etc

Recopilar Revisar
• Recopilar: Consiste en recopilar de • Consiste en comprobar que el dato de
manera continua el feedback por parte los sistemas anteriores representa de
de los usuarios, así como futuras manera efectiva, válida, completa y con
necesidades. calidad los procesos de negocio.

Crear
• Consiste en crear el informe y en
habilitar su distribución a las partes
interesadas.
CUADRO DE MANDO INTEGRAL

 La visualización de datos también se puede utilizar para construir cuadros de mando.


 Los cuadros de mando organizan y muestran informes y visualizaciones procedentes de múltiples fuentes de
datos en una única interfaz gráfica. Los cuadros de mando pueden utilizarse para supervisar el progreso diario o la
salud general de una función empresarial o incluso de un proceso específico.
 Los cuadros de mando pueden presentar tanto datos operativos como analíticos. Por ejemplo, podrías tener un
cuadro de mandos de marketing con el que supervisar tu actual campaña de marketing en relación a los contactos
directos, consultas generadas y conversiones de ventas, en tiempo real. Como parte del mismo cuadro de mando,
también podrías ver cómo la tasa de conversión de esta campaña se compara con la tasa de conversión de otras
campañas ejecutadas con éxito en el pasado.
 Los cuadros de mando son una gran herramienta para presentar una vista panorámica de la imagen completa, a la
vez que permite profundizar en el siguiente nivel de información para cada parámetro.
DASHBOARDS

 El termino ‘tablero’ proviene de la industria automotriz


donde los diseñadores colocaron los sistemas de
medición y de información importantes como los de la
temperatura del aceite, velocidad, r.p.m., cantidad de
combustible, etc, en una disposición visual la cual es fácil
para de ver y entender para el conductor. Inicialmente
se mostraba de forma análoga, pero ahora son digitales
y utilizan tipos de visualización que incluye medidores
digitales y mini gráficos.
 Usted puede utilizar la misma idea y aplicarla en un
panel en una aplicación de análisis de datos. que los
diseñadores de estos tipos de paneles quieren para
poner la información clave en un solo lugar en forma de
tablero gráfico para facilitar al usuario su entendimiento.
BENEFICIOS

 Ofrecen detalles de su información clave.


 Le alertan de patrones y tendencias sobre sus datos.
 Ofrecen un experiencia interactiva al usuario; permitiéndole filtrar qué datos ver.
 Se actualizan dinámicamente a medida que cambia la fuente de información.
 Proveen de una vista centralizada y unificada de la información empresarial.
 Un tablero de control puede ser una herramienta de utilidad en áreas del negocio como, pronósticos y reportes
fiscales, administración de proyectos, reportes ejecutivos, derechos humanos, servicio al cliente, seguimiento de
eventos, supervisión sanitaria, análisis del centro de llamadas, publicidad y muchos mas.
 Para el analista de datos principiante, el uso de los tableros puede ser una habilidad vital, debido a que los
empleadores lo ven como una habilidad imprescindible en vez de secundaria.
ANTES DE CREAR NUESTRO PRIMER TABLERO DE CONTROL:

 debemos primero recoger y organizar los datos, después verificar que los datos de nuestra hoja de calculo este
limpia, libre de errores y que no contenga ninguna columna y fila en blanco, después debemos formatearla como
una tabla.
 Después debemos crear alguna tabla dinámica que nos ayude a analizar nuestros datos y deberemos realizar algún
ordenamiento y filtrado en los datos en nuestras tablas dinámicas para resaltar los aspectos clave en nuestro
análisis.
 Finalmente crearemos varias visualizaciones de datos, como gráficas, mapas y slicers para ayudarnos a contar una
historia sobre lo que encontremos en nuestros datos.
KPI

 Son indicadores clave de rendimiento que se utilizan para evaluar el éxito de las acciones y/o procesos en la
medida en que estos contribuyen a la consecución de los objetivos, para determinar si están dando los frutos
esperados o es necesario realizar correcciones
 Los indicadores clave de rendimiento permiten medir en tiempo real el funcionamiento de las estrategias de
negocios, marketing o ventas brindando una información valiosa para tomar decisiones estratégicas que permitan
a la empresa optimizar sus recursos para alcanzar el mejor ROI posible
 Los KPIs también desempeñan una importante función comunicativa ya que informan a directivos, empleados e
inversores sobre la evolución de la empresa respecto a los objetivos establecidos, para que todos puedan trabajar
con una visión y una meta común
QUE KPI ELEGIR

 A pesar de que los KPI son imprescindibles para poder hacer un seguimiento y
control de cualquier proyecto o negocio, muchas empresas fallan a la hora de elegir
las métricas adecuadas que se deben monitorizar, e incluyen en sus dashboards KPI
que no son los adecuados para obtener una visión real de lo que está ocurriendo
 En cada área empresarial se pueden seleccionar claves de desempeño concretas que
permiten conocer la evolución de las estrategias que están siendo llevadas a cabo
Mostramos a continuación algunos de los KPI más utilizados en las principales áreas
de una empresa
KPI FINANCIEROS

 Cualquier cuadro de mando empresarial incluye KPI de


carácter financiero para poder controlar y medir los
objetivos de rentabilidad, crecimiento, viabilidad y otras
metas económicas.
 Alguno de los KPI financieros más utilizados con
Retorno
 de la inversión (ROI) Estamétrica mide la rentabilidad de
una determinada inversión, enfrentando los ingresos
generados con el coste necesario para realizarla
 Monitorizando el ROI de una inversión se puede saber
si la misma está ganando o perdiendo dinero con la
misma El ROI se calcula aplicando la fórmula
 Retorno de la inversión ==(Ganancia Inversión)
Inversión
KPIS FINANCIEROS

 Flujo de caja
 Margen bruto de utilidad  El flujo de caja Cash Flow permite medir a una
empresa su capacidad para afrontar los pagos que
 Consiste en medir la salud económica y financiera de
van surgiendo en el día a día Se trata de un KPI que
un negocio, y mide el porcentaje económico
permite evaluar la liquidez de una empresa o
resultante después de descontar el coste de
proyecto posibilitando el hecho de detectar en
adquisición de los productos vendidos
tiempo real, problemas de caja que puedan generar
La fórmula para calcular este KPI es dificultades a la hora de afrontar pagos a corto plazo
 Margen bruto de utilidad ==(Coste de la mercancía  Para calcular este KPI se utiliza la fórmula
vendida-Ingreso total)/Ingreso total
 Flujo de Caja =Beneficio Neto + Amortizaciones +
Provisiones
KPI DE MARKETING

 Costo por clic


 El CPC o coste por clic es un valor importante que se
mide en el marketing digital para conocer el costo real
 Click Through Rate que tiene cada clic que realizan los usuarios sobre los
anuncios publicados
 El CTR es un KPI que permite conocer si las campañas
online han recibido clics por parte de los usuarios Para  Coste por adquisición
ello evalúa los clics obtenidos comparándolos por el  Conseguir que un usuario se convierta en cliente es uno
número de veces que se muestran los anuncios de los
(impresiones)
 principales objetivos del marketing digital El CPA o
coste de adquisición se encarga de mostrar el coste real
que tiene cada una de esas conversiones permitiendo
conocer la rentabilidad y efectividad de las campañas
KPI MARKETING/ VENTAS

 Tasa de conversión
 Este KPI es quizás uno de los más importantes para el
departamento de ventas, pues mide el porcentaje de
 Número de leads generados leads que se convierten en clientes de la empresa
(realizan una compra) Mientras mayor sea la tasa de
 Conseguir clientes potenciales es parte del trabajo del conversión, más éxito están teniendo las acciones
equipo de ventas, ya que se trata de personas que comerciales del equipo de ventas
realmente están interesadas en los productos y
servicios de la empresa, y por lo tanto hay un mayor  Costo de adquisición de clientes
porcentaje de querer hacer una compra. Este KPI mide,
por lo tanto, el número de leads generados por el  El CAC o costo de adquisición de clientes pondera la
equipo de venta. inversión llevada a cabo para conseguir que un cliente
potencial realice una compra y se convierta en cliente
de la empresa. En campañas de captación de clientes
este valor permite evaluar si dicha acción ha merecido
la pena o no ha resultado rentable
KPI EN TI

 Retorno de inversión ( Este KPI es muy importante


para el departamento TI de una empresa porque
permite justificar al Service Manager o al encargado
del TI de la empresa, una determinada inversión en TI
ante la gerencia  Tiempo de respuesta de solicitud Se suele medir en
horas y muestra el tiempo que se tarda en responder
a las consultas de soporte del departamento TI
 Gasto de TI por empleado Con esta métrica se  Este KPI permite valorar el compromiso de los
puede evaluar el coste que supone la inversión en empleados con relación a la resolución de incidencias
tecnologías de la información por cada empleado y atención al cliente
Este valor permite comparar la inversión en TI con
criterios de la industria para obtener conclusiones
sobre la rentabilidad de la implantación y la inversión
en innovación
EXCEL
5 RASGOS EN EL PROCESO DE CLASIFICACIÓN DE DATOS

 Una de las partes más difíciles del análisis de datos es


encontrar y mantener datos limpios.
 Para ayudar con este proceso y calificar los datos,
busque estos cinco rasgos:
 precisión, integridad, confiabilidad, relevancia y
oportunidad.
PRECISION Y CALIDAD

 La precisión es el primer y más importante aspecto de


la calidad de los datos. Un analista de datos debe limpiar
el conjunto de datos eliminando duplicados, corrigiendo
errores de formato y eliminando filas en blanco.
 Otro aspecto importante de la calidad de los datos es
determinar si la información necesaria para completar
el conjunto de datos está disponible. ¿Por qué esto es
importante como característica de los datos de calidad?
Supongamos que tenemos la tarea de calcular los
ingresos de todas las ventas por región. Después de
recopilar los datos, descubrimos que no se especificó
ninguna región. Estos datos se considerarían entonces
incompletos y habría que considerar otras fuentes para
obtener los datos requeridos
CONFIABILIDAD Y RELEVANCIA

 La confiabilidad es otro factor vital para determinar


 La relevancia es otro rasgo de los datos de calidad. Al
la calidad de los datos. Por ejemplo, digamos que
recopilar información, un analista de datos debe
tenemos la tarea de determinar los ingresos del
considerar si los datos que se recopilan son
agente por cliente. Al recopilar los datos,
realmente necesarios para el proyecto. Por ejemplo,
encontramos que los agentes mantienen sus propios
al revisar los datos relacionados con los ingresos por
registros y no siempre actualizan la información en la
ventas por cliente, también se incluye información
base de datos compartida de la empresa. Con esos
como los cumpleaños del cliente y otra información
factores en mente, entonces determinaríamos que
personal. Al tomar la determinación anticipada de
los datos en la base de datos compartida de la
excluir la información personal del conjunto de
compañía no eran confiables y sería necesario
datos, el analista se evitaría tener que revisar
establecer nuevos procesos para garantizar datos
información innecesaria
confiables.
OPORTUNIDAD (PUNTUALIDAD)

 El último factor para determinar la calidad de los datos es la puntualidad. Este rasgo se refiere a la disponibilidad y
accesibilidad de los datos seleccionados. Supongamos que nuestro informe de ventas se utilizará para las
revisiones semanales de los empleados, pero nuestro informe sólo se actualiza una vez al mes. Este error al
actualizar los datos haría que nuestro informe quedara desactualizado y tendría graves consecuencias para las
revisiones de los empleados.
IMPORTACIÓN DE DATOS EN EXCEL

 Excel también puede usar datos que están en otros


formatos, como texto sin formato, o datos
separados por comas y tabuladores. A veces, estos
archivos de origen se guardarán con una extensión
.txt y se denominarán archivos de "texto", pero
otros se pueden guardar con una extensión de
archivo .CSV y, por lo general, se denominan
archivos CSV.
LIMPIEZA DE DATOS

 Es muy común que al recopilar o importar datos, ya sea a través de procesos manuales o automatizados, se
obtengan errores e inconsistencias en sus datos.
 Esto puede ser tan simple como errores ortográficos, espacio en blanco adicional o el uso de mayúsculas y
minúsculas incorrectas en el texto, filas vacías o valores faltantes en sus datos, datos inexactos o duplicados.
 Tener estos errores e inconsistencias en sus datos puede llevar a problemas con fórmulas que no funcionan, con
operaciones de clasificación y filtrado fallidas y, por lo tanto, resultados de datos visualizados y presentados de
manera inadecuada.
LIMPIEZA DE DATOS: SPELLING

 Una de las tareas más fáciles, que es la revisión


ortográfica. En Excel, esto funciona casi de la misma
manera que Microsoft Word u otras aplicaciones
comunes de procesamiento de texto.
 Lo primero que debemos hacer es seleccionar qué
datos deseamos revisar para verificar la ortografía;
 Seleccionar la columna que contiene los datos.
 Luego hacemos clic en Ortografía que está en la
pestaña Revisar.
LIMPIEZA DE DATOS: FILAS VACIAS

 Las filas vacías en sus datos pueden causar muchos


problemas relacionados con el movimiento de sus
datos, el trabajo con fórmulas y la clasificación y
filtrado. Por lo tanto, es muy importante eliminarlos
de sus datos
 En Excel se aplican filtros y luego se seleccionan los
elementos en blanco para después de aplicar el filtro
eliminar los renglones en blanco
LIMPIEZA DE DATOS: FILAS DUPLICADAS

 La siguiente inconsistencia que buscaremos son las filas de


datos duplicadas; es bastante común que existan filas de datos
duplicados en sus datos importados, debido a un error de
entrada humana o un error en el proceso de importación.
 Usualmente buscamos aplicar formato condicional a una
columna que es mucho menos probable que los valores se
dupliquen en el proceso normal de las cosas, ejemplo ventas
totales de cada pedido.
 Se selecciona la columna... y elige Formato Condicional, luego
Resaltamos Reglas de Celdas y luego Valores Duplicados.
 Cuando hacemos clic en Aceptar y nos desplazamos hacia abajo
en la hoja, podemos ver que sólo se han identificado algunos
valores como duplicados
INCONSISTENCIA DE LOS DATOS: MAYÚSCULAS, MINÚSCULAS,
ORACIONES, FECHAS, ESPACIOS
FUNCIONES ÚTILES PARA EL ANALISIS DE DATOS

 IF
 IFS (ANIDADO)
 COUNTIF
 SUMIF
 VLOOKUP
 HLOOKUP
POWER QUERY

 Power Query es un motor de transformación y preparación de datos. Power Query incluye una interfaz
gráfica para obtener datos de orígenes y un editor de Power Query para aplicar transformaciones. Dado
que el motor está disponible en muchos productos y servicios, el destino donde se almacenarán los
datos depende de dónde Power Query se ha usado. Con Power Query, puede realizar el procesamiento
de extracción, transformación y carga (ETL) de los datos.
 Actualmente, hay dos Power Query experiencias disponibles:
• Power Query Online— Se encuentra en integraciones como flujos de datos de Power BI, flujos de datos
de Microsoft Power Platform, flujos de datos de Azure Data Factory de reorganización y muchos más
que proporcionan la experiencia a través de una página web en línea.
• Power Query para escritorio— Se encuentra en integraciones como Power Query para Excel y Power BI
Desktop.
COMO HACER UN POWER QUERY

 Crear una consulta


1. Seleccione Datos> Obtener datos > de otros
orígenes > consulta en blanco.
2. Seleccione Datos > Obtener datos > Iniciar el Editor
de Power Query.
ALGUNAS DE LAS TRANSFORMACIONES DISPONIBLES EN POWER
QUERY EDITOR.
DONDE USAR POWER QUERY
BIBLIOGRAFÍA
CURTO DÍAZ, J. (2016). INTRODUCCIÓN AL BUSINESSINTELLIGENCE.
BARCELONA, EDITORIAL UOC.

RECUPERADO DE HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/101030?.

LÓPEZ BENÍTEZ, Y. (2018). BUSINESS INTELLIGENCE. ADGG102PO.


ANTEQUERA (MÁLAGA), IC EDITORIAL. RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/124393?.

CONESA CARALT, J. Y CURTO DÍAZ, J. (2013). INTRODUCCIÓN AL BUSINESS


INTELLIGENCE. BARCELONA, SPAIN: EDITORIAL UOC. RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/56524?.

ANALISITA DE DATOS IBM, VISUALIZACIÓN DE LOS DATOS (2017) RECUPERADO


DE HTTPS://WWW.COURSERA.ORG/PROFESSIONAL-
CERTIFICATES/CERTIFICADO-PROFESIONAL-ANALISTA-DE-DATOS-DE-
IBM

También podría gustarte