Ilovepdf Merged
Ilovepdf Merged
Ilovepdf Merged
Business Intelligence (BI) o Inteligencia de Negocios comprende un conjunto de técnicas y herramientas que
ayudan a las empresas a una mejor toma de decisiones, pues permite que las organizaciones accedan a gran
cantidad de información. Este proceso inicia con un análisis de todas las operaciones de la empresa para
determinar los puntos claves que permiten impulsar el negocio; luego, se realiza el procesamiento y la
organización de datos que facilitan la toma de decisiones; y finalmente, se monitorean los resultados.
DATA
Se pregunta usando Acceso a los datos Conectar los Convertir y Responder a través Resultados.
la técnica SMART objetivos al analisis formatear datos, de dashboards,
de datos y limpiar la analizar procesos y utilizar herramientas
Preparar datos data buscar por feedback para comunicar y Actúe sobre los
Preguntas para recopilando y presentar la datos y utilice los
ASK
PREPARE
ANALYZE
SHARE
ACT
PROCESS
definir el problema almacenando la información resultados del
información. Procesar datos Analice los datos análisis
limpiando y para encontrar
Incluye la meta, comprobando la patrones, relaciones Comparte datos con
objetivos y Incluye la información y tendencias tu audiencia Incluye las
preguntas generación de datos, soluciones a trabajar
recolección, para resolver el
almacenamiento y Incluye la limpieza e Incluye la Incluye comunicar e problema
administración de integridad de datos exploración de interpretar
datos datos, visualización y resultados
análisis
USOS DE LA INFORMACIÓN
Identificar Tomar
Mejorar Lanzar nuevos Servir a
oportunidades decisiones
procesos productos clientes
y tendencias bien analizadas
DATA ANALYSIS AND BUSINESS ANALYTICS
obtener conclusiones
hacer predicciones y Prescriptivo Utiliza pruebas y otras técnicas para determinar qué
resultado producirá el mejor resultado en un escenario
conducir a la tomar decisiones informada en particular
BUSINESS ANALYTICS VS DATA SCIENCE
Data science
Machine Learning and AI
• Se desea automatizar y tomar muchísimas decisiones en circunstancias inciertas
Estadística
• Se desea tomar decisiones en circunstancias inciertas
Analítica
• No se sabe cuantas decisiones se desean obtener, se desea explorar y entender su negocio.
DATA ANALYST (ANALISTA DE DATOS)
DATA SCIENTIST (CIENTIFICO DE DATOS)
DATA SPECIALIST/ ENGINEER (INGENIERO DE DATOS)
Data Analyst
Encuentra respuestas a preguntas existentes
mediante la creacion de conocimientos a partir de
fuentes de datos
Data Scientist
Data Engineer
Maneja base de datos, código, recuperación de datos
DATA ECOSYSTEM
Lenguaje de Software de
Hojas de calculo Bases de datos
consultas (Queries) visualización
Planear: El negocio decide que
tipo de datos necesita, quien
será el responsable y que desea
obtener
Administrar: Donde se
almacenan los datos,
mecanismo, seguridad,
mantenimiento apropiado.
FASES DE LOS DATOS EN EL CICLO DE Los datos pasan por diferentes etapas
VIDA
REVIEW
Semana 1
Identificar el concepto
OBJETIVO de Inteligencia de
negocios
Introducción al BI
• El progreso y la evolución hacen que las sociedades estén en
un constante cambio.
• Los nuevos modelos económicos generadores de riquezas,
obligan a las empresas a realizar un esfuerzo de mejora
continua, acercándose todo lo posible al usuario y
consumidor.
• Necesidad de dotar a las diferentes organizaciones de una
mente superior capaz de dar respuestas concretas y
prácticas, para conseguir optimizar al máximo toda actividad
empresarial.
Introducción al BI
• De la misma manera que el cuerpo humano ingiere
alimentos, las empresas requieren de información para
nutrirse, alimentarse y crecer en el mundo de los negocios
que avanza velozmente.
• Los datos son elementos de incalculable valor para que las
empresas ganen competitividad y velocidad en este nuevo
paradigma económico.
• Almacén de las empresas, en la era de la Información y del
Conocimiento.
Introducción al BI
• Las organizaciones necesitan tomar decisiones de manera
cada vez más eficiente y rápida.
• Decisiones fundamentadas en datos.
• No es suficiente apoyarse en tareas manuales para el análisis
de datos
• Las organizaciones deben apoyarse en los sistemas de
inteligencia de negocio como estrategia angular para
desarrollar sus estrategias de datos.
Introducción al BI
• La gestión de una organización se fundamenta en tomar
decisiones adecuadas respecto a clientes, productos,
empleados, proveedores y procesos de negocio.
• Una nueva forma de competir que se fundamenta en tomar
decisiones basadas en datos y evidencias dejando atrás la
intuición.
• Combina diferentes estrategias para generar valor de
negocio: business intelligence (BI), business analytics y big
data.
• El objetivo es poder tomar mejores y más rápidas decisiones
informadas de negocio.
Introducción al BI
• Aunque vivimos en la era de los datos complejos, conocida
como big data, y la progresiva automatización de nuestras
capacidades predictivas, la inteligencia de negocio sigue
siendo relevante.
• No todas las organizaciones han logrado alcanzar el éxito
esperado.
La pirámide organizacional
• Toda empresa, organización o negocio nace con unos
objetivos alcanzables mediante un trabajo organizado.
• Esta planificación transforma horizontalmente las
actividades necesarias para conseguir los objetivos del
negocio, en tareas concretas y bien definidas.
• También queda establecido un orden jerárquico para la
toma de decisiones que serán representados en diferentes
niveles:
Orden Jerárquico de Toma de Decisiones
Nivel Superior Nivel Medio Nivel Inferior
ESTRATÉGICO TÁCTICO OPERATIVO
«Lo que no se define no se puede medir. Lo que no se mide, no se puede mejorar. Lo que no se
mejora, se degrada siempre».
William Thomson
Business Intelligence en el nivel estratégico
- A este nivel, el Business Intelligence facilita y confiere a la alta
dirección contar con información, analizarla y monitorear las
tendencias y evoluciones; de esta manera puede valorar el nivel de
consecución de los objetivos estratégicos de la organización, tomando
En definitiva
rápidas decisiones.
afecta en la
Business Intelligence en el nivel táctico totalidad del
- El Business Intelligence permite que la gerencia que se encuentra
en este nivel, junto con los analistas de datos, puedan hacer uso de
sistema de
herramientas analíticas para poder llegar a conclusiones, accediendo
a información sin necesidad de recurrir a otros estamentos.
gestión
empresarial:
Business Intelligence en el nivel operativo
- Facilita a los empleados información directa y clara sobre los
procedimientos a seguir mediante instrucciones precisas. Esta
información se representa mediante informes con datos actualizados.
Algunas de las tecnologías que forman parte de
la business intelligence son estas:
• Data warehouse.
• Reporting.
• Análisis OLAP (online analytical processing).
• Análisis visual.
• Análisis predictivo.
• Cuadro de mando.
• Cuadro de mando integral.
• Minería de datos.
• Gestión del rendimiento.
• Previsiones.
• Reglas de negocio.
• Dashboards.
• Integración de datos (que incluye extract,
transform and load; ETL).
Ejemplo Práctico
El ejemplo servirá para comprender que es una solución de Business Intelligence. Tanto la organización
como la situación expuestas a continuación son ficticias. aunque la problemática y la necesidad son
similares a las de muchas empresas: contar con la información que permita tomar decisiones respecto a su
quehacer.
Viajes Mercurio es una antigua agencia de viajes, de alto prestigio y con oficinas en todas las grandes
ciudades del país, que ha perdido su clientela de forma progresiva debido a la proliferación de empresas del
mismo rubro y la competencia de los departamentos de viajes de grandes cadenas comerciales.
Muchos de los agentes conocen a sus clientes habituales. recuerdan sus intereses. su nivel económico y su
disponibilidad de tiempo. Pero esto no es suficiente. Cuando un agente no se encuentra. o bien cuando se
incorporan nuevos agentes, se repiten las situaciones en las que el cliente debe explicar, por ejemplo. que sus
vacaciones son solo de quince días en agosto y que los quince días restantes los utilizará, como siempre. en
Navidad, para Viajar a Chicago donde vive su hijo. En agosto desea tomar, como todos los años, un tour a
Sudamérica. Una vez más deberá explicar que son cuatro personas: su esposa, sus suegros y él. Y como ellos
ya son personas mayores, el tour no puede ser agotador.
Ejemplo Práctico
Cuando el agente que lo atiende empieza a detallar todos los destinos posibles, el deberá explicarle que hace mucho
tiempo dejaron de interesarle las ruinas, y que, como ya ha dicho en otras ocasiones, ahora lo que desea es tomar el sol
en una playa tranquila, con vegetación exuberante y con la posibilidad de recorrer pueblos y comprar artesanías típicas.
Dicho esto, el agente selecciona solo los tours que cumplen con esas características, pero él ya ha recorrido Brasil de
norte a sur, también Ecuador, México y Costa Rica. Las alternativas se reducen cada vez más hasta llegar a las dos últimas
posibilidades: un tour a la isla de Pascua, pero las fechas de salida no coinciden con las de sus vacaciones, y un tour a
Uruguay, donde solo quedan cupos para dos personas. Desilusionado, el cliente pregunta ahora por los pasajes a Chicago,
ya que seguramente es hora de reservarlos, pero ¡sorpresa! No se sabe qué ha sucedido este año, pero todos los vuelos
están copados para esa fecha.
Preocupados por la situación, los directivos de la agencia se embarcan en un proyecto de Business Intelligence y durante
la fase de análisis descubren que deben crear una base de datos donde registren, por un lado, la información de sus
prestaciones [tours, venta y reserva de pasajes, hoteles, etcétera) y, por otro, la información de sus clientes: preferencias,
exigencias, disponibilidades de tiempo y económicas, predilecciones de líneas áreas y necesidades adicionales, como
asistencia en vuelos o viaje con animales de compañía. También la composición familiar y la historia de los servicios
utilizados.
Ejemplo Práctico
Como resultado del proyecto, al año siguiente el cliente recibe por correo folletos con información de todos los tours a
playas tropicales que él no conoce y que se realizarán en las fechas en que el toma sus vacaciones. Y para su sorpresa,
recibe también una carta indicándole que se le han reservado dos pasajes para viajar a Chicago en Navidad y que él solo
debe telefonear para confirmarlos. Adicionalmente, la empresa se da cuenta de que existen segmentos de la población
que no están incluidos en sus prestaciones como son el turismo de aventura y lugares no turísticos y puede así captar
nuevos clientes.
El siguiente
diagrama,
creado por
Forrester
Research
(Una de las
principales
empresas de
prospección
del mercado),
ilustra las
diferentes
tecnologías y
aspectos que
forman parte
de la
inteligencia de
negocio:
Las principales características que limitan
estos sistemas son:
• Gran rigidez a la hora de extraer datos
• Necesidad de conocimientos técnicos
• Deterioro en el rendimiento de los sistemas de
información
• Falta de integración que implica islas de datos
• Datos erróneos, obsoletos o incompletos.
• Problemas para adecuar la información a cada usuario.
• Ausencia de información histórica
Diferencias entre business intelligence,
business analytics y big data
Business analytics
Se entiende por business analytics el conjunto de estrategias, tecnologías y
sistemas que permiten analizar el rendimiento pasado de una organización
para poder predecir comportamientos futuros, así como para detectar
patrones ocultos en la información.
Big data.
Se entiende por big data el conjunto de estrategias, tecnologías y sistemas
para el almacenamiento, procesamiento, análisis y visualización de conjuntos
de datos complejos, que frecuentemente, pero no siempre, viene definida por
volumen, velocidad y variedad.
La siguiente
tabla describe
las diferencias
entre estas
estrategias:
La siguiente gráfica
permite identificar
casos de uso
respecto a la
complejidad del
dato y las
capacidades
analíticas que
desarrollar en la
organización.
Beneficios de un sistema de business
intelligence
• Crear un círculo virtuoso de la información
• Proporcionar una visión única, conformada, histórica, persistente y de calidad de toda la información
relevante para la organización.
• Crear, manejar y mantener métricas, indicadores claves de rendimiento (key performance indicador; KPI) e
indicadores claves de metas (key goal indicator; KGI) fundamentales para la empresa.
• Habilitar el acceso a información actualizada.
• Reducir el diferencial de orientación de negocio entre el departamento TI y la organización.
• Mejor comprensión y documentación de los sistemas de información en el contexto de una organización.
• Mejor compresión de las opiniones y necesidades de los potenciales clientes a partir del análisis de redes
sociales.
• Mejora de la competitividad de la organización como resultado de ser capaces de:
– Diferenciar lo relevante de lo superfluo.
– Acceder más rápido a información.
– Tener mayor agilidad en la toma de las decisiones.
¿Cuándo es necesaria la inteligencia de
negocio?
Existen situaciones en las que la implantación de un sistema de business
intelligence resulta adecuada:
Semana 2
Comprender y explicar la
OBJETIVO importancia de tener una
estrategia de BI
Porque necesita una empresa un
sistema de BI?
Información
Depurar la información
Visualizar la información
Analizar la información
https://youtu.be/LZ17kISv5Ag
NUBE https://youtu.be/h4Af5bbFAq0
Ejercicio de Clase
Escriba en un documento de Word los siguientes conceptos:
1. Que es una Base de Datos?
2. Que es un gestor de Base de Datos?
3. Cómo se clasifican las Bases de Datos?
4. Que es una Base de Datos Relacional?
5. Que es un software ERP y CRM?
6. Que es un Datawarehouse?
7. Que es un Data Mart?
8. Que entiende por almacenamiento en la Nube?
El desarrollo de una
estrategia de negocio es un Establecer los estándares de BI en la organización.
proceso a largo plazo que
incluye múltiples actividades,
entre las que es conveniente
destacar: Identificar qué procesos de negocio necesitan diferentes
aplicaciones analíticas que trabajen de manera continua para
asegurar que no existen silos de funcionalidad.
Desarrollo de una estrategia de
negocio
Desarrollar un framework de métricas a nivel empresarial como el pilar de una gestión del rendimiento a nivel
corporativo.
Incluir los resultados de aplicaciones analíticas (minería de datos u otras) en los procesos de negocio
Considerar inversiones tácticas cuyo retorno de inversión estén dentro de un periodo de tiempo de un año
• Disparador tecnológico.
• Pico de expectativa inflada.
• Valle de la desilusión.
• La pendiente de tolerancia.
• Plateau de productividad.
Business
intelligence
maturity model
• El BIMM (business intelligence maturity
model) es un modelo de madurez que
permite clasificar nuestra organización
desde el punto de vista del grado de
madurez de implantación de sistemas
business intelligence en ella (en relación
directa con frameworks como COBIT6)
Modelo de
Madurez BI Fase 3: Aparición de procesos formales de toma
de decisiones basada en datos.
IoB.
Segunda tendencia: Experiencia total
La experiencia total combina la Por ejemplo, una compañía de telecomunicaciones transformó
multiexperiencia, experiencia con el cliente, toda su experiencia del cliente en un esfuerzo para mejorar la
experiencia del empleado y experiencia de seguridad y satisfacción. Primero, desplegó un sistema de citas
usuario para transformar el resultado del a través de una app ya existente. Cuando los clientes llegaban
negocio. La meta es mejorar la experiencia para su cita y se acercaban dentro de 75 pies de la tienda,
general donde todas estas piezas se reciben dos cosas: 1) una notificación para guiarlos a través del
intersectan, tecnología, empleados y proceso de check-in y 2) una alerta haciéndoles saber cuanto
usuarios. Esta tendencia habilita la tiempo sería antes de poder entrar seguramente a la tienda y
capitalización de disruptores de COVID-19 a mantener distanciamiento social.
las organizaciones La compañía también ajustó su servicio para incluir más kioskos
digitales y permitir a los empleados usar sus propias tablets
para co-navegar los aparatos de los clientes sin tener que
tocarlos físicamente. El resultado fue uno más seguro,
transparente e experiencia global integrada para los clientes y
empleados.
Tercera tendencia:
Computación que mejora la
privacidad
• Privacy Enhancing Computation cuenta con
tres tecnologías que protegen la información
mientras es utilizada. La primera provee un
ambiente de confianza en el cual la información
sensible puede ser procesada o analizada. La
segunda lleva a cabo el procesamiento y la
analítica de una manera descentralizada. La
tercera encripta información y algoritmos antes
del procesamiento o la analítica.
• Esta tendencia permite que las organizaciones
colaboren en la investigación de forma segura en
múltiples regiones y con competidores sin tener
que sacrificar la confidencialidad. Este
acercamiento está diseñado específicamente
para la creciente necesidad de compartir
información manteniendo la privacidad o
seguridad.
Cuarta tendencia: Nube distribuida
La nube distribuida es donde los servicios de nube son distribuidos a diferentes ubicaciones físicas, pero la
operación, gobernancia y evolución permanecen bajo la responsabilidad del proveedor público de la nube.
• La hiperautomatización es la idea
de que cualquier cosa que puede
ser automatizada en una
organización debería ser
automatizada. La
hiperautomatización está impulsada
por organizaciones que tienen
procesos de negocio legacy que no
están optimizados, lo que crea
problemas enormemente costosos y
extensos para las organizaciones.
Soluciones open source business intelligence
Top Herramientas Business Intelligence
•Pentaho (Kettle, Mondrian, JFreeReport and Weka. Versions OS y
Enterprise)
•Talend (ETL, Data quality and MDM. Versions OS y Enterprise)
•LinceBI (Kettle, Mondrian, STDashboard, STCard and STPivot)
•Jasper Reports (iReport. Versions OS y Enterprise)
•Power BI
Investigar: En que consiste la herramienta, que ofrece? Es totalmente gratuita o hay opción de pago?
Investigue empresas que utilizan esta herramienta y cómo ha sido la experiencia para ellas.
Bibliografía
Un data warehouse es un repositorio de datos que proporciona una visión global, común e integrada de los
datos de la organización, independiente de cómo se vayan a utilizar posteriormente por los consumidores o
usuarios.
Tiene las propiedades siguientes:
•Estable
•Coherente
•Fiable
•Con información histórica.
Al abarcar un ámbito global de la organización y con un amplio alcance histórico, el volumen de datos puede
ser muy grande (centenas de terabytes). Las bases de datos relacionales son el soporte técnico más
comúnmente usado para almacenar las estructuras de estos datos y sus grandes volúmenes.
Big data =
TECNOLOGÍA enfocada a gran
solución de datos
Data Warehouse=
ARQUITECTURA que soporta a gran
almacén de datos
Variable en el tiempo
No volátil
Integrado
Orientado a un tema
Kimball determinó que para él un Data Warehouse no era más que un conjunto de los Data Marts de
una organización. Un Data Mart es una copia de las transacciones específicamente estructurada para
la consulta y el análisis. Defiende por tanto una metodología Bottom-up a la hora de diseñar un
almacen de datos.
La diferencia de Data Warehouse y Data Marts es solamente en cuanto al alcance. Mientras que un
Data Warehouse es un sistema centralizado con datos globales de la empresa y de todos sus procesos
operacionales, un Data Mart es un subconjunto temático de datos, orientado a un proceso o un área de
negocio específica.
MODELADO DIMENSIONAL
El Modelado Dimensional es utilizado hoy en día en la mayoría de las soluciones de BI. Es una mezcla
correcta de normalización y desnormalización, comúnmente llamada Normalización Dimensional. Se
utiliza tanto para el diseño de Data Marts como de Data Warehouses.
Básicamente hay dos tipos de tablas:
• Tablas de Dimensión (Dimension Tables)
• Tablas de Hechos (Fact Tables)
TABLAS DE HECHOS (FACT TABLES)
Tablas Transaccionales
Tablas de acumulados
TABLAS DE HECHO (FACT TABLES)
TRANSACCIONAL Es una visión fundamental y básica de las operaciones de negocio. Se utiliza para
de VISTA DE PERIODICA La vista rápida o periódica de la tabla de hechos te ofrece una visión del estado de las
cosas en un momento determinado, es algo como una «imagen del momento». En ella se representa el
hecho
rendimiento de una actividad al final de cada día o de una semana o de un mes, o de cualquier otro intervalo
de tiempo, a diferencia de la tabla de hechos transaccionales, en la que se añade una nueva fila por la
ocurrencia de cada evento.
ACUMULADO Se utilizan para representar la actividad de cualquier proceso que tenga un inicio y un final
bien definidos y claros.
ELEMENTOS DE UNA TABLA DE HECHO
• Clave principal: identifica de forma única cada fila. Al igual que en los sistemas transaccionales toda tabla
debe tener una clave principal, en una tabla de hechos puede tenerla o no, y esto tiene sus pros y sus contras,
pero ambas posturas son defendibles.
• Claves externas (Foreign Keys): apuntan hacia las claves principales (claves subrogadas) de cada una de las
dimensiones que tienen relación con dicha tabla de hechos.
• Medidas (Measures): representan columnas que contienen datos cuantificables, numéricos, que se pueden
agregar. Por ejemplo, cantidad, importe, precio, margen, número de operaciones, etc.
• Metadatos y linaje: nos permite obtener información adicional sobre la fila, como por ejemplo, que día se
incorporó al Data Warehouse, de qué origen proviene (si tenemos varias fuentes), etc. No es necesario para el
usuario de negocio, pero es interesante analizar en cada tabla de hechos qué nos aporta y si merece pena
introducir algunas columnas de este tipo.
TABLAS DE DIMENSIONES
En el data warehouse un SCD es una dimensión que contiene datos relativamente estáticos que podrían cambiar lenta o
de forma impredecible en lugar de una forma típica.Alguno ejemplos comunes de SCD están en las entidades como ser
ubicación geográfica, clientes o productos.
Pueden ser de los siguientes tipos
SCD TIPO 0 que retiene el original
SCD 1 sobre escribe
SCD 2 agrega una nueva línea
SCD 3 agrega un nuevo atributo
SCD 4 agrega una tabla histórica
SCD 5 técnica que realiza una mini dimensión (4+1)
SCD 6 Combina(1+2+3=
SCD 7 hibrido
TIPOS DE DIMENSIONES: SCD TIPO 0
SCD 4 Se le conoce habitualmente como tablas históricas. Existe una tabla con datos actuales y otra con los
antiguos
SCD 5 Combina las históricas con la tipo 1
SCD 6 es hibrida porque combina la 1 2 y 3 con el fin de reducir el tamaño de las consultas temporales
ARQUITECTURA DE UN DATA WAREHOUSE
Podemos distinguir diferentes tipos de medidas basadas en el tipo de información que recopilan, así como su
funcionalidad asociada:
Métricas: valores que recogen el proceso de una actividad o sus resultados. Estas medidas proceden del
resultado de la actividad del negocio:
Metricas de realización de actividad (LEADING) miden la realización de una actividad. Ejemplo la participación de una persona en un
evento.
Metricas de resultado de una actividad (LAGGING) recogen los resultados de una actividad. Ejemplo la cantidad de puntos de un
jugador en un partido
Indicadores clave: Son los valores correspondientes que hay que alcanzar, y que suponen el grado de
asunción de los objetivos. Estas medidas proporcionan información sobre el rendimiento de una
actividad o consecución de meta:
Key Performance Indicator (KPI)
Key Goal Indicator (KGI)
KPI
Todos los factores que caracterizan el data warehouse tienen su base en una arquitectura
formada por capas o niveles. Esta varía dependiendo de la utilidad que se le dé al almacén
de datos en la organización. Sin embargo, en líneas generales, la arquitectura del DWH
se conforma por:
1. Fuentes de datos
2. ETL
3. Almacén de datos
4. Data marts
5. Explotación de los datos
COMPONENTES EN EL CONTEXTO
Es habitual ver que los términos ETL y data pipelines se usan indistintamente. Y aunque ambos mueven datos
desde el origen hasta el destino, data pipeline es un término más amplio que abarca todo el viaje de mover
datos de un sistema a otro, en el que ETL es un subconjunto.
Los data pipelines pueden diseñarse para el procesamiento por lotes, para la transmisión de datos, y una
combinación de datos por lotes y en streaming. En el caso de los datos en streaming, el procesamiento o
transformación de datos ocurre en un flujo continuo.
Esto es particularmente útil para datos que necesitan una actualización constante, como los datos de un
sensor que monitorea el tráfico.
DATA PIPELINES
Un data pipeline es un sistema de alto rendimiento que soporta tanto consultas por lotes de larga
duración como consultas interactivas más pequeñas.
El destino de un data pipeline suele ser un data lake, aunque los datos también pueden cargarse en
diferentes destinos, como en otra aplicación o en una herramienta de visualización.
Existen varias soluciones disponibles para data pipelines, siendo las más populares Apache Beam y
DataFlow.
BIG DATA
Las Fuentes de Datos pueden ser internas o externas a la organización y pueden ser primarias, secundarias o
terciarias, dependiendo de si se obtienen los datos directamente de la fuente original, se recuperan de fuentes
de datos externas disponibles o se compran a agregadores de datos.
Algunas de las fuentes de datos de las que podrías estar reuniendo datos son las bases de datos, la web, las
redes sociales, las plataformas interactivas, los dispositivos de sensores, los intercambios de datos, las
encuestas y los estudios de observación.
Los datos identificados y reunidos de las diversas fuentes de datos se combinan utilizando diversos
instrumentos y métodos para proporcionar una única interfaz que permita consultar y manipular los datos.
Los datos que se identifican, la fuente de ellos y las prácticas que se emplean para reunirlos, tiene
repercusiones en la calidad, la seguridad y la privacidad, que deben considerarse en esta etapa.
Si se utiliza una base de datos relacional como sistema de destino, sólo podrás almacenar datos
estructurados, como datos de sistemas OLTP, hojas de cálculo, formularios online, sensores, registros de red y
web. Los datos estructurados también se pueden almacenar en NoSQL.
Los datos semiestructurados son datos que tienen algunas propiedades de organización pero no un
esquema rígido, como por ejemplo, datos de correos electrónicos, XML, archivos comprimidos, ejecutables
binarios y protocolos TCP/IP. Los datos semi-estructurados pueden almacenarse en clústeres NoSQL. XML y
JSON se utilizan habitualmente para almacenar e intercambiar datos semiestructurados. JSON es también el
tipo de datos preferido para los servicios web.
Los datos no estructurados son los que no tienen una estructura y no pueden organizarse en un esquema,
como los datos de las páginas web, fuentes de redes sociales, imágenes, vídeos, documentos, registros de
medios y encuestas. Las bases de datos NoSQL y los Data Lakes constituyen una buena opción para almacenar
y manipular grandes volúmenes de datos no estructurados.
DATA WRANGLING
Los conjuntos de datos recogidos de fuentes dispares pueden tener varios problemas, como valores faltantes,
inexactitudes, duplicados, delimitadores incorrectos o ausentes, registros incoherentes y parámetros
insuficientes.
En algunos casos, los datos pueden corregirse manual o automáticamente con la ayuda de herramientas y
scripts de data wrangling, pero si no pueden repararse, deben eliminarse del conjunto de datos. Aunque los
términos Data Cleaning ("limpieza de datos") y Data Wrangling se utilizan a veces indistintamente, es
importante tener en cuenta que la limpieza de datos es sólo un subconjunto de todo el proceso de Data
Wrangling.
BIBLIOGRAFÍA
CURTO DÍAZ, J. (2016). INTRODUCCIÓN AL
BUSINESSINTELLIGENCE. BARCELONA, EDITORIAL UOC.
RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/101030?.
LÓPEZ BENÍTEZ, Y. (2018). BUSINESS INTELLIGENCE.
ADGG102PO. ANTEQUERA (MÁLAGA), IC EDITORIAL.
RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/124393?.
CONESA CARALT, J. Y CURTO DÍAZ, J. (2013). INTRODUCCIÓN
AL BUSINESS INTELLIGENCE. BARCELONA, SPAIN: EDITORIAL
UOC. RECUPERADO DE
HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/56524?.
departamento de IT
ELEMENTOS DE UN INFORME
Texto : que describe el estado del proceso de negocio, proporciona las descripciones necesarias para entender el
Elementos resto de los elementos del informe, así como etiquetas (Títulos) o metadatos (Fecha de
de un Tablas : Que tiene forma de matriz y permite presentar una gran cantidad de información.
informe
Gráficos: que persiguen el objetivo de mostrar información con un alto impacto visual que sirva para obtener
información agregada con mucha más rapidez que a través de tablas.
Alertas visuales y automáticas: que permiten definir avisos automáticos de los cambios de estado de un proceso de
negocio. Estas alertas están formadas por elementos gráficos, como fechas, iconos o colores resultados y deben
estar automatizadas en función de reglas de negocio encapsuladas en el cuadro de mando.
La visualización de datos es la disciplina de comunicar información mediante el uso de elementos
visuales como gráficos, diagramas y mapas. Su objetivo es hacer que la información sea fácil de comprender,
interpretar y retener.
Utilizando la visualización de datos, se puede proporcionar un resumen de las relaciones, tendencias
y patrones ocultos en los datos, que, aunque no imposible, sería muy difícil de descifrar a partir de un volcado
de datos. Para que la visualización de datos resulte de valor, hay que elegir la visualización que
más eficazmente haga llegar los resultados a la audiencia.
GRÁFICOS
Mejorar Medir
• Consiste en implementar las mejoras • Consiste en desarrollar o revisar los
recopiladas en el punto anterior en el sistemas de información que recopilan
sistema de reporting . Estas mejoras la información necesaria para las
pueden ser en forma, contenido, métricas. Revisar
distribución, calidad del dato, etc
Recopilar Revisar
• Recopilar: Consiste en recopilar de • Consiste en comprobar que el dato de
manera continua el feedback por parte los sistemas anteriores representa de
de los usuarios, así como futuras manera efectiva, válida, completa y con
necesidades. calidad los procesos de negocio.
Crear
• Consiste en crear el informe y en
habilitar su distribución a las partes
interesadas.
CUADRO DE MANDO INTEGRAL
debemos primero recoger y organizar los datos, después verificar que los datos de nuestra hoja de calculo este
limpia, libre de errores y que no contenga ninguna columna y fila en blanco, después debemos formatearla como
una tabla.
Después debemos crear alguna tabla dinámica que nos ayude a analizar nuestros datos y deberemos realizar algún
ordenamiento y filtrado en los datos en nuestras tablas dinámicas para resaltar los aspectos clave en nuestro
análisis.
Finalmente crearemos varias visualizaciones de datos, como gráficas, mapas y slicers para ayudarnos a contar una
historia sobre lo que encontremos en nuestros datos.
KPI
Son indicadores clave de rendimiento que se utilizan para evaluar el éxito de las acciones y/o procesos en la
medida en que estos contribuyen a la consecución de los objetivos, para determinar si están dando los frutos
esperados o es necesario realizar correcciones
Los indicadores clave de rendimiento permiten medir en tiempo real el funcionamiento de las estrategias de
negocios, marketing o ventas brindando una información valiosa para tomar decisiones estratégicas que permitan
a la empresa optimizar sus recursos para alcanzar el mejor ROI posible
Los KPIs también desempeñan una importante función comunicativa ya que informan a directivos, empleados e
inversores sobre la evolución de la empresa respecto a los objetivos establecidos, para que todos puedan trabajar
con una visión y una meta común
QUE KPI ELEGIR
A pesar de que los KPI son imprescindibles para poder hacer un seguimiento y
control de cualquier proyecto o negocio, muchas empresas fallan a la hora de elegir
las métricas adecuadas que se deben monitorizar, e incluyen en sus dashboards KPI
que no son los adecuados para obtener una visión real de lo que está ocurriendo
En cada área empresarial se pueden seleccionar claves de desempeño concretas que
permiten conocer la evolución de las estrategias que están siendo llevadas a cabo
Mostramos a continuación algunos de los KPI más utilizados en las principales áreas
de una empresa
KPI FINANCIEROS
Flujo de caja
Margen bruto de utilidad El flujo de caja Cash Flow permite medir a una
empresa su capacidad para afrontar los pagos que
Consiste en medir la salud económica y financiera de
van surgiendo en el día a día Se trata de un KPI que
un negocio, y mide el porcentaje económico
permite evaluar la liquidez de una empresa o
resultante después de descontar el coste de
proyecto posibilitando el hecho de detectar en
adquisición de los productos vendidos
tiempo real, problemas de caja que puedan generar
La fórmula para calcular este KPI es dificultades a la hora de afrontar pagos a corto plazo
Margen bruto de utilidad ==(Coste de la mercancía Para calcular este KPI se utiliza la fórmula
vendida-Ingreso total)/Ingreso total
Flujo de Caja =Beneficio Neto + Amortizaciones +
Provisiones
KPI DE MARKETING
Tasa de conversión
Este KPI es quizás uno de los más importantes para el
departamento de ventas, pues mide el porcentaje de
Número de leads generados leads que se convierten en clientes de la empresa
(realizan una compra) Mientras mayor sea la tasa de
Conseguir clientes potenciales es parte del trabajo del conversión, más éxito están teniendo las acciones
equipo de ventas, ya que se trata de personas que comerciales del equipo de ventas
realmente están interesadas en los productos y
servicios de la empresa, y por lo tanto hay un mayor Costo de adquisición de clientes
porcentaje de querer hacer una compra. Este KPI mide,
por lo tanto, el número de leads generados por el El CAC o costo de adquisición de clientes pondera la
equipo de venta. inversión llevada a cabo para conseguir que un cliente
potencial realice una compra y se convierta en cliente
de la empresa. En campañas de captación de clientes
este valor permite evaluar si dicha acción ha merecido
la pena o no ha resultado rentable
KPI EN TI
El último factor para determinar la calidad de los datos es la puntualidad. Este rasgo se refiere a la disponibilidad y
accesibilidad de los datos seleccionados. Supongamos que nuestro informe de ventas se utilizará para las
revisiones semanales de los empleados, pero nuestro informe sólo se actualiza una vez al mes. Este error al
actualizar los datos haría que nuestro informe quedara desactualizado y tendría graves consecuencias para las
revisiones de los empleados.
IMPORTACIÓN DE DATOS EN EXCEL
Es muy común que al recopilar o importar datos, ya sea a través de procesos manuales o automatizados, se
obtengan errores e inconsistencias en sus datos.
Esto puede ser tan simple como errores ortográficos, espacio en blanco adicional o el uso de mayúsculas y
minúsculas incorrectas en el texto, filas vacías o valores faltantes en sus datos, datos inexactos o duplicados.
Tener estos errores e inconsistencias en sus datos puede llevar a problemas con fórmulas que no funcionan, con
operaciones de clasificación y filtrado fallidas y, por lo tanto, resultados de datos visualizados y presentados de
manera inadecuada.
LIMPIEZA DE DATOS: SPELLING
IF
IFS (ANIDADO)
COUNTIF
SUMIF
VLOOKUP
HLOOKUP
POWER QUERY
Power Query es un motor de transformación y preparación de datos. Power Query incluye una interfaz
gráfica para obtener datos de orígenes y un editor de Power Query para aplicar transformaciones. Dado
que el motor está disponible en muchos productos y servicios, el destino donde se almacenarán los
datos depende de dónde Power Query se ha usado. Con Power Query, puede realizar el procesamiento
de extracción, transformación y carga (ETL) de los datos.
Actualmente, hay dos Power Query experiencias disponibles:
• Power Query Online— Se encuentra en integraciones como flujos de datos de Power BI, flujos de datos
de Microsoft Power Platform, flujos de datos de Azure Data Factory de reorganización y muchos más
que proporcionan la experiencia a través de una página web en línea.
• Power Query para escritorio— Se encuentra en integraciones como Power Query para Excel y Power BI
Desktop.
COMO HACER UN POWER QUERY
RECUPERADO DE HTTPS://ELIBRO.NET/ES/EREADER/UNITECHN/101030?.