Datawarehouse
Datawarehouse
Datawarehouse
Presenta:
Ledin Inocente Gutiérrez Vicente
pág. 1
INDICE
1. Introducción 3
2. Que es un datawarehouse 4
3. características 5
4. diseño 6
5. Elementos que lo integran 8
6. Arquitectura 9
7. Proceso de construcción 9
8. Función 10
9. Quienes y para que lo usan 11
10. Aportaciones 12
11. Objetivos 13
12. Ventajas y desventajas 13
Conclusión 15
Referencias 16
Anexos 17
pág. 2
1. INTRODUCCIÓN
paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business
Inteligentes.
El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se
pág. 3
2. QUE ES UN DATAWAREHOUSE
depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis
datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista
Según Ralph Kimball define un almacén de datos como: una copia de las transacciones de datos
específicamente estructurada para la consulta y el análisis y no era más que la unión de todos los
En ellos se utilizan los Data marts que son subconjuntos, para áreas específicas.
pág. 4
3. CARACTERÍSTICAS
por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser
Temático: sólo los datos necesarios para el proceso de generación del conocimiento del
negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar
su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre
clientes pueden ser consolidados en una única tabla del datawarehouse. De esta forma, las
peticiones de información sobre clientes serán más fáciles de responder dado que toda la
En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en
entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el datawarehouse se carga con
los distintos valores que toma una variable en el tiempo para permitir comparaciones.
incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin
pág. 5
Otra característica es que contiene metadatos (datos sobre los datos). Los metadatos
forma de cálculo.
lenguaje de negocio, indicando qué información hay y qué significado tiene. Ayudar a construir
consultas, informes y análisis, mediante herramientas de Business Inteligentes como DSS, EIS o
CMI.
4. DISEÑO
la transformación de los datos hacia el almacén. Una vez construido, se requieren medios para
especialmente del tipo de consultas a realizar. Con este criterio los datos deben ser repartidos
pág. 6
Para abordar un proyecto de datawarehouse es necesario hacer el estudio de algunos temas
muy orientada por las necesidades del negocio y debe ser compatible con la arquitectura técnica
Entorno técnico.- Se debe incluir tanto el aspecto del hardware (mainframes, servidores,
redes) así como aplicaciones y herramientas. Se dará énfasis a los Sistemas de soporte a
proyecto tecnológico, es una forma de vida de las organizaciones y como tal, tiene que contar con
resultados generados de forma iterativa que se harán para llegar a la construcción del producto
final deseado.
pág. 7
Prueba del concepto tecnológico.- Es un paso opcional que se puede necesitar para
espera.
concepto de los datos en el almacén de datos, debe contener toda la información referente a:
Tablas.
Columnas de tablas.
Entidades y Relaciones.
forma en que los datos se guardan en un almacén de datos o en cualquier base de datos. Implican
Transformación. Cualquier operación realizada sobre los datos para que puedan
pág. 8
Middleware: su función es asegurar la conectividad entre todos los componentes de la
6. ARQUITECTURA
comunicación, procesamiento y presentación, que existe para los usuarios finales que disponen de
7. PROCESO DE CONSTRUCCIÓN
externas.
pág. 9
Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la
información.
de datos a los demás usuarios. Por ello es importante elegir este usuario inicial o piloto, siendo
importante que sea un departamento con pocos usuarios, en el que la necesidad de este tipo de
8. FUNCIÓN
En un almacén de datos lo que se quiere es contener datos que son necesarios o útiles para
una organización, es decir, que se utiliza como un repositorio de datos para posteriormente
herramientas para hacer consultas o informes. Los usuarios finales pueden hacer fácilmente
consultas sobre sus almacenes de datos sin tocar o afectar la operación del sistema.
Integración de los datos provenientes de bases de datos distribuidas por las diferentes
pág. 10
heterogéneas). Se debe facilitar una descripción global y un análisis comprensivo de toda la
Separación de los datos usados en operaciones diarias de los datos usados en el almacén
de datos para los propósitos de divulgación, de ayuda en la toma de decisiones, para el análisis y
para operaciones de control. Ambos tipos de datos no deben coincidir en la misma base de datos,
negocio para la transformación posterior. Es práctica común normalizar los datos antes de
(ETL). Estas herramientas leen los datos primarios (a menudo bases de datos OLTP de un
decir que su aplicación más rica corresponde a entornos de empresas en los que se identifican
acceder a meses o años de historia transaccional tomada directamente en los puntos de venta de
pág. 11
Manufactura de Bienes de Consumo Masivo: Las empresas de este sector necesitan hacer
un manejo cada vez más ágil de la información para mantenerse competitivas en la industria. Los
determinado precio y, por consiguiente, producir la cantidad adecuada para una entrega "justo a
tiempo".
meses o años de datos de clientes y sistemas de reservas para realizar actividades de marketing,
10. APORTACIONES
relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de
dicha información.
pág. 12
Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones
11. OBJETIVOS
Ventajas
Los almacenes de datos hacen más fácil el acceso a una gran variedad de datos a los
usuarios finales.
como informes de tendencia, por ejemplo: obtener los ítems con la mayoría de las ventas en un
área en particular dentro de los últimos años; informes de excepción, informes que muestran los
pág. 13
Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor
Desventajas
A lo largo de su vida los almacenes de datos pueden suponer altos costos. El almacén de
A veces, ante una petición de información estos devuelven una información sub óptima,
A menudo existe una delgada línea entre los almacenes de datos y los sistemas
operacionales.
Hay que determinar qué funcionalidades de estos se pueden aprovechar y cuáles se deben
pág. 14
CONCLUSION
así como su aplicación a empresas o a diferentes ámbitos. Además podemos observar que es una
decisiones en cualquier área funcional, basándose en información integrada y global del negocio.
También ayuda a comprender los datos del pasado y de predecir situaciones futuras en diversas
áreas.
pág. 15
REFERENCIAS
http://www.sinnexus.com/business_intelligence/datawarehouse.aspx
http://www.dataprix.com/qu-es-un-data-warehouse
http://es.slideshare.net/nesegohv/datawarehouse1
http://www.gridmorelos.uaem.mx/~mcruz//cursos/miic/warehouse.pdf
http://www.exa.unicen.edu.ar/catedras/dwhouse/
http://es.slideshare.net/sebasrod/introduccin-al-datawarehouse-e-inteligencia-de-negocios
http://www.1keydata.com/datawarehousing/inmon-kimball.htm
http://www.gestiopolis.com
http://www/ibermatica/publicaciones/Bussines
http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos
Hernández, J.O; Ramírez, M.J.Q; Ferri, 2010. “Introducción a la Minería de Datos”, Editorial
Pearson.
http://www.gravitar.biz/index.php/category/pentaho/
http://www.intelligententerprise.com
http://www.eside.deusto.es/profesores/mherran/
http://mondrian.pentaho.org/documentation/architecture.php
http://www.ongei.gob.pe/publica/metodologias/Lib5084/15.HTM
http://programacion.net/articulo/data_warehouse_201/6
pág. 16
ANEXOS
Figura 2. Operaciones. Esta imagen muestra los tipos de operaciones que se realiza dentro de un
Datawarehouse. Recuperado de http://programacion.net/articulo/data_warehouse_201/6
pág. 17