Data Warehouse
Data Warehouse
Data Warehouse
I.
OBJETIVOS
a) General:
Con el presente trabajo pretendemos Conocer a profundidad sobre data
warehouse.
b) Especificos:
Definir
qu es data warehouse as como su relacin con data
warehousing.
Indicar las diferencias y similitudes entre data warehouse y data
mart.
Definir y diferenciar OLTP Y OLAP
Conocer la arquitectura de data warehouse y su metodologa.
analizar el proceso de construccin e implantacin de las
herramientas Data Warehouse en las empresas.
Orientado a temas
1
Integrado
En un sistema operacional no hay integracin, pero en un
Data Warehouse todos los datos se encuentran integrados.
Esta integracin se muestra de diferentes maneras:
consistencia en codificacin de estructuras, en unidades de
medida de las variables, en mltiples fuentes, en
convenciones de nombres, en atributos fsicos de los datos
etc.
iii.
Variante en el tiempo
En los sistemas operacionales, los datos siempre reflejan el
estado de la actividad del negocio en el momento presente,
por el contrario, la informacin almacenada en el Data
Warehouse refleja un histrico de los datos en un horizonte de
tiempo mucho ms amplio (del orden de aos). De esta forma
podemos detectar tendencias en el tiempo.
iv.
No voltil
El Data Warehouse existe para ser ledo y no para ser
modificado, la informacin es por tanto permanente, la
actualizacin del Data Warehouse significa la incorporacin de
los ltimos valores que tomaron las distintas variables
contenidas en l, sin ningn tipo de accin sobre lo que ya
exista. Los datos ms recientes no sustituyen a los
precedentes, sino que suelen mantenerse con un mayor nivel
de detalle.
3.
Data warehouse
Data Mart
Almacn de datos de un Almacn de datos de una
sistema
completo
por rea
especfica;
ventas,
ejemplo de una empresa
compras, marketing, etc.
Conjunto de datos mart
Es nico
Mart.
3.2. Similitud:
Ambos son almacn de datos, que facilitan la informacin para la
buena gestin de la organizacin.
4.
5.
constituyentes
de
una
Arquitectura
Data
Una Arquitectura Data Warehouse (Data Warehouse Architecture DWA) es una forma de representar la estructura total de datos,
comunicacin, procesamiento y presentacin, que existe para los
usuarios finales que disponen de una computadora dentro de la
empresa.
La arquitectura
interconectadas:
se
constituye
de
un
nmero
de
partes
5.2. Elementos
Warehouse
constituyentes
de
una
Arquitectura
Data
6.
Hardware
Software de almacenamiento (SGBD)
Software de extraccin y manipulacin de datos
Herramientas Middleware
a) Hardware
Un componente fundamental a la hora de poder contar con un
Data Warehouse que responda a las necesidades analticas
avanzadas de los usuarios, es el poder contar con una
infraestructura hardware que la soporte.
b) Software de almacenamiento (SGBD)
Como hemos comentado, el sistema que gestione el
almacenamiento de la informacin (Sistema de Gestin de Base
de Datos o SGBD), es otro elemento clave en un Data Warehouse.
Independientemente de que la informacin almacenada en el
Data Warehouse se pueda analizar mediante visualizacin
multidimensional, el SGBD puede estar realizado utilizando
tecnologa de Bases de Datos Relacionales o Multidimensionales.
Las bases de datos relacionales, se han popularizado en los
sistemas operacionales, pero se han visto incapaces de
enfrentarse a las necesidades de informacin de los entornos
Data Warehouse. Por ello, y puesto que, como hemos comentado,
las necesidades de informacin suelen atender a consultas
multidimensionales, parece que unas Bases de Datos
multidimensionales, parten con ventaja. En este sentido son de
aplicacin los comentarios que realizamos en el apartado de
hardware, por requerimientos de prestaciones, escalabilidad y
consolidacin tecnolgica.
c) Software de extraccin y manipulacin de datos
Para la extraccin y manipulacin de datos, es crtico el poder
contar con herramientas que permitan controlar y automatizar
los continuos "mimos" y necesidades de actualizacin del Data
Warehouse. Estas herramientas debern proporcionar las
siguientes funcionalidades:
Control de la extraccin de los datos y su automatizacin.
6
Warehouse.
Se pueden implantar mecanismos de bloqueo para las
consultas que vayan a implicar un tiempo de respuesta
excesivo.
6.2. Fases de implantacin de un Data Warehouse
La construccin e implantacin de un Data Warehouse es un proceso
evolutivo. Este proceso se tiene que apoyar en una metodologa
especfica para este tipo de procesos, siendo importante el realizar
un control para asegurar el seguimiento de la misma. Planteamos
aqu la metodologa propuesta por SAS Institute: la "Rapid
Warehousing Methodology". Dicha metodologa es iterativa, y est
basada en el desarrollo incremental del proyecto de Data Warehouse
dividido en cinco fases:
12