Data Warehouse

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 4

DATA WAREHOUSE

1. INTRODUCCIÓN

El Data Warehouse es una tecnología para el manejo de la información


construido sobre la base de optimizar el uso y análisis de la misma utilizado
por las organizaciones para adaptarse a los vertiginosos cambios en los
mercados. Su función esencial es ser la base de un sistema de información
gerencial, es decir, debe cumplir el rol de integrador de información
proveniente de fuentes funcionalmente distintas (Bases Corporativas, Bases
propias, de Sistemas Externos, etc.) y brindar una visión integrada de dicha
información, especialmente
enfocada hacia la toma de decisiones por parte del personal jerárquico de la
organización. Es un sitio donde se almacena de manera integrada toda la
información resultante de la operatoria diaria de la organización. Además,
se almacenan datos estratégicos y tácticos con el objetivo de obtener
información estratégica y táctica que pueden ser de gran ayuda para aplicar
sobre las mismas técnicas de análisis de datos encaminadas a obtener
información
oculta (Data Mining). Esta información incluye movimientos que modifican el
estado del negocio, cualquier interacción que se tenga con los clientes y
proveedores, y cualquier dato adicional que ayude a comprender la
evolución del negocio.
Esta tecnología ayuda a la organización a responder preguntas esenciales
para la toma de decisiones que le permitan obtener ventajas competitivas y
mejorar
su posición en el mercado en el que operan. Algunas de las preguntas
podrían ser:
- Cuál es el perfil de mis clientes?
- Cómo es su comportamiento?
- Cuál es la rentabilidad que me deja?
- Cuál es el riesgo que corro con él?
- Qué servicios y productos utiliza y cómo puedo incrementarlos?
- Etc.
Además, se aplican técnicas de limpieza e Integración de datos, esto
asegura la existencia de estructuras homogéneas persistentes en el tiempo.
Para comprender mejor el funcionamiento de ésta tecnología explicaremos
su arquitectura y los sistemas OLTP y OLAP.
2. ARQUITECTURA

Data Warehouse ETL

 El proceso de extracción de datos de los sistemas de origen y ponerla en la


data warehouse se denomina comúnmente ETL.

 ETL (Extract, Transform and Load) es un proceso responsable de la extracción


de datos de los sistemas de origen y de colocarlo en un almacén de datos o
data warehouse. ETL implica las siguientes tareas:

 Extracción de datos: Es lo primero que hace una herramienta ETL. Se trata de


obtener la información de las distintas fuentes de origen, tanto internas como
externas. Durante la extracción, se identifica los datos deseados y se extrae de
muchas fuentes diferentes, incluyendo los sistemas de bases de datos y
aplicaciones. Después de la extracción de datos, tienen que ser transportados
físicamente al sistema de destino o a un sistema intermedio para su posterior
procesamiento y/o transformación.

 Transformación: es el filtrado, limpieza, depuración, homogeneización y


agrupación de la información. Incluye la agrupación de los datos de las
diferentes fuentes.  La transformación se produce mediante el uso de reglas o
tablas de consulta o mediante la combinación de los datos con otros datos.

 Carga: es el proceso de escribir los datos en la date warehouse. La fase de


carga es el momento en el cual los datos de la fase anterior (transformación)
son cargados en el sistema de destino.

Diseñar y mantener el proceso de ETL es a menudo considerada como una de las


partes más difíciles y que requieren más recursos de un proyecto de data
warehouse. La mayoría de los programas de data warehouse utilizan herramientas
ETL para gestionar este proceso. El software ETL extrae datos, transforma los
valores de los datos inconsistentes, limpia los datos "malos", filtra los datos y
carga los datos en una data warehouse de destino.

 Algunas de estas herramientas más utilizadas son:

 -Oracle Warehouse Builder


 -IBM Websphere DataStage
 - Microsoft SQL Server Integration Services (SSIS)

 Ya tenemos los datos correctamente, Ahora es el momento de analizarlos.

OLAP Data Warehouse

 OLAP = On-Line Analytical Processing = Procesamiento analítico en línea. Es


el método más utilizado para analizar y evaluar los datos de la data warehouse
en línea. Permite a los gerentes y analistas obtener una idea de la información.
Para analizar los datos se utilizan un conjunto de operaciones. Estas
operaciones se realizan mucho más fácilmente con software o programas
OLAP, que suelen incluir los programas data warehouse. Para los programas
OLAP un tiempo de respuesta es una medida de su eficacia.

 OLAP permite al usuario extraer y ver con facilidad y de forma selectiva los


datos desde diferentes puntos de vista.

 Un ejemplo, un usuario puede solicitar que se analizaron los datos para
mostrar una hoja de cálculo que muestra todos los productos una pelota de
playa de una empresa que se venden en Madrid en el mes de julio, comparar
las cifras de ingresos con los de los mismos productos en septiembre y luego
ver una comparación de otras ventas de productos en Madrid en el mismo
período de tiempo.

También podría gustarte