Modulo66 PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Des-normalización, Data Warehouse y Data Mining

Ante la actual avalancha de información y la gran demanda de la misma, las empresas


llegan a un punto en que los simples reportes generados por sus sistemas de computación
son insuficientes para obtener indicadores de gran importancia, por lo tanto surge la
necesidad de recurrir a herramientas poderosas tales como los almacenes de datos (Data
Warehouse), la minería de datos (Data Mining) ambas funcionando para el principio de
desnormalización.

La Globalización de mercados que obliga a tener la información de forma estandarizada, la


orientación en el costo, calidad, tiempo y cliente como estrategia de negocios y buscar
tener ventaja competitiva son determinantes para las empresas en materia de obtener los
datos de forma que permitan tomar decisiones.

Des-Normalización de Bases de Datos


Es el proceso de tomar el modelo de datos lógicos y transformarlo en un modelo físico que
es eficaz para las tareas más comunes. Estas tareas pueden incluir generación de informes,
pero también pueden significar consultas más eficaces.

¿En que Consiste la Desmoralización?, consiste en organizar los datos


para reducir los datos redundantes

La des-normalización es lo inverso a la normalización, su utilidad radica en pre-procesar los


datos para mostrarlos de manera que el usuario pueda comprenderlos.

La des-normalización permite pasar de tener que ver


toda la información en tablas dispersas a poder verla
toda unida en una sola tabla y generar reportes en
base a ella.

Material facilitado por Ing. Gerardo Josué Portillo (gerardo.portillo@uth.hn)


Conjunto de Tablas
Normalizadas

(Vista Normalizada)

Vista des-normalizada

Observe que en la vista normalizada la información está dentro de 5 tablas relacionadas


entre si por medio de llaves en cambio en la vista des-normalizada se toma esas 5 tablas
y se muestran como un todo (combinar tablas o INNER JOIN), esto para fines de
reportería ya que en el sistema la información se seguirá almacenando de forma
normalizada.

Usos de la des-normalización
Hay cientos de usos para la información des-normalizada, los más conocidos son:
1. Para generación de reportes
2. OLAP (Procesamiento Analítico en Línea) [Data Warehouse]
3. Minería de Datos

Material facilitado por Ing. Gerardo Josué Portillo (gerardo.portillo@uth.hn)


Generación de Reportes
Consiste en la creación de nuevos atributos (columnas) en la relación a la manipulación de
los datos contenidos en atributos existentes.

Es el uso más popular de las vistas des-normalizadas y es como normalmente los usuarios
ven la información de los sistemas de software, por ejemplo: una factura, un reporte de
ventas, un balance general o un reporte de inventarios.

Vista Normalizada
(Como está en la base de datos)

La Baleada Sampedrana S. de R.L.


Vista Des-Normalizada
(Como el usuario ve la data en un reporte)

Las imágenes de arriba muestran como de tres tablas que están relacionadas y que
cumplen con normalización al relacionarse pueden generar un reporte de existencias
mínimas de un inventario de materiales.

OLAP y Data Warehouse


El procesamiento analítico en línea genera información basada en datos normalizados y
guarda esta en una base de datos multidimensional que permite ver los datos desde todos
los diferentes lados y también los puede manipular torciéndolos o rotándolos para que
tengan sentido.

Material facilitado por Ing. Gerardo Josué Portillo (gerardo.portillo@uth.hn)


Por ejemplo con un almacén de datos es posible ver la
información por año, por mes por cliente o si el usuario lo
prefiere también puede ver la información por producto,
mes y cliente. La bondad de este tipo de herramientas es la
toma rápida de decisiones lo que permite tener una
perspectiva mas completa de la información que la empresa
genera día con día.

No olviden que la información oportuna mejora el tiempo


de respuesta de las empresas ante su competencia.

La aplicación mas conocida del concepto de OLAP es el almacén de


datos o Data Warehouse: Un sistema de Data Warehouse permite
transformar datos o información bruta en información con sentido y
extremadamente útil.

Objetivos del OLAP


1. Hacer que la información de la organización sea accesible
2. Hacer que la información de la organización sea adaptable y flexible
3. Seguridad en el resguardo de la información
4. Ser la base principal para la toma de decisiones.

Razones para implementar un Almacén de datos (Data warehouse)


1. Para realizar tareas de consulta en los servidores que no son utilizados por el sistema de
proceso de transacciones y así obtener consultas y reportes consolidados.
2. Para utilizar modelos de datos que agilizan las consultas y reportes, y que no son
apropiados para los procesos de transacciones.
3. Para proveer un ambiente donde haya una muy poca cantidad de conocimiento de los
aspectos técnicos de tecnología de bases de datos para así poder escribir y mantener
consultas y reportes de una forma sencilla.
4. Para proveer un almacén del sistema de proceso de transacciones limpio que puede ser
reportado y que no necesariamente requiere que se arregle el software transaccional
que la empresa utiliza.
5. Poder hacer consultas a más de una fuente la cual puede ser externa (fuera de la base
de datos de transacciones) o interna (en la misma base de datos transaccional).

En conclusión un almacén de datos permite guardar consultas ya pre-


procesadas y resumidas que permitan generar un sinfín de reportes,
estas consultas se guardan en un servidor aparte y no en el mismo
servidor del sistema transaccional de la empresa.

Material facilitado por Ing. Gerardo Josué Portillo (gerardo.portillo@uth.hn)


Observe en la imagen como la información resumida se puede ir almacenando en
diferentes bases de datos al final para tener los datos históricos de la empresa aparte
para evitar sacrificar el rendimiento de las bases de datos transacciones de la empresa, o
sea: tener los datos de consulta separados.

Minería de Datos
Identifica modelos que un humano no puede esto en base a algoritmos que buscan
patrones en almacenes de datos siguiendo ciertas reglas.

El Data Warehouse dota a las organizaciones de memoria y el Data


Mining las dota de inteligencia.

Alcance de la Minería de Datos


1. Predicción automatizada de tendencias y comportamientos, por ejemplo en base a
casos de gripe H1N1 conocer bajo que características poblacionales se reproduce dicha
enfermedad.
2. Descubrimiento automatizado de modelos previamente desconocidos, por ejemplo
datos estadísticos para predecir terremotos o para conocer las tendencias de un
mercado.

Material facilitado por Ing. Gerardo Josué Portillo (gerardo.portillo@uth.hn)


El dibujo de arriba muestra una analogía sobre lo que la minería de datos permite
descubrir, la figura muestra un documento con una línea de tiempo para un período de
tiempo, la minería de datos puede relatar que es lo que ocurrió en dicho período de
forma detallada.
Relación entre Data Warehouse y Data Mining

El diagrama muestra como se pueden relacionar los diversos conceptos de des-


normalización para hacer llegar la información necesaria para la toma de decisiones a
los usuarios finales.

Material facilitado por Ing. Gerardo Josué Portillo (gerardo.portillo@uth.hn)

También podría gustarte