NORMALIZACION
NORMALIZACION
NORMALIZACION
Introducción
El diseño tiene como objetivo obtener una serie de esquemas
que permitan almacenar información, sin redundancia y de fácil
acceso.
Fue creado por Peter Chen en el año 1976, y desde entonces se ha vuelto
muy popular. En 1988 el ANSI(Instituto Nacional Estadounidense de
Estándares) seleccionó el modelo ER como el modelo estándar para los
sistemas de diccionarios de recursos de información (IRDS).
ATRIBUTO (attribute)
RELACION (relationship)
Entidad Relación
Entidad: Representa una “cosa” u "objeto" del mundo real con
existencia.
Ejemplos:
Una persona. (Se diferencia de cualquier otra persona, incluso
siendo gemelos).
Son las características, rasgos y propiedades de una entidad, que toman como
valor una instancia particular. Es decir, los atributos de una tabla son en realidad
sus campos descriptivos, el predicado que permite definir lo que decimos de un
determinado sujeto. Por ejemplo de una entidad o tabla catálogo, se pueden
determinar los atributos título, subtítulo, título paralelo, otras formas del título, autor
principal, otras menciones de responsabilidad, edición, mención de edición,
editorial, lugar de publicación, fecha de publicación,...
Ejemplo:
cédula
nombre
teléfono
Entidad relación
Clave principal o primaria
Realizar comprobaciones
Cardinalidad
Es el numero de entidades con la cual otra entidad puede asociar
mediante una relación.
Tipos de relación
Uno a uno
Uno a muchos
Muchos a uno
Muchos a muchos
Ejemplo
Estamos en un servicio de biblioteca queremos llevar el control del
préstamo que incluya los siguientes datos:
usuario libro
usuario libro
Hay que romper la relación muchos a muchos, creando una relación intermedia
alumno
Entidad
Cod_alunmo
Atributos
Cardinalidad
Llave
primaria libro
Cod_libro
libro
Cod_alum_libro
Cod_libro
Cod_alunmo
Llaves
foraneas
Normalización de Bases de Datos
Para mejorar el desempeño de una base de datos, así como evitar redundancia en la información que contiene y, en
consecuencia, generar condiciones para un mejor diseño, el analista de sistemas debe conocer las formas de
normalización y condiciones en las que la desnormalización es recomendable.
En este tema se abordarán aspectos conceptuales básicos relacionados con las formas de normalización, generalmente
utilizadas en el análisis, desarrollo e implementación de sistemas de bases de datos (1FN, 2FN y 3FN); además,
particularidades y consideraciones que el analista deberá evaluar para decidir normalizar a mayor grado una base de
datos, mantener su forma normal actual o la desnormalización en un modelo relacional.
La normalización es la transformación de las vistas de usuario complejas y del almacén de datos a un juego de
estructuras de datos más pequeñas y estables. Además de ser más simples y estables, las estructuras de datos son más
fáciles de mantener que otras estructuras de datos. (Kendall, 2005)
Nueva estructura
1. Cuando diseñan una nueva estructura de bases de datos fundamentada en las necesidades de negocios de
usuarios finales.
Mejora en el diseño
3. Por medio de un análisis de relaciones entre los atributos o campos de la estructura de datos, el diseñador puede
usar el proceso de normalización para mejorarla, a fin de crear un diseño apropiado de bases de datos.
Modificación de estructura
4. Para diseñar una nueva estructura de datos o modificar una ya existente, el proceso de normalización es el
mismo.
Reglas de normalización
Primera forma normal (1FN)
La primera regla de normalización se expresa generalmente en forma de dos indicaciones separadas.
1. Todos los atributos, valores almacenados en las columnas, deben ser indivisibles.
2. No deben existir grupos de valores repetidos.
El valor de una columna debe ser una entidad atómica, indivisible, excluyendo así las dificultades que podría conllevar el
tratamiento de un dato formado de varias partes.
Supongamos que tienes en una tabla una columna Dirección para almacenar la dirección completa, dato que se
compondría del nombre de la calle, el número exterior, el número interior (puerta), el código postal, el estado y la capital.
Las tablas que están ajustadas a la primera forma normal, y además disponen de una clave primaria formada por
una única columna con un valor indivisible, cumplen ya con la segunda forma normal. Ésta afecta exclusivamente a
las tablas en las que la clave primaria está formada por los valores de dos o más columnas, debiendo asegurarse,
en este caso, que todas las demás columnas son accesibles a través de la clave completa y nunca mediante una
parte de esa clave.
2FN
Una tabla está en segunda forma normal (2FN) cuando:
Está en 1FN.
Y también cuando no incluye dependencias parciales, esto es, ningún atributo es dependiente de sólo una parte de la
llave primaria.
Debe considerarse que todavía es posible que una tabla en 2FN exhiba dependencia transitiva; esto es, la llave primaria
puede apoyarse en uno o más atributos no primos para determinar funcionalmente otros atributos no primos, como está
indicado por una dependencia funcional entre los atributos no primos.
La normalización crea más tablas al avanzar hacia formas normales más altas, sin embargo, a mayor número de tablas,
mayor número de combinaciones al recuperar los datos; lo que contribuye a la ralentización de las consultas. Por esta
razón, para mejorar la velocidad de determinadas consultas, se pueden anular las ventajas de la integridad de datos y
devolver la estructura de los datos a una forma normal inferior.
Adicionalmente, Coronel, Morris y Rob (2011), al referir al proceso de desnormalización, señalan que la unión de muchas
tablas requiere operaciones de entrada/salida (I/O) y lógica de procesamiento adicional en el disco, con lo que se reduce
la velocidad del sistema. Por lo tanto, pueden existir circunstancias fortuitas que permitan algún grado de
desnormalización para incrementar la velocidad de procesamiento. Debemos tomar en cuenta que la ventaja de una
mayor velocidad de procesamiento debe evaluarse cuidadosamente contra la desventaja de datos anómalos.