Repaso Normalizacion

Normalización
Una vez creadas las tablas hay que verificarlas y revisar si aún se puede reducir u
optimizar de alguna manera.
Los problemas tales como la redundancia que ocurren cuando se abarrotan demasiados
datos en un sola relación son llamados anomalías. Los principales tipos son:
1. Redundancia: la información se repite innecesariamente en muchas tuplas. En

la relación siguiente, length y filmType.
2. Anomalías de actualización: cuando al cambiar la información en una tupla se
descuida el actualizarla en otra. Si en la relación encontramos que el length de
StarWars es 125 podríamos cambiarlo únicamente para la primer tupla y olvidar
actualizar las demás.
3. Anomalías de eliminación: si un conjunto de valores llegan a estar vacíos y se
llega a perder información relacionada como un efecto de la eliminación. Si
eliminamos al actor Emilio Estevez, perdemos también la tupla de la película
MightyDucks.
title year length filmType studioName starName

Star Wars 1977 124 color Fox Carrie Fisher
Star Wars 1977 124 color Fox Mark Hamill
Star Wars 1977 124 color Fox Harrison Ford
Mighty Emilio
1991 104 color Disney
Ducks Estevez
Wayne's
1992 95 color Paramount Dana Carvey
World
Wayne's
1992 95 color Paramount Mike Meyers
World
3.5.1 Dependencias funcionales (FD)
3.5.1.1 Definición
En el diseño de esquemas de bases de datos el concepto de dependencia funcional

(functional dependency) es vital para eliminar "redundancia", otros factores sería el
manejo de dependencias multivaluadas y las restricciones de integridad referencial.
Una dependencia funcional en una relación R es una enunciado de la forma "si dos
tuplas de R concuerdan en los atributos A1,A2,...An (tienen los mismos valores para
cada atributo), entonces deben concordar también con otro atributo B" . Esta FD se
escribiría como A1,A2,....An --> B y se dice que "A1, A2,....An determina
funcionalmente a B".
Por otro lado, si un conjunto de atributos A1,A2...An determina funcionalmente a más

de un atributo,
A1, A2, ... An ---> B1

A1, A2, ... An ---> B2
A1, A2, ... An ---> Bm
entonces podemos simplemente escribir este conjunto de FDs como: A1, A2, ...An --->
B1,B2,...Bm
Movies(title, year, length, filmType, studioName, starName)
title year length filmType studioName starName

Carrie
Star Wars 1977 124 color Fox
Fisher
Mark
Hamill
Harrison
Ford
Mighty Emilio
1991 104 color Disney
Ducks Estevez
Wayne's Dana
1992 95 color Paramount
World Carvey
Wayne's Mike
1992 95 color Paramount
World Meyers
...
title, year --> length
title, year --> filmType
title, year --> studioName
title, year -/-> starName
podemos entonces afirmar que: title, year --> length, filmType, studioName
Quizás las dependencias funcionales más evidentes sean las llaves.
Decimos que un conjunto { A1, A2,....An } es una llave de un relación si:
1. Esos atributos determinan funcionalmente a "todos" los demás atributos de una

relación.
2. No hay un subconjunto de { A1, A2,....An } que determine funcionalmente a
"todos" los demás atributos (incluyendo al resto del conjunto { A1, A2,....An })
La definición anterior de llave es similar a la que se mencionó anteriormente de

superllave, sin embargo las superllaves no son llaves "mínimas", recordemos que una
llave primaria se escoge de entre el conjunto de superllaves mínimas. Es importante
hacer notar que una llave mínima no se refiere al número de atributos incluídos, se
puede tener una llave mínima ABC y otra DE donde ambas son mínimas aún cuando
una de ellas sea todavía de menor tamaño que la otra.
Al conjunto de dependencia funcionales de una relación R se le denominará F.
3.5.1.2 Axiomas de Armstrong:
 Reflexividad: sea un conjunto de atributos y entonces --> *

 Aumentación: si --> y es un conjunto de atributos entonces -->
 Transitividad: si --> y --> entonces -->
*Nota:
 De manera general una dependencia funcional de la forma --> se considera

"dependencia funcional trivial" si
 Si al menos algún elemento de no pertenece a se considera una dependencia
no trivial.
 Si ningún elemento de pertenece a entonces se considera una dependencia
completamente no trivial
3.5.1.3 Reglas adicionales
 Unión: si --> y --> entonces -->

 Decomposición: si --> entonces --> y -->
 Pseudotransitividad: si --> y --> entonces -->
3.5.1.4 Cerradura de un conjunto de atributos
Para un esquema R y un conjunto de atributos , si --> R entonces es superllave
para determinar lo anterior se puede encontrar +, todos los atributos que dependen
funcionalmente de
teniendo R(A,B,C,D,E)
si A+=(A,B,C,D,E), entonces A--> R entonces A es superllave
La cerradura se puede calcular siguiendo el siguiente algoritmo:
entrada: ,F
salida: +
result= =
while changes to result do =result
for each ( --> F )
do
begin result -->
if result then (reflexividad)
result=result --> , -->
(transitividad)
end
end
teniendo R (A,B,C,D,E,F) y F las dependencias: AB-->C, BC-->AD, D-->E, CF-->B.

Comprobar que {A,B}+ ={A,B,C,D,E}
Si {A,B}+ = {A,B,C,D,E,F} entonces podríamos afirmar que AB es superllave, pero

para ello sería necesaria alguna dependencia adicional ej. AB --> CF
El calcular la cerradura es empleado para:
 Verificar si es una superllave, calculando + y revisando si + contiene a

todos los atributos de la relación R.
 Verificar una dependencia funcional --> (es decir, si pertenece a F+)
checando si +.
 Calcular F+ (la cerradura de todo el conjunto de dependencias F en una relación
R): Para cada R se calcula + y para cada elemento S + se obtiene una
dependencia funcional --> S.
3.5.2 Primera forma normal
Una tabla se encuentra en 1a NF, si todos sus atributos son atómicos (indivisibles)
El ejemplo clásico:
nombre dirección teléfono
En 1a. NF
nombre apellido_paterno apellido_materno dirección teléfono

3.5.3 Segunda forma normal
Una tabla se encuentra en 2a NF, si está en 1a NF y cada atributo que NO es llave es

"completamente" dependiente de la llave.
Si tenemos la tabla:
calificaciones_cursos
id_estudiante depto clave_curso descripción calificación
NO se encuentra en 2a NF ya que
{ id,clave,depto} --> descripción
{clave,depto} --> descripción
Analizando todas las dependencias funcionales:
{ id,clave,depto} --> descripción
{clave,depto} --> descripción
{ id,clave,depto} --> calificación
Para realizar la normalización (2NF) la relación se descompondría en:
curso
depto clave_curso descripción

estud_curso
id depto clave_curso calificación
La descomposición se basa básicamente en:
 La intuición
 Las dependencias funcionales
Es importante que al descomponer una relación exista:
 Descomposición sin pérdida

 Preservación de dependencias funcionales

3.5.4 Descomposición sin pérdida
Al descomponer una relación R en varias relaciones R1 y R2 se debe verificar que no

haya pérdidas, es decir, que al volver a combinar las relaciones (producto entre R1 y
R2) se obtengan exactamente las mismas tuplas.
Decimos entonces que para una descomposición en R1 y R2 no hay pérdida si:
{ R1 R2 --> R1 } F+
o bien si
{ R1 R2 --> R2 } F+
Para el ejemplo anterior la relación
id_estudiante depto clave_curso descripción calificación
F={ { id,clave,depto} --> descripción, {clave,depto} --> descripción, { id,clave,depto}

--> calificación }
tiene F+= { { id,clave,depto} --> id,clave,depto,descripción,calificación, {clave,depto}

--> descripción }
y dicha relación se descompone en:
depto clave_curso descripción
id_estudiante depto clave_curso calificación
donde R1 R2 = depto,clave_curso donde depto,clave_curso -->descripción
y {depto,clave_curso -->descripción} { { id,clave,depto} -->

id,clave,depto,descripción,calificación, {clave,depto} --> descripción }
3.5.5 Preservación de dependencias

Al descomponer una relación R en varias relaciones R1,R2,..Rn es importante revisar
que se preserven las dependencias funcionales iniciales. De esta manera se garantiza
que una actualización no provoque una relación inválida, verificando las FDs o bien a
través de combinaciones de relaciones(productos o joins) aunque esto último no es muy
eficiente.
Para ello se analizan todas la dependencias funcionales Fi para cada Ri que deberán ser
un subconjunto de F+
De manera que F' = F1 F2 ...Fn
y la preservación se verifica si F'+= F+
para el ejemplo anterior teniendo:
F={ { id,clave,depto} --> descripción, {clave,depto} --> descripción, { id,clave,depto}

--> calificación }
F+= { { id,clave,depto} --> id,clave,depto,descripción,calificación, {clave,depto} -->

descripción }
F1= depto,clave_curso--> descripción
F2= id_estudiante,depto,clave_curso --> calificación
F' = F1 F2
depto,clave_curso--> descripción
id_estudiante,depto,clave_curso --> calificación
F'+= { { id,clave,depto} --> id,clave,depto,descripción,calificación, {clave,depto} -->

descripción }
y como F'+= F+ entonces si hay preservación de dependencias.
3.5.6 Forma normal de Boyce-Codd (BCNF)
3.5.6.1 Características
Un esquema relacional se encuentra en BCNF si para toda dependencia funcional X -->

A:
 X --> A es una dependencia funcional trivial
o
 X es una super llave
BCNF no necesariamente preserva las dependencias funcionales F'+ != F+
3.5.6.2 Algoritmo general de descomposición tratando de alcanzar BCNF
result= {R}
done=false
calcular F+
while (! done) do
if(existe un esquema Ri en result que no
está en BCNF) then
si --> es una dependencia
funcional no trivial en Ri
tal que --> Ri no
está en F+ y =0
result= ( result - Ri )
( Ri - ) ( , )
else
done=true
end
Ejemplo:
R(A,B,C,D)
B--> C (B)+ = {CD}

B-->D
La superllave sería {AB} por lo tanto no cumple con BCNF

(B-->CD y B no es superllave).
Descomponiendo usando B-->CD
(A,B) (B,C,D)
Esta última en BCNF
3.5.7 Tercera forma normal
3.5.7.1 Características
Un esquema relacional se encuentra en 3NF si para toda dependencia funcional X -->

A:
 X --> A es una dependencia funcional trivial
 X es una super llave
 A es miembro de una llave candidata de R

Lo anterior no quiere decir que una sola llave candidata deba contener a todos
los atributos de A, cada atributo de A puede estar contenido en llaves candidatas
diferentes.
Se puede observar que las 2 primeras restricciones son las mismas que para BCNF pero
existe una tercera que da flexibilidad a las relaciones.
Podemos afirmar entonces que: "Si una relación está en BCNF, está también 3NF; pero
si una relación está en 3NF no necesariamente está en BCNF".
ejemplo, dada la relación
branch-name customer-name banker-name office-number
banker-name --> branch-name office-number
customer-name branch-name --> banker-name
Se puede observar {customer-name branch-name} determina al resto de los atributos así

que es la superllave de R.
No está en 3NF porque:
 Las DFs no son triviales

 En la primer dependencia, "banker-name" no es superllave de R
 Se puede observar que office-number y banker-name no son parte de alguna
llave candidata
se descompondría en:
banker-name branch-name office-number
banker-name --> branch-name office-number
customer-name branch-name banker-name
customer-name branch-name --> banker-name
banker-name --> branch-name

Esta descomposición si está en 3NF porque:
 No hay dependencias funcionales triviales

 En la segunda relación, la segunda DF no cumple que banker-name es superllave
 En la segunda relación, la segunda DF, branch-name es miembro de la llave
candidata
{customer-name, branch-name}
Al cumplirse la 3er regla se confirma que la descomposición está en 3NF.
Se puede observar que al no cumplir con las 2 primeras no está en BCNF pero gracias al
relajamiento si está en 3NF
Otro ejemplo:
deptos
nombre_depto extensión id_jefe

nombre_depto --> extensión, jefe
empleados
id_empleado nombre_depto id_jefe

id_empleado --> nombre_depto, id_jefe
nombre_depto --> id_jefe
No está en 3NF porque:
 Las DFs no son triviales

 En la dependencia "nombre_depto-->id_jefe" de la segunda relación,
"nombre_depto" no es superllave de R
 Se puede observar nuevamente para la segunda relación que id_jefe no es parte
de alguna llave candidata
Aplicando la descomposición:
deptos
nombre_depto extensión id_jefe

nombre_depto --> extensión, jefe
empleados
id_empleado nombre_depto
id_empleado --> nombre_depto
Esta descomposición si está en 3NF porque:

 No hay dependencias funcionales triviales
 Para toda dependencia X--> A , X es superllave.
Se observa como la relación no solo está en 3NF sino también en BCNF por cumplir
con la segunda regla.
3.5.7.2 Algoritmo general de descomposición tratando de alcanzar 3NF
3.5.7.2.1 Forma canónica de las FDs (Fc)
La forma canónica de F es aquel conjunto mínimo de dependencias funcionales

equivalentes a F, sin dependencias redundantes o partes redundantes de dependencias.
Para obtener la Fc se deben extraer todos los miembros "extraños", suponga un conjunto
F de dependencias funcionales y la dependencia --> está en F.
 El atributo A es extraño en si A y
F lógicamente implica (F - { --> }) { ( - A ) --> }
Ejemplo:
F = { A --> C , AB --> C }
B es extraño en AB --> C porque { A --> C, AB --> C } lógicamente

implica A --> C (el resultado de quitar B de AB --> C ).
 El atributo A es extraño en si A y
el conjunto de dependencias (F - { --> }) { --> ( - A ) } implica
lógicamente a F
Ejemplo:
F = { A --> C , AB --> CD}
C es extraño en AB --> CD porque A B --> C puede ser inferido aún

después de eliminar C
Test para verificar si un atributo es extraño
Dado un conjunto de dependencias F y --> está en F
 Para verificar si A es extraño en

o calcular ( { } - A )+ usando las dependencias en F
o verificar si ( { } - A )+ contiene a , si lo hace entonces A es extraño
 Para verificar si A es extraño en
o calcular + usando solo las dependencias en:
F'=(F - { --> }) { --> ( - A) }

o verificar si + contiene a A, si lo hace entonces A es extraño
3.5.7.2.2 Algoritmo basado en Fc
Fc: Forma canónica de las FDs
1. Para cada dependencia X --> Y en Fc,

crear una relación Ri (X,Y)
2. Si ninguna de las Ris contiene una de las superllaves de la
relación,
crear Ri(X) donde X es una de las superllaves de la
relación original
3. Si Ri y Rj tienen una llave en común,
mezclar Ri y Rj
4. Eliminar relaciones redundantes
*El algoritmo anterior garantiza que en una descomposición no haya pérdida (al incluir
por lo menos en una relación una de las superllaves) y que se preserven las
dependencias funcionales (al incluir cada una de ellas).
Ejemplo:
sid name street city zip
student
Fc:
sid -->name,street,city
street, city-->zip
zip --> city
Descomponer en 3NF
1. R1(sid, name, street, city), R2(zip, street, city), R3(zip,

city)
2. -
3. -
4. Eliminar R3
sid name street city
R1
sid -->name,street,city
zip street city

R2
street, city-->zip
zip --> city
3.5.8 BCNF vs 3NF
Como se mencionó anteriormente: "Si una relación está en BCNF, está también 3NF;
pero si una relación está en 3NF no necesariamente está en BCNF".
En la práctica la mayoría de los esquemas en 3NF también están en BCNF,

contraejemplo:
(Sucursal, Cliente, Banquero)
banquero --> sucursal
sucursal, cliente --> banquero
está en 3NF pero no en BCNF puesto que "banquero" no es una superllave,

normalizando:
suc-banquero (sucursal, banquero)
suc-cliente (sucursal, cliente)
Nuevamente se presentan las pérdidas de dependencias
Qué es mejor ? BCNF o 3NF ?
 De manera general se puede decir que ambas son buenas.

 El caso ideal es conseguir BCNF sin pérdidas y con preservación de
dependencias.
 Si se alcanza BCNF pero no hay preservación de dependencias se puede
considerar una 3NF (recordando que 3NF siempre debe carecer de pérdidas y
debe preservar dependencias).
3.6 Conclusiones
De manera que las metas del diseño de bases de datos con dependencias funcionales
son:
 BCNF*
 Descomposición sin pérdida
 Preservación de dependencias
* Llegar a una forma BCNF puede llegar a ser complicado, debido a esto en muchas
ocasiones es suficiente con alcanzar la 3NF para lograr un buen diseño.

Repaso Normalizacion

Cargado por

Copyright:

Formatos disponibles

Repaso Normalizacion

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Repaso Normalizacion

Cargado por

Copyright:

Formatos disponibles

Normalización

1. Redundancia: la información se repite innecesariamente en muchas tuplas. En

title year length filmType studioName starName

3.5.1 Dependencias funcionales (FD)

En el diseño de esquemas de bases de datos el concepto de dependencia funcional

Por otro lado, si un conjunto de atributos A1,A2...An determina funcionalmente a más

A1, A2, ... An ---> B1

A1, A2, ... An ---> Bm

Movies(title, year, length, filmType, studioName, starName)

title year length filmType studioName starName

title, year --> length

title, year --> filmType

title, year --> studioName

title, year -/-> starName

Quizás las dependencias funcionales más evidentes sean las llaves.

Decimos que un conjunto { A1, A2,....An } es una llave de un relación si:

1. Esos atributos determinan funcionalmente a "todos" los demás atributos de una

La definición anterior de llave es similar a la que se mencionó anteriormente de

Al conjunto de dependencia funcionales de una relación R se le denominará F.

3.5.1.2 Axiomas de Armstrong:

 Reflexividad: sea un conjunto de atributos y entonces --> *

 De manera general una dependencia funcional de la forma --> se considera

3.5.1.3 Reglas adicionales

 Unión: si --> y --> entonces -->

3.5.1.4 Cerradura de un conjunto de atributos

Para un esquema R y un conjunto de atributos , si --> R entonces es superllave

si A+=(A,B,C,D,E), entonces A--> R entonces A es superllave

La cerradura se puede calcular siguiendo el siguiente algoritmo:

teniendo R (A,B,C,D,E,F) y F las dependencias: AB-->C, BC-->AD, D-->E, CF-->B.

Si {A,B}+ = {A,B,C,D,E,F} entonces podríamos afirmar que AB es superllave, pero

El calcular la cerradura es empleado para:

 Verificar si es una superllave, calculando + y revisando si + contiene a

3.5.2 Primera forma normal

nombre dirección teléfono

nombre apellido_paterno apellido_materno dirección teléfono

3.5.3 Segunda forma normal

Una tabla se encuentra en 2a NF, si está en 1a NF y cada atributo que NO es llave es

id_estudiante depto clave_curso descripción calificación

{ id,clave,depto} --> descripción

{clave,depto} --> descripción

Analizando todas las dependencias funcionales:

{ id,clave,depto} --> descripción

{clave,depto} --> descripción

{ id,clave,depto} --> calificación

Para realizar la normalización (2NF) la relación se descompondría en:

depto clave_curso descripción

id depto clave_curso calificación

La descomposición se basa básicamente en:

Es importante que al descomponer una relación exista:

 Descomposición sin pérdida

3.5.4 Descomposición sin pérdida

Al descomponer una relación R en varias relaciones R1 y R2 se debe verificar que no

Decimos entonces que para una descomposición en R1 y R2 no hay pérdida si:

Para el ejemplo anterior la relación

id_estudiante depto clave_curso descripción calificación

F={ { id,clave,depto} --> descripción, {clave,depto} --> descripción, { id,clave,depto}

tiene F+= { { id,clave,depto} --> id,clave,depto,descripción,calificación, {clave,depto}

y dicha relación se descompone en:

depto clave_curso descripción