F. Bases de Datos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

T.E.C.N.M.

V
Campus Acapulco

Alumno: José Ignacio Díaz


Rodriguez
Materia: Fundamentos de
Bases de Datos

Unidad 4- Normalización
de Bases de Datos
Profesor: Juan Luis Bringas
Ramírez
Semestre 4, Grupo:
10:00-11:00 am.
Tema: Investigación del
tema 4.

Acapulco Gro., a 05 de junio del 2022


Índice
Introducción .................................................................................................... 3
4.1- Conceptos Básicos .................................................................................... 4
4.2-Primera Forma Normal.............................................................................. 6
4.3-Dependencias Funcionales y transitivas .................................................... 7
4.4-segunda Forma Normal ............................................................................. 8
4.5-Tercera Forma Normal ............................................................................ 10
4.6-Forma Normal Boyce-codd ...................................................................... 11
4.7-Otras Formas Normales .......................................................................... 13
Conclusión ..................................................................................................... 15
Bibliografía .................................................................................................... 16

2
Introducción
El estudio de los problemas de diseño de las bases de datos relacionales. En general, el
objetivo del diseño de las bases de datos relacionales es la generación de un conjunto de
esquemas relacionales que nos permita almacenar la información sin redundancias innecesarias,
pero que también nos permita recuperar fácilmente esa información. Un enfoque es el diseño de
esquemas que se hallen en una forma normal adecuada. Para determinar si el esquema de una
relación se halla en una de las formas normales deseables hace falta información adicional sobre
la empresa real que ese está modelando con la base de datos. En este capítulo se introduce el
concepto de la dependencia funcional. Luego se definirán las formas normales en términos de las
dependencias funcionales y otros tipos de dependencias de datos.

La teoría de bases de datos incluye los principios formales para definir y manipular datos
estructurados e interrelacionados. Para definir los datos se utiliza un modelo de datos y para su
manipulación un lenguaje. Diferentes modelos de datos se han propuesto buscando un mayor
nivel expresivo para representar el mundo real. La potencia y limitaciones de cada modelo se
pueden evaluar desde un punto de vista teórico y se evidencian desde un punto de vista práctico
cuando se trata de implementarlos en aplicaciones tradicionales y modernas. Estas últimas
generalmente requieren tipos de datos complejos. Los lenguajes de manipulación de datos tienen
como propósito ofrecer facilidad, simplicidad y flexibilidad a la hora de utilizarlos para actualizar
y recuperar información desde la base de datos. Los lenguajes de manipulación son, en su gran
mayoría, declarativos, lo que reduce significativamente el tiempo de desarrollo y mantenimiento
de las aplicaciones.

La teoría de la normalización se ha desarrollado para obtener estructuras de datos eficientes que


eviten las anomalías de actualización. La normalización es el proceso de simplificar la relación
entre los campos de un registro. Por medio de la normalización un conjunto de datos en un
registro se reemplaza por varios registros que son más simples y predecibles y, por lo tanto, más
manejables. La normalización se lleva a cabo por cuatro razones:

 Estructurar los datos de forma que se puedan representar las relaciones pertinentes entre
los datos.
 Permitir la recuperación sencilla de los datos en respuesta a las solicitudes de consultas y
reportes.

3
 Simplificar el mantenimiento de los datos actualizándolos, insertándolos y borrándolos.
 Reducir la necesidad de reestructurar o reorganizar los datos cuando surjan nuevas
aplicaciones.

La teoría de normalización tiene como fundamento el concepto de formas normales; se dice que
una relación está en una determinada forma normal si satisface un conjunto de restricciones.

 Primera Forma Normal (1FN).


 Segunda Forma Normal (2FN).
 Tercera Forma Normal (3FN).
 Forma Normal de Boyce-Codd (FNBC).
 Existen, además, la cuarta (4FN) y la quinta (5FN) formas normales.

4.1- Conceptos Básicos


La normalización de bases de datos es un proceso que consiste en designar y aplicar una
serie de reglas a las relaciones obtenidas tras el paso del modelo entidad-relación al modelo
relacional.
Las bases de datos relacionales se normalizan para:
 Evitar la redundancia de los datos.
 Disminuir problemas de actualización de los datos en las tablas.
 Proteger la integridad de datos.
En el modelo relacional es frecuente llamar tabla a una relación; para que una tabla sea
considerada como una relación tiene que cumplir con algunas restricciones:
 Cada tabla debe tener su nombre único.
 No puede haber dos filas iguales. No se permiten los duplicados.
 Todos los datos en una columna deben ser del mismo tipo
 Atributo = columna o campo
 Clave = llave o código de identificación
 Clave Candidata = superclave mínima
 Clave Primaria = clave candidata elegida
4
 Clave Externa = clave ajena o clave foránea
 Clave Alternativa = clave secundaria
 Dependencia Multivaluada = dependencia multivalor = dependencia múltiple
 RDBMS = Del inglés Relational Data Base Management System, que significa Sistema
de gestión de bases de datos relacionales.
 1FN = Significa Primera Forma Normal o 1NF, del inglés First Normal Form.
Los términos Relación, Tupla y Atributo derivan del álgebra y cálculo relacional, que constituyen
la fuente teórica del modelo de base de datos relacional.
Todo atributo en una tabla tiene un dominio, el cual representa el conjunto de valores que el
mismo puede tomar. Una instancia de una tabla puede verse entonces como un subconjunto del
producto cartesiano entre los dominios de los atributos. Sin embargo, suele haber algunas
diferencias con la analogía matemática, ya que algunos RDBMS permiten filas duplicadas, entre
otras cosas. Finalmente, una tupla puede razonarse matemáticamente como un elemento del
producto cartesiano entre los dominios.

La semántica de una relación hace referencia a la interpretación de los valores de un atributo en


una tupla.

Relación = conjunto de hechos En general, cuanto más sencillo es explicar la semántica de la


relación, mejor será el diseño del esquema de relación.

Uno de los objetivos de un esquema de diseño es reducir el espacio de almacenamiento utilizado


por las relaciones. El agrupamiento de atributos en esquemas de relación tiene un efecto
significativo sobre el espacio de almacenamiento.

En relaciones grandes, si muchos de los atributos no se aplican a todas las tuplas de la relación,
nos encontraremos con muchos NULL en esas tuplas, lo que puede desperdiciar espacio de
almacenamiento.

5
4.2-Primera Forma Normal
La primera forma normal, impone un requisito muy elemental a las relaciones; a
diferencia de las demás formas normales, no exige información adicional como las dependencias
funcionales. Un dominio es atómico si se considera que los elementos del dominio son unidades
indivisibles. Se dice que el esquema de una relación R está en la primera forma normal (1FN) si
los dominios de todos los atributos de R son atómicos.

Un conjunto de nombres es un ejemplo de valor no atómico. Por ejemplo, si el esquema de la


relación empleado incluyera el atributo hijos, los elementos de cuyo dominio son conjuntos de
nombres, el esquema no se hallaría en la primera forma normal.

Considérese una organización que asigna a los empleados números de identificación de la manera
siguiente: las dos primeras letras especifican el departamento y las cuatro cifras restantes son un
número único para el empleado dentro de ese departamento. Ejemplos de estos números pueden
ser IN0012 y EE1127. Estos números de identificación pueden dividirse en unidades menores y,
por tanto, no son atómicos. Si el esquema de una relación tuviera un atributo cuyo dominio
consistiera en números de identificación codificados como se ha indicado, el esquema no se
hallaría en la primera forma normal.

Se considera que una relación se encuentra en la primera forma normal cuando cumple lo
siguiente:

 Las celdas de las tablas poseen valores simples y no se permiten grupos ni arreglos
repetidos como valores, es decir, contienen un solo valor por cada celda.
 Todos los ingresos en cualquier columna (atributo) deben ser del mismo tipo.
 Cada columna debe tener un nombre único, el orden de las columnas en la tabla no es
importante.
 Dos filas o renglones de una misma tabla no deben ser idénticas, aunque el orden de las
filas no es importante.

6
Como esta relación
maneja valores
atómicos, es decir un
solo valor por cada
uno de los campos
que conforman a los atributos de las entidades, ya se encuentra en primera forma normal,
gráficamente así representamos a las relaciones en 1FN.

4.3-Dependencias Funcionales y transitivas


Las dependencias funcionales desempeñan un papel fundamental en la diferenciación
entre los buenos diseños de bases de datos y los malos. Una dependencia funcional es un tipo de
restricción que constituye una generalización del concepto de clave.

Las dependencias funcionales son restricciones del conjunto de relaciones legales. Permiten
expresar hechos sobre la empresa que se modela con la base de datos.

 Regla de la reflexividad: Si α es un conjunto de atributos y β ⊆ α, entonces se cumple que


α → β.
 Regla de la aumentatividad: Si se cumple que α → β y γ es un conjunto de atributos,
entonces se cumple que γα → γβ.
 Regla de la transitividad: Si se cumple que α → β y también se cumple que β → γ,
entonces se cumple que α → γ

Una dependencia funcional (DF) es una restricción que se establece entre dos conjuntos de
atributos de la base de datos. Definición: – Una dependencia funcional, denotada por X→Y, entre
dos conjuntos de atributos X e Y que son subconjuntos de R, especifica una restricción en las
posibles tuplas que pueden formar un estado de relación r de R. – La restricción dice que dos

7
tuplas t1 y t2 en r tales que cumplen que t1 [X] = t2 [X], deben cumplir también que t1[Y] =
t2[Y].

Por tanto: – X determina funcionalmente Y si para toda instancia r del esquema de relación R, no
es posible que r tenga dos tuplas que coincidan en los atributos de X y no lo hagan en los
atributos de Y. Observe lo siguiente: – Si X es una clave candidata de R, se cumple que X→Y
para cualquier subconjunto de atributos Y de R (la restricción de clave implica que dos tuplas en
cualquier estado legal r(R) no tendrán el mismo valor de X). – Si X→Y en R, esto no supone que
Y→X en R.

Una dependencia funcional es una propiedad de la semántica o significado de los atributos. Las
dependencias funcionales deben mantenerse en todos los estados de relación r de R. Los estados
de relación r(R) que satisfacen la restricción de DF reciben el nombre de estados de relación
legales.

Por tanto, el uso fundamental de las DFs es describir más en profundidad un esquema de relación
R especificando restricciones de sus atributos que siempre deben cumplirse. Ciertas DFs pueden
especificarse sin hacer referencia a una relación específica. Por ejemplo:

{Provincia, NumPermisoConducir} → Dni debe mantenerse para cualquier adulto que viva en
España.

{Dni, NumProyecto} → Horas Dni → NombreE

NumProyecto → {NombreProyecto,
UbicaciónProyecto}

4.4-segunda Forma Normal


Para definir formalmente la segunda forma normal requerimos saber que es una
dependencia funcional. DF: Consiste en identificar que atributos dependen de otro(s) atributo(s).

8
Una relación R está en 2FN si y solo si está en
1FN y los atributos no primos dependen
funcionalmente de la llave primaria. Una
relación se encuentra en segunda forma normal, cuando cumple con las reglas de la primera
forma normal y todos sus atributos que no son claves (llaves)
dependen por completo de la clave. De acuerdo con esta definición,
cada tabla que tiene un atributo único como clave, está en segunda
forma normal.

Entonces este segundo paso se aplica sólo con relación a llaves compuestas. Continuando con el
ejemplo de los Pedidos de productos, habíamos visto que en la relación PEDPROD subsistían
problemas de actualización. Analicemos las DF que existen en dicha relación:

Esta relación no está en 2FN, pues desc y prun no dependen funcional y completamente de la
llave (nuped, nuprod). La 2FN se hace:

1. Creando una relación para todos los atributos que dependen funcional y completamente
de la llave (y los atributos que no se analizan por ser atributos llaves, pertenecientes a
claves candidatas). PED-PROD (nuped, nuprod, cant, prprod)
2. Creando una relación para los atributos que dependan de cada parte (subconjunto) de la
llave. La llave de la relación así formada será la parte (subconjunto) de la llave primaria
de la cual dependen los atributos. PRODUCTO (nuprod, desc, prun)

Los problemas planteados en la 1FN se resuelven con la 2FN. Veamos:

 Creación: se puede insertar la información sobre un producto aunque no haya un pedido


que lo solicite.
 Supresión: se puede eliminar una línea de pedido y no se pierde la información sobre el
producto, aunque sea el único pedido que pide ese producto.
 Modificación: si cambia un atributo del producto, solo hay que cambiarlo en un lugar. Se
elimina redundancia.

Pero aún tenemos problemas en este caso, que son similares a los vistos, pero con la relación
PEDIDO y, específicamente, cuando se trata de insertar, eliminar o modificar la información de
proveedores: Creación: no podemos insertar la información de un proveedor, a menos que haya

9
un pedido para él. Supresión: se perderá la información sobre un proveedor al borrar un pedido
que era el único que se le hacía a ese proveedor. Modificación: para cambiar información sobre
un proveedor, hay que recorrer todos los pedidos de ese proveedor. Hay redundancia.

4.5-Tercera Forma Normal


La 3FN es una extensión de la 2FN. La 2FN elimina las dependencias funcionales
respecto a un subconjunto de la clave. La 3FN elimina la dependencia funcional entre atributos
no llaves.

La 3FN se hace:

1. Creando una relación para los atributos no llaves que no dependen transitivamente de la
llave primaria (y los atributos que no se analizan por ser atributos llaves, pertenecientes a
claves candidatas).
2. Creando una relación para los atributos no llaves que dependen transitivamente de la llave
primaria a través de otro atributo o conjunto de atributos no llave primaria (que no son
parte de la llave primaria.) La llave primaria de la relación así formada será el atributo o
conjunto de atributos a través de los cuales existe la dependencia transitiva.

Como ya se ha visto, hay esquemas relacionales en que la descomposición FNBC no puede


conservar las dependencias. Para estos esquemas hay dos alternativas si se desea comprobar si
una actualización viola alguna dependencia funcional:

 Soportar el coste extra del cálculo de las reuniones para buscar violaciones.
 Emplear una descomposición alternativa, la tercera forma normal (3FN), que se presenta a
continuación, que hace menos costoso el examen de las actualizaciones. A diferencia de
FNBC, las descomposiciones 3FN pueden contener cierta redundancia en el esquema
descompuesto.

FNBC exige que todas las dependencias no triviales sean de la forma α → β donde α es una
superclave. 3FN relaja ligeramente esta restricción permitiendo dependencias funcionales no
triviales cuya parte izquierda no sea una superclave.

10
Un esquema de relación R está en tercera forma normal (3FN) respecto a un conjunto F de
dependencias funcionales si, para todas las dependencias funcionales de F+ de la forma α → β,
donde α ⊆ R y β ⊆ R, se cumple al menos una de las siguientes condiciones:

 α → β es una dependencia funcional trivial.


 α es una superclave de R.
 Cada atributo A de β – α está contenido en alguna clave candidata de R.
La tercera condición no dice que una sola clave candidata deba contener todos los atributos de
α → β; cada atributo A de α → β puede estar contenido en una clave candidata diferente. Las dos
primeras alternativas son iguales que las dos alternativas de la definición de FNBC. La tercera
alternativa de la definición de 3FN parece bastante intuitiva, y no resulta evidente el motivo de su
utilidad. Representa, en cierto sentido, una relajación mínima de las condiciones de FNBC que
ayudan a asegurar que cada esquema tenga una descomposición que conserve las dependencias
en 3FN.

La definición de 3FN permite ciertas dependencias funcionales que no se permitían en FNBC.


Una dependencia α → β que sólo satisfaga la tercera alternativa de la definición de 3FN no se
permitiría en FNBC, pero sí se permite en 3FN1.

Comparación entre FNBC y 3FN: De las dos formas normales para los esquemas de las bases de
datos relacionales, 3FN y FNBC, hay ventajas en 3FN porque se sabe que siempre resulta posible
obtener un diseño en 3FN sin sacrificar la reunión sin pérdida o la conservación de las
dependencias.

4.6-Forma Normal Boyce-codd


Una de las formas normales más deseables que se pueden obtener es la forma normal de
Boyce-Codd (FNBC ). Un esquema de relación R está en FNBC respecto a un conjunto de
dependencias funcionales F si, para todas las dependencias funcionales de F+ de la forma α → β,
donde α ⊆ R y β ⊆ R, se cumple al menos una de las siguientes condiciones:

 α → β es una dependencia funcional trivial (es decir, β ⊆ α)


 α es una superclave del esquema R

11
Un diseño de base de datos está en FNBC si cada miembro del conjunto de esquemas de relación
que constituye el diseño está en FNBC. A modo de ejemplo, considérense los siguientes
esquemas de relación y sus respectivas dependencias funcionales:

Puede afirmarse que Esquema-cliente está en FNBC.


Obsérvese que una clave candidata para el esquema es
nombre-cliente. Las únicas dependencias funcionales
no triviales que se cumplen en Esquema-cliente tienen
a nombre-cliente a la izquierda de la flecha. Dado que
nombre-cliente es una clave candidata, las
dependencias funcionales con nombre-cliente en la parte izquierda no violan la definición de
FNBC. De manera parecida, se puede demostrar fácilmente que el esquema de relación Esquema-
sucursal está en FNBC. El esquema Esquema-info-préstamo, sin embargo, no está en FNBC. En
primer lugar, obsérvese que número-préstamo no es una superclave de Esquema-infopréstamo, ya
que puede que haya un par de tuplas que representen a un solo préstamo concedido a dos
personas, por ejemplo, (Centro, Sr. Pinilla, P-44, 1.000) (Centro, Sra. Pinilla, P-44, 1.000). Como
no se ha relacionado ninguna dependencia funcional que descarte el caso anterior, número-
préstamo no es una clave candidata. Sin embargo, la dependencia funcional número-préstamo →
importe es de tipo no trivial. Por lo tanto, Esquema-info-préstamo no satisface la definición de
FNBC.

No todas las descomposiciones FNBC conservan las dependencias. A modo de ejemplo,


considérese el esquema de relación:

Esquema-asesor = (nombre-sucursal, nombre-cliente, nombre-asesor)

Que indica que el cliente tiene un «asesor personal» en una sucursal determinada. El conjunto F
de dependencias funcionales que se exige que se cumpla en

Esquema-asesor es nombre-asesor → nombre-sucursal

nombre-sucursal nombre-cliente → nombre-asesor

Evidentemente, Esquema-asesor no está en FNBC, ya que nombre-asesor no es una superclave.

12
4.7-Otras Formas Normales
Cuarta Forma Normal:

No parece que algunos esquemas de relación, aunque se hallen en FNBC, estén lo bastante
normalizados, en el sentido de que siguen sufriendo el problema de la repetición de la
información.

Esta forma normal, denominada cuarta forma normal (4FN), es más restrictiva que FNBC. Se
verá que cada esquema 4FN se halla también en FNBC, pero que hay esquemas FNBC que no se
hallan en 4FN.

Las dependencias funcionales impiden que ciertas tuplas estén en una relación. Si A → B,
entonces no puede haber dos tuplas con el mismo valor de A y diferentes valores de B. Las
dependencias multivaloradas, por otro lado, no impiden la existencia de esas tuplas.

Por este motivo, las dependencias funcionales se denominan a veces dependencias de generación
de igualdad y las dependencias multivaloradas se conocen como dependencias de generación de
tuplas. Sea R un esquema de relación y sean α ⊆ R y β ⊆ R. La dependencia multivalorada
α →→ β.

Se cumple en R si, en toda relación legal r(R), para todo par de tuplas t1 y t2 de r tales que t1[α]
= t2[α], existen unas tuplas t3 y t4 de r tal es que:

t1 [α] = t2 [α] = t3 [α] = t4 [α]


t3 [β] = t1 [β]
t3 [R – β] = t2 [R – β]
t4 [β] = t2 [β]
t4 [R – β] = t1 [R – β]
Al igual que con las dependencias funcionales, las dependencias multivaloradas se utilizan de dos
maneras:

1. Para verificar las relaciones y determinar si son legales bajo un conjunto dado de
dependencias funcionales y multivaloradas.

13
2. Para especificar restricciones del conjunto de relaciones legales; de este modo, sólo habrá
que preocuparse de las relaciones que satisfagan un conjunto dado de dependencias
funcionales y multivaloradas.

Las dependencias multivaloradas ayudan a comprender y a abordar algunas formas de repetición


de la información que no pueden comprenderse en términos de las dependencias funcionales

Quinta Forma Normal:

Es un nivel de normalización de bases de datos diseñado para reducir redundancia en las bases
de datos relacionales que guardan hechos multi-valores aislando semánticamente relaciones
múltiples relacionadas.

En esencia, esto significa que las únicas descomposiciones válidas son aquellas que involucran
claves candidatas. Las dependencias de combinación se relacionan con dependencias
multivaluadas, pero pueden ser muy difíciles de identificar porque son sutiles. Si un diseño
consiste en relaciones que son todas 5FN, están en su forma útil más simple de modo que no hay
nada a ganar al descomponerlas aún más, pues esto resultaría en una pérdida de información. Por
desgracia, no hay una prueba simple para 5FN. Se cree que las dependencias de combinación son
relativamente raras, de modo que los diseñadores con frecuencia detienen el proceso de
normalización en 4FN, FNBC o 3FN (para preservar dependencias funcionales).

14
Conclusión
La normalización de bases de datos es una herramienta utilizada para que palabras
innecesarias ya no se vuelvan a ocupar frecuentemente. Algo que descubrí que cada forma
normal se va haciendo más inútil cuando ocupas una más allá de ella por ejemplo sería mejor usar
la tercera forma que usar la primera de lleno. Cada forma normal utiliza a su antecesor en forma
de cadena hasta reducir errores.

15
Bibliografía

Silverschatz, A., & Kort, Henry. (2002). Fundamentos De Bases De Datos.


Aravaca(Madrid): McGRAW-HILL.
Zamora, Els.,. (diciembre, 2017). Ingeniería y Tecnología. Madrid: 3Ciencias.
Abad, R., Medina, M., Careaga, A. (1993). Fundamentos de las estructuras de datos
relacionales. Grupo Noriega Editores, Limusa. México.
Silberschatz, H. F. Korth y S. Sudarshan, Fundamentos de Bases de Datos, España:
MacGraw Hill, 2002. Camuña, J., (2014). Lenguaje de definición y modificación
de datos SQL [Versión
electrónica]. (1ra. ed.). IC Editorial, Málaga. C. J. Date, Introducción a los Sistemas
de Bases de Datos, México: Pearson Educación, 2001

16

También podría gustarte