3.3.2-Práctica de Normalización y SQL
3.3.2-Práctica de Normalización y SQL
3.3.2-Práctica de Normalización y SQL
Normalización
y SQL
Base de Datos I
1
Práctica de Normalización y
SQL.
Introducción
Tomaremos el caso de los estudiantes, las carreras en las que se anota, las materias
en las que se inscribe y sus exámenes. Estos temas conocidos por todos nos
ayudarán a aplicar lo estudiado para lograr una primer experiencia que consolide
lo aprendido.
Es muy importante destacar que la tarea de construir un modelo de datos para que
el sistema que lo use cumpla con todos los requerimientos del usuario, requiere un
proceso de relevamiento, de raciocinio y comunicación de parte del Analista, para
lo cual éste debe usar una metodología para recopilar datos y expresar con la mayor
claridad posible al usuario final, para que este pueda entender lo que la aplicación
está previsto atender y poder tener una noción de lo que no va a cubrir el sistema.
Sobre este punto existen metodologías probadas como Rational Unified Process
(RUP) que está orientada a aplicaciones de gran porte, que abarcan la totalidad de
una empresa, con múltiples actores y otras mas acotadas, para proyectos de menor
envergadura, llamadas metodologías Ágiles, destacamos en éstas a SCRUM y a
Extreme Programming (XP). Cada una de éstas necesitaría para su tratamiento
respectivas materias de una carrera relacionada. Este trabajo que presentamos en
esta actividad es un proceso real que se cumple durante el Análisis y del Diseño de
Sistemas y solamente se dedica a las estructuras de datos no se ocupa de cómo son
los procesos o funciones de negocios.
“En una universidad se deben organizar las tablas para poder almacenar la
información de estudiantes, inscripciones, exámenes, materias, profesores.
2
Además se debe registrar las carreras que se dictan en esta casa de estudios,
debiendo registrar el nombre, los títulos que otorga, (al menos dos, pero pueden ser
mas), una carrera puede tener varios planes y estos planes se relacionan con
diversas materias.
Por ahora se necesitará registrar qué estudiante está inscripto en cada carrera, en
que fecha lo hizo, la fecha de baja y las razones de la misma.”
Para iniciar buscaremos las entidades, los atributos y las relaciones. Para detectar
las Entidades nos fijaremos en los sustantivos:
“En una universidad se deben organizar las tablas para poder almacenar la
información de estudiantes, inscripciones, exámenes, materias, profesores.
Además se debe registrar las carreras que se dictan en esta casa de estudios,
debiendo registrar el nombre, los títulos que otorga, (al menos dos, pero pueden ser
mas), una carrera puede tener varios planes y estos planes se relacionan con
diversas materias.
Por ahora se necesitará registrar qué estudiante está inscripto en cada carrera, en
que fecha lo hizo, la fecha de baja y las razones de la misma.”
Luego hacemos una lista con los atributos que nos parece que describen a cada
entidad y tratamos de definir las claves candidatas.
“En una universidad se deben organizar las tablas para poder almacenar la
información de estudiantes, inscripciones, exámenes, materias, profesores.
3
Los estudiantes tienen apellido, nombre, tipo y numero de documento, es necesario
conocer la edad, el sexo, en que colegio finalizó el secundario y la localidad del
colegio, que puede ser distinta del estudiante, su talla, peso, la fecha del ingreso,
su teléfono móvil, mas uno fijo y otros teléfonos que puedan servir para
comunicarse, su domicilio familiar y el que tiene en córdoba, el promedio obtenido
en su colegio de origen. Debe conocerse si existe un vínculo familiar con otro
estudiante, cónyuge, hijo, padre, madre y hermano, limitando esta relación
solamente a éstos vínculos.
Además se debe registrar las carreras que se dictan en esta casa de estudios,
debiendo registrar el nombre, los títulos que otorga, (al menos dos, pero pueden ser
mas), una carrera puede tener varios planes y estos planes se relacionan con
diversas materias. Los planes tienen un nombre y fecha desde y hasta para indicar
su vigencia
Por ahora se necesitará registrar qué estudiante está inscripto en cada carrera, en
que fecha lo hizo, la fecha de baja y las razones de la misma.”
Este cuadro resume las entidades que podemos incluir en un primer momento. Este
proceso va a ir refinando y creando o eliminando entidades y atributos, a medida
que se realice el análisis adecuado.
4
Sobre las relaciones al buscar los verbos, encontramos que:
Para continuar debiéramos revisar si están todas las entidades y si todas las que
tenemos, son las adecuadas.
Observemos que la Universidad es una entidad que surge del máximo nivel de
jerarquía, ya que carrera, estudiante, sede tienen relación con ellas. Pero
imaginando cuantas tuplas o filas en esta tabla puede tener para este pequeño
modelos de datos, podríamos asumir que aún no se necesita una entidad por que
estamos dentro de un contexto interno de la misma y esto puede definirse como
obvio y no considerar aún la entidad de Universidad, dejando para un futuro el
desarrollo de una entidad o varias para que den paso a una o varias tablas que
contenga los datos impositivos de la Universidad, como el cuit que nos ayudaría a
identificar las operaciones en otro sistema contable y ser usado por los sistemas
para imprimir listados, formularios con la información grabada en las tablas y no
deban ser escritos dentro del código de los programas listadotes. Por lo tanto
descartaremos la entidad Universidad y no incluiremos en el estudio las relaciones
8, 9 y 10.
Sobre la entidad Vínculo y Materia, tienen hasta ahora un solo atributo lo que nos
hace sospechar si pueden mantenerse como entidades o se pueden transformar en
5
atributos de las entidades más importantes. Veremos en los próximos pasos que
pasará con ellas. Una alternativa es dejarlas pendientes y en próximas entrevistas
revisar si hay atributos no nombrados para aceptar su participación o limitarla
como atributo en las entidades conocidas o descartarlas completamente.
Definidas cuáles son las claves candidatas, debemos analizar cuales pueden ser las
claves primarias de cada entidad.
Se deberán elegir aquellas claves candidatas con menor cantidad de atributos y que
no tengan nulos, por la Regla de Integridad de Entidades. Por ejemplo, en la entidad
Estudiante, hay dos claves candidatas, TIPO DOC y NRO DOC en conjunto y TEL.
CELULAR, pero como no es obligatorio, aunque muy difundido, tener un Teléfono
Celular, al encontrarnos que un estudiante puede no tener este número, se tendría
que poner un NULO para el atributo TEL. CELU, y esto está prohibido por la Regla
mencionada anteriormente, por lo tanto TEL. CELU debe ser descartada como Clave
primaria. Con TIPO y NRO DOC, el caso es que al ser compuesta, es habitual que los
Analistas definan una Clave Artificial como Clave Primaria, eligiendo un solo
6
atributo, numérico y lo que permite simplificar la identificación, este tipo de claves
son compactos no son modificables con el tiempo, y en entidades que son muy
importantes en un modelo y son referenciadas por numerosas entidades, es un
factor de peso que se elija una clave primaria simple, es decir que este resuelta en
una sola columna. Este tema de diseño de agregar claves artificiales esta
relacionado con el problema de diseño, “Dispersión de Claves primarias complejas
o compuestas”.
En la entidad sede, la clave candidata es alfanumérica, lo que hace que influyan las
mayúsculas y minúsculas, por lo tanto se recurre a otra clave artificial, en este caso
la llamamos ID_SEDE. Lo mismo para el colegio, nombre es un atributo que puede
repetir valores, (cuantos colegios hay llamados ‘Sarmiento’ o similares) por lo tanto
asignaremos una clave artificial. En Carrera y en Plan consideramos con el mismo
criterio anterior que las mayúsculas y minúsculas y hacer repetir carreras con el
mismo nombre, diferenciados sólo por esto, por lo que le asignaremos ID_CARRERA
e ID_PLAN respectivamente
7
Promedio
Tel. celu
Sexo
Tel. fijo
Tel. otro
Domicilio1
Domicilio2
Una vez definidas las claves primarias, para iniciar el uso de la normalización sobre
estas entidades tomaremos la de estudiante.
La primera forma normal indica que debe existir la clave primaria y que no debe
haber campos repetitivos.
Estudiante telefonoEstudiante
LEGAJO CP Legajo CP y CF
Nombre Número CP
Apellido Tipo
FechaNac
Tipo doc
Nro doc
Sexo
8
Promedio
Domicilioestudiante
Domiciliofamiliar
telefonoEstudiante
telefonoEstudiante
Cuadro 5. La identificación de la entidad con dos columnas permite más de una fila por
estudiante
9
En la revisión de las siguientes entidades, encontramos también en la entidad
Carrera la situación de atributos repetidos, operamos en el mismo sentido y
obtenemos así el cuadro con las entidades en primera forma normal.
Cuadro 6 – Modelo en Primera Forma Normal 1FN en rojo las claves primarias
10
Figura 1. Cargando la entidad Estudiante
11
Figura 2. El mapa de entidades en la herramienta
12
Es decir como mínimo a Una carrera y como máximo, es entonces mas de uno o
como generalización, “Muchos”. Esto hace una relación uno a muchos, simbolizada
como 1:M en esta parte de la relación.
En la herramienta bastó con elegir la relación N:M y elegir las entidades a relacionar
para que cree automáticamente la tercer entidad con las claves primarias. Como
vemos en la figura 3, usando MySQL Workbench.
13
Figura 3 – con la herramienta hemos elegido relacionar “n:m” o “muchos a muchos” dos
entidades y se crea la entidad asociativa
14
Figura 4 Creación de una relación 1:n con la clave foránea del lado “Muchos”
15
posibles, aplicando las tres formas normales ya que todos los atributos no clave
dependen de toda la clave y de nada mas que de la clave primaria.
“Debe conocerse si existe un vínculo familiar con otro estudiante, cónyuge, hijo,
padre, madre y hermano, limitando esta relación solamente a éstos vínculos”.
Al ser una relación de estudiante con estudiante y muchos a muchos, por que un
estudiante puede tener varios parientes y un pariente puede ser de varios
estudiantes, esto crea una nueva tabla llamada parentezcoXestudiante que no
mostramos por cuestiones de espacio. Pero lo animamos a resolverla y consultar
con su tutor.
Con la ayuda de Workbench generaremos las sentencias SQL capaces de crear las
tablas:
16
Inicia con unos seteos para MySQL, que han sido generados automáticamente:
SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS,
FOREIGN_KEY_CHECKS=0;
COLLATE latin1_swedish_ci ;
USE `muestro_BD1`;
-- -----------------------------------------------------
-- Table `muestro_BD1`.`colegio`
-- -----------------------------------------------------
ENGINE = InnoDB;
-- -----------------------------------------------------
-- Table `muestro_BD1`.`estudiante`
17
-- -----------------------------------------------------
CONSTRAINT `fk_estudiante_colegio1`
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB
-- -----------------------------------------------------
-- Table `muestro_BD1`.`telefonoEstudiante`
-- -----------------------------------------------------
18
`estudiante_legajo` INT NOT NULL ,
CONSTRAINT `fk_telefonoEstudiante_estudiante1`
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB;
-- -----------------------------------------------------
-- Table `muestro_BD1`.`sede`
-- -----------------------------------------------------
ENGINE = InnoDB;
-- -----------------------------------------------------
19
-- Table `muestro_BD1`.`carrera`
-- -----------------------------------------------------
ENGINE = InnoDB;
-- -----------------------------------------------------
-- Table `muestro_BD1`.`plan`
-- -----------------------------------------------------
CONSTRAINT `fk_plan_carrera1`
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB;
-- -----------------------------------------------------
20
-- Table `muestro_BD1`.`tituloCarrera`
-- -----------------------------------------------------
CONSTRAINT `fk_tituloCarrera_carrera1`
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB;
-- -----------------------------------------------------
-- Table `muestro_BD1`.`materia`
-- -----------------------------------------------------
ENGINE = InnoDB;
-- -----------------------------------------------------
-- Table `muestro_BD1`.`estudianteXcarrera`
-- -----------------------------------------------------
21
CREATE TABLE IF NOT EXISTS `muestro_BD1`.`estudianteXcarrera` (
CONSTRAINT `fk_estudiante_has_carrera_estudiante`
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `fk_estudiante_has_carrera_carrera1`
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB;
-- -----------------------------------------------------
-- Table `muestro_BD1`.`carreraXsede`
-- -----------------------------------------------------
22
`fecha_inicio` TIMESTAMP NOT NULL ,
CONSTRAINT `fk_carrera_has_sede_carrera1`
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `fk_carrera_has_sede_sede1`
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB;
-- -----------------------------------------------------
-- Table `muestro_BD1`.`materiaXplan`
-- -----------------------------------------------------
CONSTRAINT `fk_materia_has_plan_materia1`
23
FOREIGN KEY (`materia_idmateria` )
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `fk_materia_has_plan_plan1`
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB;
Puesta de los seteos en la forma anterior para que no quede alterada la conexión.
SET SQL_MODE=@OLD_SQL_MODE;
SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS;
SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS;
Inserción de filas
Una vez creada las tablas, con la opción de Workbench, referidas a las Bases de
Datos, llamada Forward Engineering to Database, se ejecuta el script generado
automáticamente transcripto en las paginas anteriores y encontramos con SQL
BROWSER, la herramienta usada para ejecutar las sentencias SQL de capítulos
anteriores. Lo vemos en la figura 6.
24
Figura 6 – Las 11 tablas analizadas y definidas en los pasos anteriores ya están construidas en la
Base de datos, listas para recibir filas.
Las sentencias Insert que permiten grabar filas en las tablas, al haber restricciones
o constraints referenciales activas deben ejecutarse en orden, respetando que
primero se cargan las filas de las tablas referenciadas, estas son Colegio, Estudiante,
Carrera, Materia, Sede. Nuevamente usando Workbench, al hacer click con el botón
derecho se genera una sentencia Insert para realizar el trabajo. Ver cuadro 7 y 8
25
INSERT INTO `sede` (`idsede`, `Nombre`, `domicilio`, `localidad`, `propio`, `fecha de
inicio`, `nombre responsable`) VALUES ( , , , , , ,);
26
INSERT INTO `estudiante` (`legajo`, `Apellido`, `Nombre`, `fecha nacimiento`, `tipo
documento`,
`nro documento`, `sexo`, `promedio`, `domicilioEstudiante`, `domicilioFamiliar`,
`colegio_idcolegio`) VALUES ( 5,’Alemany’ , ‘Sofia’, ‘92/03/09 00:00:00’, ‘DNI’,
30035566 , ’F’ , 6.60 , ‘calle 1 nro 1’, null, 2);
Para las otras tablas cargamos las filas, en archivo aparte quedan las sentencias
correspondientes a los Inserts.
Consultas simples
1) Mostrar los datos de las Tablas Estudiantes y Carreras, ver figura 7 con el
resultado de la primera sentencia, haga Ud. mismo la otra consulta.
Figura 7. Consulta de todas las filas de la tabla estudiante, (para la imagen expuesta se editó el
ancho de todas las columnas)
2) Mostrar la cantidad de créditos de las materias y las horas reloj de cada una
de ellas considerando que los créditos son las horas semanales de dictado y
que existen 16 semanas efectivas de clases en un semestre. Se usa el alias de
columna “horas” Ver figura 8.
27
Figura 8 – Resultado de la consulta simple con cálculos en el select
2) aplicar condiciones para que solo se muestren las filas que las cumplan, por
ejemplo, sólo las filas que tienen más de 100 horas.
Consultas complejas
28
columna se debe aplicar el operador de comparación con nulos, ‘not null’.
En la figura 10 la consulta sin la restricción de los planes actuales y en la
figura 11 la consulta completa y el resultado
Hemos realizado una consulta que reunió a varias tablas ahora agregaremos
funciones de grupo para alcanzar mayor complejidad.
29
2) Mostrar las carreras y planes vigentes junto con la cantidad de horas que
requieren para su cursado. Ver figura 12 para la solución.
Figura 12 – Consulta de los planes de todas las carreras, pero sólo el vigente, acumulando las
horas de todas sus materias. Notar la pregunta por valores nulos.
Hasta aquí llegamos con la lectura presente que buscó guiarlos en la aplicación de
todo lo aprendido en un caso real y que esperamos haya contribuido a completar
el aprendizaje logrado para alcanzar así los objetivos de la materia.
30