Conception de Bases de Donnes
Conception de Bases de Donnes
Conception de Bases de Donnes
Une base de données est un ensemble structuré d'informations non redondantes dont
l'organisation est régie par un modèle de données.
Les deux mots clefs qui interviennent dans la définition d'une base de données sont :
structuration (à l'aide du modèle de données) et non répétition (non redondance ou
redondance minimale) des données.
Construire une base de données consiste à regrouper les données en paquets "homogènes",
les (entités, tables), chaque entité (table) étant composée d'un nombre fini de données
élémentaires, les Attributs ou Champs, la répétition (redondance) des attributs devant
être minimale. Le modèle de données utilisée dans cette présentation est le modèle
"entités-associations".
Un SGBD est un logiciel qui joue le rôle d'interface entre les utilisateurs et la Base de
Données.
Un SGBD permet de décrire, manipuler et interroger les données d'une Base de Données.
Il est chargé de tous les problèmes liés aux accès concurrents, à la sauvegarde et la
restauration des données. Il doit de plus veiller au contrôle, à l'intégrité et la sécurité des
données.
Une erreur, fréquemment commise par les utilisateurs débutants, consiste à confondre une
base de données avec un tableur. Les tables d'une base de données se présentent
effectivement en lignes et colonnes, comme dans un tableur, mais la comparaison s'arrête
là et les différences entre les deux approches sont importantes et nombreuses. Le tableau
suivant, résume les principales différences entre une base de données et un tableur.
1
- Une table - Plusieurs tables
Taille des données - Quelques dizaines de - Plusieurs milliers de
lignes lignes par table
Traitement sur les Qualitatifs et
Quantitatifs
données quantitatifs
Interrogations des Réalisée par des Langage "universel" :
données procédures spécifiques SQL
2
Conception de Bases de données : étape 1
La première étape, dans la construction d'une base de données, consiste à réunir tous les
documents représentatifs des données que l'on souhaite modéliser.
Le terme "documents" doit être ici pris dans un sens large. Il peut s'agir en effet soit de
documents papier, soit de documents magnétiques (enregistrement d'entretiens, disque ou
disquette informatique)... soit de tout autre support utilisable pour conserver des
informations.
Documents de travail
Pour illustrer les différentes étapes de conception d'une base de données nous utiliserons,
comme exemple type, la gestion d'étudiants qui suivent les différents enseignements d'un
diplôme.
Relevé de notes
N° étudiant : 1 Dupont, Charles
N° matière Nom Coefficient Note / 20
1 Mathématiques 3 10
2 Informatique 2 9
3 Sociologie 2 12,5
4 Histoire 1 13
5 Géographie 1 7
Moyenne Générale 10,3
3
Liste des enseignants
N°
Nom Grade Ancienneté Matière enseignée
enseignant
10 Bertrand, Pierre ASS 2 Sociologie
11 Dupont, Auguste MCF 3 Mathématiques
... ... ... ... ...
Histoire
15 Simon, Etienne ASS 5
Géographie
Règles de gestion :
La réunion de l'ensemble des données élémentaires, que l'on appelle des attributs ou des
champs, constitue le dictionnaire des données. Chaque attribut (champ) du dictionnaire de
données peut être caractérisé par les propriétés suivantes :
Propriété Signification
Mnémonique Abréviation du nom de l'attribut.
Libellé contenant la signification précise
Libellé
et le rôle de l'attribut.
Type de l'attribut : entier, réel, chaîne de
Type de donnée
caractères, date...
Contraintes Liste des contraintes sur les valeurs
d'intégrité possibles de l'attribut
Règle de calcul (d'obtention) de l'attribut
Règle de calcul
correspondant.
4
Contrainte
Mnémonique Libellé Type Règle de calcul
s
Ancienne
Ancien té dans le Entier >=0
grade
Code
Cdsexe Chaîne(1) H ou F
sexe
Coefficie
Coeff nt de la Entier >0 et <6
matière
Date de
Dtnaiss Date
naissance
Grade de ASS ou
Grade l'enseign Chaîne(3) MCF ou
ant PR
Libellé Homme ou
Lbsexe Chaîne(7)
du sexe Femme
Moyenne SUM(
>=0 et
Moyenne au Réel Note*Coeff)/SUM(Coef
<=20
diplôme f)
Nom de
Chaîne(15
Nomat la
)
matière
Nom de
Chaîne(20
Nomens l'enseign
)
ant
Nom de Chaîne(20
Nometu
l'étudiant )
Note
obtenue >=0 et
Note Réel
à la <=20
matière
N° de la
Numat Entier >0
matière
N° de
Numens l'enseign Entier >0
ant
N° de
Numetu Entier >0
l'étudiant
5
Conception de Bases de données : étape 2
On dira qu'un ensemble d'attributs est homogène si tous les attributs qui le compose ont un
lien "direct".
La redondance à l'intérieur d'un ensemble doit être minimale car la redondance est source
d'incohérence. En effet, si la même information est répétée plusieurs fois, cela signifie :
Qu'elle devra être saisie plusieurs fois, ce qui multiplie les risques d'erreurs de frappe.
Que lorsqu'elle devra être mise à jour, les modifications devront intervenir à plusieurs
endroits d'où des risques de mise à jour partielle.
On dit qu'il existe une dépendance fonctionnelle entre un attribut A1 et un attribut A2, on
note A1 -> A2, si connaissant une valeur de A1 on ne peut lui associer qu'une seule
valeur de A2. On dit aussi que A1 détermine A2. A1 est la source de la dépendance
fonctionnelle et A2 le but.
Exemple de DF
En effet, connaissant un numéro d'étudiant on peut connaître les notes qu'il a obtenu dans
chaque matière. La connaissance du numéro d'étudiant ne permet donc pas de connaitre
une note particulière et il n'y a donc pas de DF.
DF simple :
On dira qu'une DF est simple si sa source n'est composée que d'un seul attribut.
Une DF simple caractérise une entité (table) dont la source est la clé et dont les propriétés
6
sont constituées par le but de la DF.
DF composée :
On dira qu'une DF est composée si sa source est composée par la réunion de plusieurs
attributs.
Une DF composée caractérise une association entre entités (tables) dont la source est la
clé et dont les propriétés sont constituées par le but de la DF. Il ne doit pas y avoir
d'attributs superflus dans la source d'une DF composée. Par exemple si nous avons les 2
DF composées :
DF Entités
A1 -> A2, A3, A4 ENTITE1 (A1, A2, A3, A4)
A3 -> A4 ENTITE2 (A3, A4)
A1, A5 -> A6 ASSOC1 (A1, A5, A6)
A1 -> A2, A3
A3 -> A4
A1, A5 -> A6
7
D'où la règle :
Prise en compte des attributs non classés dans l'étape 1 et détermination des DF
composées
L'application de cette démarche à notre exemple nous donne les résultats suivants :
L'attribut "note" n'a pas été classé dans l'étape précédente, il intervient donc dans une DF
composée. Cette DF est la suivante :
8
5-Construction des associations
La dernière étape consiste à mettre en relation les entités et associations trouvées dans
l'étape précédente afin de construire la structure générale des données : le schéma des
données.
Les entités sont mise en relation par l'intermédiaire des attributs qu'elles possèdent en
commun. Les types de relations autorisées pour relier deux entités (associations)
appartiennent aux deux catégories suivantes :
Pour déterminer les relations entre entités (associations), il faut donc examiner le cardinal
de chacune des entités qui interviennent dans la relation.
Si l'on examine la première ligne du tableau, nous avons précisé que la relation entre
SEXE et ETUDIANT était de type 1-n.
En effet, dans l'entité SEXE, une valeur particulière de l'attribut Cdsexe (H ou F) ne sera
présente qu'une seule fois(1). En revanche, dans l'entité ETUDIANT, la même valeur de
l'attribut Cdsexe pourra être présente plusieurs fois(n), autant de fois qu'il y a d'étudiants
de ce sexe.
Pour avoir une vision synthétique de la structure de la base de données (le schéma des
données) on utilise une représentation graphique du type suivant :
9
Cette représentation est le schéma de la base de données "ETUDIANTS". C'est la
structure de représentation optimale des données de notre problème : Cohérence
maximale et redondance minimale.
10