Conception de Bases de Donnes

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 10

Conception de Bases de données

Notion de Base de Données

Une base de données est un ensemble structuré d'informations non redondantes dont
l'organisation est régie par un modèle de données.

Les deux mots clefs qui interviennent dans la définition d'une base de données sont :
structuration (à l'aide du modèle de données) et non répétition (non redondance ou
redondance minimale) des données.
Construire une base de données consiste à regrouper les données en paquets "homogènes",
les (entités, tables), chaque entité (table) étant composée d'un nombre fini de données
élémentaires, les Attributs ou Champs, la répétition (redondance) des attributs devant
être minimale. Le modèle de données utilisée dans cette présentation est le modèle
"entités-associations".

Système de Gestion de Base de Données (SGBD)

Un SGBD est un logiciel qui joue le rôle d'interface entre les utilisateurs et la Base de
Données.

Un SGBD permet de décrire, manipuler et interroger les données d'une Base de Données.
Il est chargé de tous les problèmes liés aux accès concurrents, à la sauvegarde et la
restauration des données. Il doit de plus veiller au contrôle, à l'intégrité et la sécurité des
données.

Base de données et tableur

Une erreur, fréquemment commise par les utilisateurs débutants, consiste à confondre une
base de données avec un tableur. Les tables d'une base de données se présentent
effectivement en lignes et colonnes, comme dans un tableur, mais la comparaison s'arrête
là et les différences entre les deux approches sont importantes et nombreuses. Le tableau
suivant, résume les principales différences entre une base de données et un tableur.

Différences sur... Tableur Base de données


Gestion et traitement
Utilisation principale Calculs
des données
Structuration des Structuration et
Aucune
données cohérence forte
Vérification stricte des
Contrôles d'intégrité
Aucuns valeurs possibles de
des données
chaque donnée
Accès aux données Mono utilisateur Multi utilisateurs
Vérification des droits
Confidentialité des
Aucun contrôle d'accès de chaque
données
utilisateur

1
- Une table - Plusieurs tables
Taille des données - Quelques dizaines de - Plusieurs milliers de
lignes lignes par table
Traitement sur les Qualitatifs et
Quantitatifs
données quantitatifs
Interrogations des Réalisée par des Langage "universel" :
données procédures spécifiques SQL

La conception de Bases de Données

La conception d'une Base de Données, implique 3 étapes fondamentales :

Analyse des documents : construction du dictionnaire des données.

Structuration du dictionnaire des données : détermination des entités et associations.

Mise en relation des entités : Schéma des données.

2
Conception de Bases de données : étape 1

Analyse des documents

La première étape, dans la construction d'une base de données, consiste à réunir tous les
documents représentatifs des données que l'on souhaite modéliser.
Le terme "documents" doit être ici pris dans un sens large. Il peut s'agir en effet soit de
documents papier, soit de documents magnétiques (enregistrement d'entretiens, disque ou
disquette informatique)... soit de tout autre support utilisable pour conserver des
informations.

Documents de travail

Pour illustrer les différentes étapes de conception d'une base de données nous utiliserons,
comme exemple type, la gestion d'étudiants qui suivent les différents enseignements d'un
diplôme.

Les documents de travail utilisés sont les suivants :

Liste des étudiants



Nom de l'étudiant Date de naissance Sexe
étudiant
H
1 Dupont, Charles 18-03-1981
(Homme)
H
2 Dubois, Jules 02-11-1982
(Homme)
F
3 Favier, Isabelle 02-02-1979
(Femme)
... ... ... ...

Relevé de notes
N° étudiant : 1 Dupont, Charles
N° matière Nom Coefficient Note / 20
1 Mathématiques 3 10
2 Informatique 2 9
3 Sociologie 2 12,5
4 Histoire 1 13
5 Géographie 1 7
Moyenne Générale 10,3

3
Liste des enseignants

Nom Grade Ancienneté Matière enseignée
enseignant
10 Bertrand, Pierre ASS 2 Sociologie
11 Dupont, Auguste MCF 3 Mathématiques
... ... ... ... ...
Histoire
15 Simon, Etienne ASS 5
Géographie

Règles de gestion :

- Une matière n'est enseignée que par un seul enseignant.


- Un étudiant n'a qu'une note par matière.

Dictionnaire des données

Partant des documents, la phase d'analyse consiste à en extraire les informations


élémentaires (non décomposables) qui vont constituer la future base de données.

La réunion de l'ensemble des données élémentaires, que l'on appelle des attributs ou des
champs, constitue le dictionnaire des données. Chaque attribut (champ) du dictionnaire de
données peut être caractérisé par les propriétés suivantes :

Propriété Signification
Mnémonique Abréviation du nom de l'attribut.
Libellé contenant la signification précise
Libellé
et le rôle de l'attribut.
Type de l'attribut : entier, réel, chaîne de
Type de donnée
caractères, date...
Contraintes Liste des contraintes sur les valeurs
d'intégrité possibles de l'attribut
Règle de calcul (d'obtention) de l'attribut
Règle de calcul
correspondant.

Le dictionnaire des données relatif aux documents précédents est le suivant :

4
Contrainte
Mnémonique Libellé Type Règle de calcul
s
Ancienne
Ancien té dans le Entier >=0
grade
Code
Cdsexe Chaîne(1) H ou F
sexe
Coefficie
Coeff nt de la Entier >0 et <6
matière
Date de
Dtnaiss Date
naissance
Grade de ASS ou
Grade l'enseign Chaîne(3) MCF ou
ant PR
Libellé Homme ou
Lbsexe Chaîne(7)
du sexe Femme
Moyenne SUM(
>=0 et
Moyenne au Réel Note*Coeff)/SUM(Coef
<=20
diplôme f)
Nom de
Chaîne(15
Nomat la
)
matière
Nom de
Chaîne(20
Nomens l'enseign
)
ant
Nom de Chaîne(20
Nometu
l'étudiant )
Note
obtenue >=0 et
Note Réel
à la <=20
matière
N° de la
Numat Entier >0
matière
N° de
Numens l'enseign Entier >0
ant
N° de
Numetu Entier >0
l'étudiant

5
Conception de Bases de données : étape 2

Structuration des données

Les informations contenues dans le dictionnaire de données doivent être structurées en


"paquets" homogènes (entités, tables) dans lesquels la répétition (redondance)
d'informations doit être minimale.
Les attributs qui sont calculés (qui ont une règle de calcul) ne doivent pas être pris en
compte dans la phase de structuration des données. Ils sont en effet obtenus à partir
d'autres attributs, et les inclure dans la phase de structuration introduirait une forme de
redondance et donc des possibilités d'incohérence. Dans notre exemple, l'attribut
"Moyenne" appartient à cette catégorie.

On dira qu'un ensemble d'attributs est homogène si tous les attributs qui le compose ont un
lien "direct".
La redondance à l'intérieur d'un ensemble doit être minimale car la redondance est source
d'incohérence. En effet, si la même information est répétée plusieurs fois, cela signifie :

Qu'elle devra être saisie plusieurs fois, ce qui multiplie les risques d'erreurs de frappe.

Que lorsqu'elle devra être mise à jour, les modifications devront intervenir à plusieurs
endroits d'où des risques de mise à jour partielle.

Pour regrouper les attributs du dictionnaire de données on utilise un élément structurant


qui s'appelle la dépendance fonctionnelle (DF).

Notion de dépendance fonctionnelle (DF)

On dit qu'il existe une dépendance fonctionnelle entre un attribut A1 et un attribut A2, on
note A1 -> A2, si connaissant une valeur de A1 on ne peut lui associer qu'une seule
valeur de A2. On dit aussi que A1 détermine A2. A1 est la source de la dépendance
fonctionnelle et A2 le but.

Exemple de DF

Dans notre base de données exemple, connaissant un numéro d'étudiant, on connaît de


manière unique le nom de cet étudiant et, entre autres, sa date de naissance. On a donc :

Numetu -> Nometu, Dtnaiss.

En revanche, l'expression : Numetu -> Note est fausse.

En effet, connaissant un numéro d'étudiant on peut connaître les notes qu'il a obtenu dans
chaque matière. La connaissance du numéro d'étudiant ne permet donc pas de connaitre
une note particulière et il n'y a donc pas de DF.

DF simple :
On dira qu'une DF est simple si sa source n'est composée que d'un seul attribut.
Une DF simple caractérise une entité (table) dont la source est la clé et dont les propriétés
6
sont constituées par le but de la DF.

DF composée :
On dira qu'une DF est composée si sa source est composée par la réunion de plusieurs
attributs.
Une DF composée caractérise une association entre entités (tables) dont la source est la
clé et dont les propriétés sont constituées par le but de la DF. Il ne doit pas y avoir
d'attributs superflus dans la source d'une DF composée. Par exemple si nous avons les 2
DF composées :

1- A1, A2, A3 -> A4


2- A1, A2 -> A4

La DF numéro 1 est incorrecte puisque A3 est superflu. La DF composée "correcte" est :


A1, A2 -> A4

Pour représenter les entités et associations nous utiliserons la notation suivante :

NOM_DE_L'ENTITE (Source, But ...). La clé est soulignée.

Soit par exemple :

DF Entités
A1 -> A2, A3, A4 ENTITE1 (A1, A2, A3, A4)
A3 -> A4 ENTITE2 (A3, A4)
A1, A5 -> A6 ASSOC1 (A1, A5, A6)

Suppression de la redondance d'informations

L'utilisation des DF permet de structurer les informations contenues dans le dictionnaire


des données mais n'élimine pas, directement, la redondance éventuelle de ces
informations.
Par exemple, dans le tableau ci-dessus, les attributs A3 et A4 sont redondants puisqu'ils se
trouvent dans deux entités : ENTITE1 et ENTITE2. Il est donc nécessaire d'éliminer cette
redondance sans toutefois perdre des informations : c'est à dire supprimer des entités.

Dans cet exemple, on ne peut supprimer A3 de l'entité2 car cela impliquerait la


suppression de l'entité et donc une perte d'information. A4 ne peut pas non plus être
supprimé de l'entité2 puisque c'est la seule propriété de cette entité. En revanche A4 peut
être supprimé de l'entité1, sans perte d'information, puisqu'il peut être obtenu (dérivé) par
le biais de A3, en utilisant la propriété de transitivité des DF.

La structure "optimale" (cohérence maximale et redondance minimale) du schéma de DF


précédent est donc :

A1 -> A2, A3
A3 -> A4
A1, A5 -> A6

7
D'où la règle :

Pour supprimer les redondances sur un ensemble de DF il faut éliminer


les attributs qui peuvent être obtenu par transitivité.

Démarche de structuration des données

La structuration des données du dictionnaire des données s'effectue en 5 étapes :

Détermination de la liste des DF simples

Prise en compte des attributs non classés dans l'étape 1 et détermination des DF
composées

Elimination des transitivités du schéma des DF

Construction, à partir des DF simples, des entités de la base de données

Construction, à partir des DF composées, des associations de la base de données

L'application de cette démarche à notre exemple nous donne les résultats suivants :

1-DF simples de la base de données ETUDIANTS

Numetu -> Nometu, Dtnaiss, Cdsexe, Lbsexe


Cdsexe -> Lbsexe
Numens -> Nomens, Grade, Ancien
Numat -> Nomat, Coeff, Numens, Nomens, Grade, Ancien

2-Attributs non classé et DF composées de la base de données ETUDIANTS

L'attribut "note" n'a pas été classé dans l'étape précédente, il intervient donc dans une DF
composée. Cette DF est la suivante :

Numetu, Numat -> Note

3-Elimination des transitivités de l'ensemble des DF

Numetu -> Nometu, Dtnaiss, Cdsexe


Cdsexe -> Lbsexe
Numens -> Nomens, Grade, Ancien
Numat -> Nomat, Coeff, Numens

4-Construction des entités

ETUDIANT (Numetu, Nometu, Dtnaiss, Cdsexe)


SEXE (Cdsexe, Lbsexe)
ENSEIGNANT (Numens, Nomens, Grade, Ancien)
MATIERE (Numat, Nomat, Coeff, Numens)

8
5-Construction des associations

NOTES (Numetu, Numat, Note)

Conception de Bases de données : étape 3

Construction du schéma des données

La dernière étape consiste à mettre en relation les entités et associations trouvées dans
l'étape précédente afin de construire la structure générale des données : le schéma des
données.

Mise en relation des entités

Les entités sont mise en relation par l'intermédiaire des attributs qu'elles possèdent en
commun. Les types de relations autorisées pour relier deux entités (associations)
appartiennent aux deux catégories suivantes :

Relation de type 1-1 : à un élément de l'ensemble départ on ne peut faire correspondre


qu'un seul élément de l'ensemble d'arrivée et réciproquement.

Relation de type 1-n : à un élément de l'ensemble de départ on peut faire correspondre


plusieurs éléments de l'ensemble d'arrivée.

Pour déterminer les relations entre entités (associations), il faut donc examiner le cardinal
de chacune des entités qui interviennent dans la relation.

Dans notre exemple, nous avons des relations suivantes :

Relation sur Type de


Entité source Entité but
l'attribut relation
SEXE ETUDIANT Cdsexe 1-n
ETUDIANT NOTES Numetu 1-n
MATIERE NOTES Numat 1-n
ENSEIGNANT MATIERE Numens 1-n

Si l'on examine la première ligne du tableau, nous avons précisé que la relation entre
SEXE et ETUDIANT était de type 1-n.
En effet, dans l'entité SEXE, une valeur particulière de l'attribut Cdsexe (H ou F) ne sera
présente qu'une seule fois(1). En revanche, dans l'entité ETUDIANT, la même valeur de
l'attribut Cdsexe pourra être présente plusieurs fois(n), autant de fois qu'il y a d'étudiants
de ce sexe.

Représentation graphique du schéma des données

Pour avoir une vision synthétique de la structure de la base de données (le schéma des
données) on utilise une représentation graphique du type suivant :
9
Cette représentation est le schéma de la base de données "ETUDIANTS". C'est la
structure de représentation optimale des données de notre problème : Cohérence
maximale et redondance minimale.

10

Vous aimerez peut-être aussi