Mesures de Dispersion
Mesures de Dispersion
Mesures de Dispersion
Dr Brulet
Rappel
Les mesures de tendance centrale (moyenne, mdiane et mode) sont utiles pour dcrire des distributions de frquence, mais ne donnent aucune indication quant la dispersion des observations qui ont la mme mesure de tendance centrale.
PLAN
I. Rappel II. Indices de dispersion III. Ltendue IV. Lcart type V. La Loi Normale
I. Rappel
Indices de position= moyenne, mdiane et mode
Moyenne Avantages Universellement rpandue et accpte Calcul facile Peu influence par les valeurs extremes Le choix de l'intervalle des classes agit peu sur sa valeur Bon indicateur pour les variables asymtriques N'est pas affect par les valeurs exceptionnelles Permet de reprsenter des populations htrognes qui prsentent plusieurs valeurs dominantes Inconvnients Fortement influence par les valeurs extremes Reprsente mal les valeurs d'une population heterogne ou asymetrique Se prte mal au clacul Ne reprsente que la valeur qui spare l'chantillon en deux parties de mme effectif sans tenir compte de l'ensemble des donnes Se prte mal aux calculs Varie beaucoup selon la lageur choisie pour les classes
Mdiane
Mode
II. Ltendue
Ltendue indique la distance entre la plus grande et la plus petite valeur observe dans la distribution. Exemple: Soit un jeu de 11 valeurs 3, 4, 4, 5, 6, 6, 6, 7, 7, 8, 10 ; ltendue de ces valeurs est de3 10. Elle peut galement tre exprime comme 10 - 3 = 7.
Ltendue est un concept facile comprendre et calculer. Elle ne donne nanmoins dinformations que sur les deux valeurs extrmes observes dans la distribution. Une valeur leve ou basse peut tre due une erreur de mesure, et la mesure de ltendue ne prend pas en compte la variabilit des observations entre les deux valeurs extrmes.
III. Lcart-type
Lcart-type est une mesure qui dcrit la dispersion des observations autour de la moyenne. Si toutes les observations avaient la mme valeur, lcart-type serait gal 0 ; plus les observations sont disperses autour de la moyenne, plus grand sera lcart-type. L o lcart-type dun chantillon est trs petit, chaque observation individuelle est trs proche de la moyenne de lchantillon ; un cart type lev indique linverse
Ecart type
Les tapes suivre pour calculer lcart-type selon cette formule sont les suivantes : Calculer la diffrence entre chaque observation et la moyenne (xi - x ) Porter chacune de ces diffrences au carr (xi - x)2 Additionner tous ces carrs et diviser la somme des carrs par le nombre dobservations moins 1 (n -1) Prendre la racine carre du rsultat obtenu.
Vous remarquerez que le dnominateur utilis est n - 1 plutt que n. En pratique, quand n est assez grand, il ny a pas de grande diffrence entre les deux. Nanmoins, pour des raisons thoriques, on prfrera utiliser n - 1.
Exemple: calculer lcart-type (SD) dun jeu de 11 valeurs : 3, 4, 4, 5, 6, 6, 6, 7, 7, 8, 10. 1/ Calculer la moyenne : 66 / 11 = 6 2/ Calculer la diffrence entre chaque observation et la moyenne
3/ Calculer la somme des carrs de la diffrence la moyenne Somme des carrs = 9 + 4 + 4 + 1 + 0 + 0 + 0 + 1 + 1 + 4 + 16 = 40 4/ Diviser la somme des carrs par le nombre dobservations moins 1 (n -1) soit (11 - 1) = 10 40/10= 4
On peut aussi calculer la valeur de lcart type de manire plus rapide en utilisant la formule :
V. La distribution normale
Lcart-type est surtout utile lorsque la distribution est peu prs normale (courbe de Gauss), cest--dire quelle est en forme de cloche symtrique (Figure 5-a).
De nombreuses caractristiques biologiques telles que la taille, le poids et la tension artrielle ont une distribution gaussienne. Dans cette distribution normale environ deux tiers des observations seront contenues dans un intervalle compris entre la valeur moyenne et +/- un cart-type de la moyenne ; 95% des observations entre la valeur moyenne et +/deux carts-type de la moyenne (Figure 5-a).
Pour une distribution gaussienne de moyenne 100 et dcart-type 2, par exemple, il y a moins de 5 chances sur 100 de rencontrer une valeur suprieure [100 + (2 * 2)] ou infrieure [100 - (2 * 2)], soit une valeur suprieure 104 ou infrieure 96.
Il faut nanmoins garder prsent lesprit que de nombreuses distributions biologiques (en parasitologie et en pidmiologie par exemple) ne suivent pas cette distribution normale.