TD2 S1 Sol StatDesc Dec20
TD2 S1 Sol StatDesc Dec20
TD2 S1 Sol StatDesc Dec20
1. Est-ce qu'on peut répondre à la question suivante : En combien d'année en moyenne les
entreprises actives dans le secteur du développement d'applications et de logiciels spécialisés
existent ?
2. Quelle est la valeur (en nombre d'années) à laquelle 50% des entreprises ont une existence
inférieure ?
Solution de l’exercice 1
1. Il est difficile, peut être impossible, de répondre à cette question à cause de la dernière classe
qui n’est pas bornée, cette classe doit être représenté par une valeur centrale, rien nous
informe sur la limite supérieur. Il faudra donc éviter le calcul de la moyenne et chercher une
autre mesure de tendance centrale.
2. On doit calculer la médiane, on va utiliser la formule suivante :
𝑛
− 𝑁𝑖−1
𝑀𝑒 = 𝑏𝑖𝑛𝑓 + 2 𝑐
𝑛𝑖
Si les données sont triées dans l’ordre croissant, on calcule le rang de la valeur médiane :
𝑛 215
= = 107.5
2 2
1
La valeur médiane dont le rang est 107.5 se trouve dans la classe médiane [3, 5[. Les données
à utiliser dans la formule sont : 𝑏𝑖𝑛𝑓 = 3 ; 𝑁𝑖−1 = 84 ; 𝑛𝑖 = 37 et 𝑐 = 2. Le calcul nous donne
le résultat suivant :
107.5 − 84
𝑀𝑒 = 3 + ∗ 2 = 4.27
37
Conclusion : 50% des entreprises ont une existence inférieure à quatre années et trois mois.
Solution de l’exercice 2
1. Pour connaitre la classe modale, il faudra éliminer l’effet de l’amplitude de la classe, on voit
bien que les amplitudes sont différentes : 2, 2, 6 puis 8.
Pour cela on peut chercher la classe qui a le rapport 𝑓𝑖 𝑏𝑖 − 𝑎𝑖 le plus élevé, avec 𝑓𝑖 la
fréquence de la classe [𝑎𝑖 , 𝑏𝑖 [. On peut de la même façon comparer les 𝑛𝑖 𝑏𝑖 − 𝑎𝑖 avec 𝑛𝑖
l’effectif, la classe modale correspond au rapport le plus élevé.
La moyenne sera calculée sur la base des fréquences (poids de chaque classe) et des
moyennes des classes :
4
𝜇= 𝑓𝑖 𝑚𝑖 = 7.94.
𝑖=1
Pour chercher la classe médiane, on doit cumuler au moins 50%=0.5 des données : la classe
médiane correspond à l’intervalle [6, 12 [. Le calcul de la valeur médiane sera fait à partir de
la formule utilisant les fréquences au lieu des effectifs :
0.5 − 𝐹𝑖−1
𝑀𝑒 = 𝑏𝑖𝑛𝑓 + ∗𝑐
𝑓𝑖
On a les données suivantes à utiliser dans le calcul :
𝑏𝑖𝑛𝑓 = 6 ; 𝐹𝑖−1 = 0.40 ; 𝑓𝑖 = 0.48 et 𝑐 = 6
Le calcul donne :
0.5 − 0.4
𝑀𝑒 = 6 + ∗ 6 = 7.25.
0.48
Interprétation des résultats :
⤥ Le chiffre d’affaire le plus fréquent observé dans le secteur Bâtiments et Travaux
Publics (BTP) est de 5 000 000 DH,
⤥ Tandis que le chiffre d’affaire moyen des entreprises du secteur (BTP) s’élève à
7 940 000 DH.
⤥ On constate de même que 50% des entreprises du secteur BTP ont un chiffre d’affaire
supérieur à 7 250 000 DH.
𝑀𝑒 = 7,25
2 20
4,8 10,375
50%
Remarque : si on cherchait dans la série des données des valeurs aberrantes, alors toute valeur
aberrante doit être
Supérieure à 𝑄3 + 1.5 ∗ 𝑄3 − 𝑄1 = 18.7375
Ou inferieure à 𝑄1 − 1.5 ∗ 𝑄3 − 𝑄1 = −3.5625
On a pas ici la série des données, mais toute valeur observée dans l’intervalle 18.74; 20 sera
considérée comme valeur aberrante.
3. Calcul de l’écart-type :
On calcule en premier la variance, on utilisera la formule suivante (formule dite de Koenig) :
𝑘 𝑘
1
2
𝜎 = 𝑛𝑖 𝑚𝑖2 − 𝜇 =2
𝑓𝑖 𝑚𝑖2 − 𝜇 2
𝑁
𝑖=1 𝑖=1
On réutilise le tableau-synthèse :
Centre Fréquences en %
C.A. 𝑓𝑖 𝑚𝑖2
𝑚𝑖 (100 𝑓𝑖 )
[2 , 4 [ 3 15 1.35
[4 , 6 [ 5 25 6.25
[6 , 12 [ 9 48 38.88
[12 , 20 [ 16 12 30.72
Total 100 77.2
4
L’écart-type de la série statistique est égale à :
𝜎 = 3.76
Il correspond à un écart de 3 760 000 DH.
1415.64
𝜎 2 = 𝑚2∗ = = 14.16
100
𝑚3∗ = 38.97 et 𝑚4∗ = 615.05 ;
38.97
𝛾= = 0.73 > 0
53.28
𝛾>0
Oblique
Etalée à
à gauche
droite
La courbe de la distribution du chiffre d’affaire est non symétrique, elle est oblique à gauche et
s’étale à droite.
5
Exercice 3 : Une enquête sur la consommation annuelle d'électricité a été effectuée sur une
population de 2600 ménages. Les résultats de l'enquête figurent dans le tableau suivant :
Consommation annuelle en kilowattheure(kwh) Nombre de ménages
[0 , 200 [ 455
[200 , 300 [ 614
[300 , 400 [ 532
[400 , 600 [ 385
[600 , 800 [ 422
[800 , 1000[ 164
[1000 , 2000[ 28
1. Construire l'histogramme des consommations annuelles.
2. Déterminer le mode et la médiane de cette distribution statistique.
3. Calculer la consommation annuelle moyenne et l'écart-type des consommations.
Solution de l’exercice 3
1. Dans le tableau ci-dessus, on a des amplitudes de classes différentes, 200, 100, 100, 200, 200,
200, 1000. On remarquera que le plus grand commun diviseur de ces amplitudes est 100.
On corrigera par exemple le premier effectif 455 en le divisant par 2, puisque l’amplitude de
la première classe est égal à 200=2*100. La même chose sera faite avec la 4ème, 5ème et 6ème
classe. Pour la dernière classe on divisera l’effectif 28 par 10 puisque l’amplitude de la classe
qui lui correspond est égal à 1000=10*100. On obtient ainsi l’histogramme suivant :
614
600
532
500
Nombre de ménages
400
300
227,5 211
192,5
200
100 82
2,8
0
Consommation en kwh
6
2. La classe modale est [200 , 300 [ ; elle correspond au rapport (𝑛𝑖 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒) le plus élevé ;
la valeur modale qu’on prendra est le centre de la classe :
𝑀𝑜 = 200 + 300 2 = 250 kwh
Consommation Nombre de 𝑛𝑖
𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒
annuelle (kwh) ménages 𝑛𝑖
[0 , 200 [ 200 455 2.275
[200 , 300 [ 100 614 6.140
[300 , 400 [ 100 532 5.320
[400 , 600 [ 200 385 1.925
[600 , 800 [ 200 422 2.110
[800 , 1000[ 200 164 0.820
[1000 , 2000[ 1000 28 0.028
Pour le calcul de la médiane, on va calculer les effectifs cumulés pour connaitre la classe médiane.
On cherche la valeur de rang 𝑛 2 = 1300
Consommation Nombre de
𝑁𝑖
annuelle (kwh) ménages 𝑛𝑖
[0 , 200 [ 455 455
[200 , 300 [ 614 1069
[300 , 400 [ 532 1601
[400 , 600 [ 385 1986
[600 , 800 [ 422 2408
[800 , 1000[ 164 2572
[1000 , 2000[ 28 2600
La classe médiane est [300 , 400 [ ; la valeur médiane est la suivante :
1300 − 1069
𝑀𝑒 = 300 + ∗ 100 = 343.42 kwh
532
On fait le calcul :
606965000
𝜎2 = − 408.732 = 233448.08 − 167060.84 = 66387.24
2600
600 614
532
500
400
300
211
200 227,5
192,5
100 82
2,8
0 0
0 150 350 550 750 950 1150 1350 1550 1750 1950
8
Exercice 4 : Le tableau suivant donne la répartition des salaires mensuels moyens en milliers de
dirhams (kDH), ainsi que leurs écart-types, pour les trois catégories socio-professionnelle d'une
usine :
Catégories pourcentage % Salaire moyen en kDH Ecart-type
Cadres 10 8.2 1.6
Employés 30 4.2 0.9
Ouvriers 60 2.8 1.3
1. Rappeler la formule de calcul du salaire mensuel moyen puis calculer le.
2. Comparer les dispersions des salaires des trois catégories.
Solution de l’exercice 4
1. La moyenne à utiliser ici est la moyenne pondérée, sa formule est donnée par l’équation
suivante :
3
𝑖=1 𝑝𝑖 𝑥𝑖
𝑥𝑝 = 3
𝑖=1 𝑝𝑖
3
Dans cet exercice les quantités 𝑝𝑖 sont des pourcentages et 𝑖=1 𝑝𝑖 = 100% = 1, on écrit ainsi :
3
𝑥𝑝 = 𝑝𝑖 𝑥𝑖
𝑖=1
Calcul numérique :
𝑥𝑝 = 10% ∗ 8.2 + 30% ∗ 4.2 + 60% ∗ 2.8
= 0.82 + 2.52 + 1.68 = 3.76 kDH
Le salaire mensuel moyen dans l’usine est égal à 3760 DH
Il y’a une forte disparité (différence) des salaires dans la classe ouvrière par rapport aux deux
autres classes.
9
Exercice 5 : Le vérificateur interne d'une entreprise a relevé le délai de recouvrement (en jours)
des comptes auprès de 100 clients de l'entreprise. Les données sont dans le tableau suivant,
triées dans l'ordre croissant :
40 40 42 42 46 46 47 47 47 47 48 49 49 49 50 52
52 52 52 53 53 54 57 57 59 61 61 61 63 66 67 68
68 69 70 75 79 79 80 80 81 86 88 88 88 89 90 91
91 92 94 98 98 99 99 100 101 101 102 103 103 104 104 104
106 109 109 111 111 112 113 113 114 114 115 118 118 119 119 120
121 122 123 127 127 128 129 130 131 132 132 132 133 133 134 135
138 138 139 139
1. Construire un tableau synthèse regroupant les données, prenez une amplitude égale à 12.
2. Tracer l'histogramme correspondant et la courbe cumulative des pourcentages.
3. Déterminer le délai moyen de recouvrement des comptes, la variance et l'écart-type.
4. Déterminer la valeur médiane du délai de recouvrement. Que représente cette mesure de
tendance centrale ?
5. En utilisant les données, quelle proportion de comptes clients ont un délai de recouvrement
entre 𝑥 − 𝑠 et 𝑥 + 𝑠 ?
6. En utilisant la série de données, déterminer les valeurs du premier quartile 𝑄1 et du troisième
quartile 𝑄3 .
7. Existe-t-il des valeurs aberrantes dans la série de données ?
Solution de l’exercice 5
1. Le tableau-synthèse est le suivant,
Classes 𝑛𝑖 𝑁𝑖 𝑓𝑖 𝐹𝑖
[40, 52[ 15 15 0.15 0.15
[52 , 64[ 14 29 0.14 0.29
[64 , 76[ 7 36 0.07 0.36
[76 , 88[ 6 42 0.06 0.42
[88 , 100[ 13 55 0.13 0.55
[100 , 112[ 14 69 0.14 0.69
[112 , 124[ 14 83 0.14 0.83
[124 , 136[ 13 96 0.13 0.96
[136 , 148[ 4 100 0.04 1.00
Total 100 1.00
10
2. Histogramme des effectifs :
10
8 7
6
6
4
4
0
[40;52[ [52;64[ [64;76[ [76;88[ [88;100[ [100;112[ [112;124[ [124;136[ [136;148[
0,8
% comptes clients
0,6
0,4
0,2
0
40 52 64 76 88 100 112 124 136 148
Délai de recouvrement (en jours)
11
3. Pour calculer le délai moyen de recouvrement, on complète le tableau-synthèse :
𝑥𝑛 = 𝑓𝑖 𝑚𝑖 = 91 jours.
𝑖=1
La variance est égale à
9 9
1
2
𝑠 = 𝑛𝑖 𝑚𝑖2 2
− 𝑥 = 𝑓𝑖 𝑚𝑖2 − 𝑥 2
𝑛
𝑖=1 𝑖=1
4. La classe médiane est [88, 100[ ; le calcul de la valeur médiane nous donne
0.5 − 0.42
𝑀𝑒 = 88 + ∗ 12 = 95.385 jours
0.13
Cette valeur va nous permettre de positionner les clients, il ya 50% des clients qui ont un délai de
recouvrement de plus de 95.4 jours.
5. En utilisant directement les données, on veut retrouver le pourcentage des clients qui ont un
délai de recouvrement situé dans l’intervalle suivant :
On compte un nombre de 56 parmi 100, càd on a un pourcentage de 56% de clients qui ont un
délai de recouvrement entre 61 jours et 121 jours.
12
Remarque : si on cherche la proportion de comptes clients qui ont un délai de recouvrement
entre 𝑥 − 2𝑠 ; 𝑥 + 2𝑠 = 30.06 ; 151.94 ; on remarque déjà que tous les recouvrements
observés sont dans l’intervalle 30.06 ; 151.94 c.à.d. que la proportion est de 100%.
7. On calcul la distance :
𝐷 = 1.5 ∗ 𝑄3 − 𝑄1 = 97.5
Une valeur est aberrante si elle s’éloigne de la valeur 125 d’au moins 97.5, c.à.d. supérieure à
125+97.5=222.5 ou si elle s’éloigne dans le sens inverse de la valeur 60 d’au moins 97.5, c.à.d.
qu’elle doit être inférieure à -37.5 ; aucune valeur ne satisfait à ces conditions d’où la série des
données ne contient aucune valeur aberrante.
13
Délai moyen de recouvrement des comptes clients
Le délai moyen de recouvrement des comptes clients mesure le nombre moyen de jours qu’il faut
aux clients pour payer leurs comptes.
Le résultat permet aussi de déterminer si les modalités de crédit dont se sert l’entreprise sont
réalistes.
Pour déterminer si le délai moyen de recouvrement des comptes clients est adéquat, il suffit de le
comparer aux modalités de crédit qu’on offre aux clients. Par exemple, si on donne aux clients 30
jours pour payer leur facture et que le délai moyen de recouvrement des comptes clients est de
45 jours, il y a un problème; en revanche, si le délai moyen est inférieur à 30 jours, c’est une
bonne nouvelle.
Extrait de https://www.bdc.ca/fr/articles-outils/boite-outils-entrepreneur/evaluation
Retour
14