Analyse de Donnée Quantitative

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 7

INTRODUCTION :

Pourquoi on va faire une outil quantitatif et non pas qualitatif ? on va expliquer un


phnomne de consommation or qualitatif on pose la question comment or en
quantitatif on pose la question pourquoi ?
Partie I : notion gnrale
CHAPITRE I : Echantillonnage
1- Prparer lchantillon :
Dans une tude il faut dfinir la notion de population (des entreprises, des objets,
individu), dans notre tude on va sintress a des individus.
On distingue : une population de rfrence (ou cible) : dans cette population
cible on tudier juste une partie (bout) de cette population rfrence. Ce quon
appelle lchantillon.
Il existe une relation entre population et chantillon de la population a
lchantillon on va faire une estimation et de lchantillon a la population on faire
de linfrence.
On 2 type dchant : probabiliste ou non probabiliste (empirique)

Lchantillonnage probabiliste : c la mthode du loto on tire au hasard les


individu or pour lautre type on tire les individu en fonction dune
exprience et non au hasard dans ce premier type on a comme technique
lalatoire simple : on va choisir au hasard c comme le loto c un tirage au
sort chaque individu de la population a la mme chance dtre choisi
comme 2eme technique on a chantillon systmatique : un chiffre
alatoire entre et 100 si on choisit 80 par exemple on va prendre lindividu
180 , 280 , 380 , 3eme technique chantillon stratifi : on va dcouper la
population on plusieurs sous population ou strate en fonction de lAge par
exemple, il faut que ces sous- population soit homogne.
Lchantillonnage non pro baliste : 1) convenance : quon on a pas les
moyen en tant que chercheur par exemple, partir de notre exprience et
capacit de relisions sur un sujet on peut dire que cet chantillon qui nous
intresse (des gens que nous connait) , 2) chantillon par jugement : on
juge que cette population la qui est la plus intressante, on se focalise une
catgorie de personne. C pas couteux et c pratique c difficile a gnralis
sur le plan statique 3) chantillon par quota : utilis dans la distribution :
identifier un paramtre de la population (sexe Age) une limite de personne
dans chaque catgorie a ne pas dpasser. 4) Boule de neige : utilis dans
des tudes dont on a une difficult daccs au terrain relle, on demande a
une personne qui va nous recommander a une autre et ETC
-

La taille dchantillon : des mthodes de calcul sont disponible par


exemple on a des questions donc la taille de lchantillon c 10

Chapitre 2 : construction et administration du questionnaire :


Rappel : dans un questionnaire il faut :

Etape 1 : prciser ce quon recherche : (les objectifs)

Etape 2 : dterminer les hypothses de de recherche


Etape 3 : Quel type dtude : explicative, confirmatoire, dexploratoire
Etape 4 : Classer linformation quon cherche on a plusieurs catgorie : ce
que les gens fait (comportement) , ce que les gens rementent , et ce que
les gens sont (identification). Il faut poser la question si chaque question
est utile ou non
- Type de question dans un questionnaire :
Ouverte ou ferm : ouvert on lui donne le choix de rpondre fermer on le
force rpondre par des rponses prcise. Dans notre questionnaire il faut
avoir le plus des questions fermes
Question a choix multiples : par exemple ou prendrez-vous conseil 4
rponse possible : Presse, Amis, professionnel, famille ou Autre, la variable
c la question et les modalits de rponse ce sont les choix. Voir feuille

Les chelle de LIKERT : chelle en 5 ou 7 P on pose une question et on


rpond de daccord jusqu pas tout fait daccord exemple page 3 poly 5
modalit ou plus on parle dune variable chelle automatiquement.
4modalit ou on parle dune variable de type ordinale.

Les chelle smantique diffrentielle : 2 adjectif qui soppose par exemple


dplaisant et plaisant et choisir un degr de 1-5 voir poly 3.

- Les niveaux de mesure on parle


Echelle qualitatif (tous ne se mesure pas par les chiffres, on a des variable
ou rponse qui sont nomm) pas possible de faire des oprations
mathmatiques. On 2 type
- Echelle nominale : je nomme les rponses, je donne un nom, par
exemple quelle marque de lessive utilisez-vous ? Ariel ETC.
- Echelle ordinale : une notion dordre de classement on classe les Object
de plus petit de plus grand par exemple, par exemple classer les
produits que vous aimez le plus par A : jaime pas du tout B, jaime un
peu et C jadore je nai pas le mme cart entre A et B et C.
Exemple : satisfaction dun produit : rponse possible : pas satisfait,
peu satisfait et satisfait et tout fait satisfait, exemple2 : Age par
tranche 18-25 / 25 35 / 35 45 / + de 45 ans mme si jai des units des
nombre mais c pas le mme cart entre les catgories dges
Quantitatif : poids quantit vendu c possible de faire toute les oprations
mathmatiques
- Intervalle : il existe des units, on ne met pas un zro naturel par
exemple la temprature on peut pas mtre 0 ==) a signifie quelque
chose
- Proportion : 0 signifie quelque chose / absence de phnomne rien ne
se passe, un zro naturel, par exemple Age si 0 cela veut dire quil rien,
vendu 0 produit cela veut dire quil a rien. On appelle les 2 variable
dans SPSS les variables dchelle on fait pas la diffrence.

Comment bien choisir les niveaux de mesures ?


-

K catgorie/modalit de rponse ! poser la question sil sont ordonn


sil ya pas dordre on est dans des variables nominale si la rponse oui
on se demande sil Ya des intervalles entres les catgorie si la rponse

est non on est dans une variable de type ordinale si la rponse et oui
on est dans des variables naturel si la rponse est non on est une
variable de type intervalle si oui on est dans une variable de type
proportion.
Toute les rponses choisit dans un questionnaire doit est cod par un
chiffre. (SPSS) exemple codage questionnaire 1 page 3
Chapitre 3 : analyse de donne
Etape 1 : formulation de lhypothse nulle quon lappelle H0, tt les
teste statistiques vont porter sur cette hypothse nul, 2 possibilit pour
cette hypothse soit rejet ou valid (pas rejet).
H0 est une hypothse dabsence de diffrence par exemple si on tudie
les variations de salaire entre les hommes et les femmes note
hypothse va nous dire quil ya pas de diffrence entre les salaires des
2
H1 une hypothse alternative = il ya une diffrence.
Etape 2 : choix du test statistique
Le choix il est en fonction de la nature de notre variable (nominal,
chelle ..)
Etape 3 : choisir un seuil de signification :
Seuil de signification est not alfa = 5% c la marge derreur. Je
mautorise une marge derreur de 5% ! Si je tombe sur 5% cela veut
dire que je rejette H0 alors que c pas vrai en ralit !
H0 accept
H0 rejete

H0 vrai (en ralit)


Dcision correcte : seuil
de confiance 1- alfa
Erreur de type 1 (je suis
dans la marge derreur
de 5%)

H0 fausse (en ralit)


Erreur de type 2 ce
quon appelle beta
Une dcision correcte

3 types danalyse qui sont possible : analyse uni varies : tudier un


seuil variable

Analyse bi varie (2 variable), multivarie ( 3 variables et + ).


-

Y = f(x) y est fonction de x , y et x sont des variables ( ordinale ,


chelle.. ) on observer si y varie en fonction de x. Est -ce-que la
variable Y est fonction de la variable X ? Y cest la variable que je
cherche a expliqu, X la variable explicative, on cherche savoir si Y
dpend de X donc y on lappelle variable de dpendance et X cest la
variable indpendante.

Partie 2 : analyse uni varie (description de la variable


Chapitre 4 : distribution de frquences :
1- Distribution de frquence :
Objectif : dterminer les nombre de rponses = effectif, associer aux
diffrentes valeurs (modalits), de la variante exemple combien de nos
client sont -ils fidle ( une seule variable) exemple 2 : quelle votre niveau
de connaissance vis--vis internet :
Modalit

Effectif

Frquence

Frquenc

Tres faible
connaissa
nce

Trs forte
connaissa
nce
Des
valeurs
manquant
es

e valid
0

2
3
4
5
6
7

2
6
6
3
8
4

6.7
20
20
10
26.7
13.3

6.9
20.7
20.7
10.3
27.6
13.8

______

Un effectif
de 30

3.3%

a
donne
100%

2- Statistique associe :
- Mesures de position centrale : caractriser le centre de la variable : la
moyenne, mdiane, le mode.
La moyenne : je peux la calculer que pour la variable dchelle ! (Des
variables quantitatif) mthode de calcul : X bare = la somme de 1 n de
xi diviser par le nombre dobservation n (lunit de la variable, anne
pourcentage)
Mdiane : le milieu de lchantillon exemple de la mdiane (voir feuille) :
( variable dchelle ou ordinale)
Mode = pour calculer le centre de variable nominale : cest la rponse
dont plusieurs personne ont mis comme rponse
- Mesures de dispersion : variable quantitative :
Lcart : (tendu) : diffrence entre la borne suprieure et la borne
infrieur : X suprieur X infrieure
Lcart interquartile : (7 modalit diffrente) = mme principe que la
mdiane
Variance et Lcart type = mesure la dispersion des valeurs prise par la
variable au tour de la moyenne + on a une dispersion autour de la
moyenne + la variable et lcart type et fort et inversement ! La somme
de tous mes observations allant de 1 jusqu n ; xi valeur prise par
lobservation la moyenne x barre divis sur n
- Mesure de forme : asymtrie et aplatissement : (voir feuille) : les
variables doivent suivre le cas dune loi normal cest--dire S ou K = 0.
Test dhypothse :
- 3 test dhypothse de comparaison
Test de la moyenne : ( test de student )
- Etape 1 : fixer les hypothses : H0 exemple : on a mesur dans une
entreprise largent qui dpens tt les mois par salari dans la
restauration : on a n = 20 personnes si on a des dpenses > 150eurp
===) chques restaurrant, la moyenne dpenses = 153.95 euro dans
ce cas cest hypothse dabsence de diffrence donc H0< ou gale
150 et H1>150

Etape 2 : test statistique teste student :


Test student : x barre valeur de lcart type 28,51
Etape 3 : seuil de signification alfa = 5%
Etape 4 : prise de dcision : t0 = 0.588 on compare t0 au t alfa = 2.093
(tableau) donc t0<t alfa, la statistique calcule < statistique critiquee au
seuil alfa donc je ne rejette pas H0 donc la moyenne infrieure ou gale
150 euro donc pas la mise en place des tiquet resto.
- Test de proportion : un magasin qui veut faire un systme de vente en
ligne, le magazine va faire a si 40% de ces clients vont acheter par un
paiement en ligne donc > 40%, on a contact 30 personne n = 30, 17
personnes font leur achat sur internet
Formulation hypothse tape 1 :
Ho = cest pi =< 0.40 ; et H1 : pi > = 0.40
Etape 2 ; Z cest la variable qui suit une loi normale = p- pi / lcartille de
proportion (racine carre de p (1-pi) / n)
Etape 3 : alfa = 5% =0.05
Etape 4 : rgle de dcision : on va faire une probalit pour que P=(Z =
1.88) = 0.0301 on compare cette probabilit a note seuil de signification
de 5%. Donc P <alfa la dcision alors : rejeter H0 dans ce cas on est bas
sur des calculs probabilit. Si on a une signification SIG < alfa on rejette
toujours H0
-

Reprsentation graphique : (on est toujours dans le principe que ma


variable suit une variable normal)
Dans ce cas on mit on place le systme de paiement enligne
Partie 3 : analyse bi-varie :
Voir tableau (feuille)
Chapitre 5 : analyse des tableaux croise :

Exemple 1 : utilisation internet avec le sexe ; 3 modalit de rponse : faible (1) ,


forte (2)==) ordinale pour le sexe homme ( 1) femme (2) ===) nominale.
H
5 effectif observ
10

Faible
Fort

F
10
5

1) H0 = labsence dassociation entre lutilisation dinternet et le sexe.


Test : compar les effectifs observs avec les effectifs thorique :
( effectif quon devrai avoir thoriquement si yavait aucune diffrence
entre lutilisation dinternet entre homme et femme donc pas de
relation entre les 2 variables.
Calcul effectif thorique : fe = nr (total ligne) * nl (colonne) / ( nombre
total dobservation) n // donc fe = 15*15 / 30 = 7.5. On calcule pour
le faible et le fort 7.5 pour les 2 ! Donc on compare la diffrence entre
les effectif observ et thorique par le test de tableau crois ( test de
khi-deux)
2) Test de KHI-deux = la somme de tous les f0-fe / fe au carr !

Hypothse nulle = absence de relation entre le sexe et lutilisation


de linternet
3) Alfa risque mme chose quavant = 5%
4) 4eme tape : la rgle de dcision la prise de dcision :
-

La valeur statistique ou critique : statistique de 3.841 dans ce cas je ne


peux pas rejeter H0 ! conclusion : pas dassociation entres les 2
variables.
Important : statistique calcule < statistique critique
==) ne pas rejeter Ho ! donc jaccepte quil n y a pas de relation entre
les 2 variables.
2eme mthode : SIG = 0.068 > alfa = ne pas rejeter H0 .
Dans le cas ou H0 est rejet ( cas de relation entre les 2 variables) on
aura besoin de :

Coefficient de Cramer : toujours compris entre 0 et 1 , si il est approche de


0 on a une intensit de la relation qui est faible et inversement. Exemple
>v>0.5 intensit forte et 0.3<v<0.5 ==) faible // ou ca ou ou il nya pas
de relation c pa la peine dinterprter V cramer
Coefficient contingence C
Chapitre 6 : analyse de la variance a 1 facteur : Y = f(x) y la variable
a expliqu ( une variable dpendante) ( une variable quantitative ) x
( explicative , qualitative indpendante) un seul facteur x qui va expliquer
la variable Y dans ce cas : la couleurs demballage et les quantits
vendus : on va supposer quon a deux emballage avec lemballage dor on
a vendu en moyenne 2000 article et avec lemballage bleu on a vendu en
moyen 1700
Anova : est que le choix de la couleurs influence sur le nombre ou la
moyenne des ventes des articles. Si les moyennes sont = donc aucune
influence de couleur sur les ventes , si les moyennes sont statistiquement
diffrente donc les couleurs de lemballage influence sur le nombre
darticle. Donc pour tudier la moyenne entre les 2 on va faire un tudier
un test de Fisher ===) tudier la variance pour cela il faut revrifier :
Variance entre les populations = entre lemballage dore et bleu cest-dire il faut passer par la statique de Levene = reposer une hypothse nulle
juste pour ce test : H0 : les variance sont gales
1) Lhypothse nulle : H0 : absence de diffrence entre les
moyennes :
Exemple : couponnage :
promotion

Y= f(x)

les ventes en fonction de

Niveau promo : elev ( 1) moyen 2 fort 3


Variance totale ( Y = SCY) = SCmodle ( quel est la part de X pour
expliquer la variation de Y) +SC Erreur.
Le SCT = la somme ( yi-y (barre)) les yi sont les 30 chiffre de
vente donc Y barre cest la moyenne globale des vente donc la
totalit des ventes / 30 = 6.067 donc

SCT = 10-6.067 + 9 -6.067 + ..+2-6.0667 = 185.867 SC = la


variance ( une variation) total qui va etre expliqu par la vartion
de X + lerreur.
SCM = la somme de n * (Yj barre y barre) j cest la modalit
( cest dire les niveaux fort faire ou moyen) donc Yi barre pour
niveau 1 = 8.3 le yj barre pour niveau 2 moyene 6.2 et yj barre
pour 3 = 3.7 chaque niveau cest 10. Le n cest le total de chaque
niveau donc
SCM = 10 (8.3 6.067) + 10(6.2-6.067)+10(3.7-6.067) = 10
SCerreur = cest la somme ( yij-ybarrej ) = 79.80 ====) on va
calculer chaque chiffre de vente avec son Yj barre 8.3 et 6.2 et
3.7.
La statistique de Fisher cest = SCM /(c-1) // SCerreur/(N-c) ==) C :
cest le nombre de modalit prise par les variable X
F = 17.944 SIG <alfa ===) rejet H0
(H0 m1 = m2=m3) dans
notre cas on a observer quil ya une diffrence entre les moyens
donc ( une conclusion managriale)
-

Etat : cest le rapport entre SCM et le SCT ==) explique a


combien la variable X permet de expliquer la variation de Y.
donc 0.57 cela veut 57% de Y qui explique X donc 43% qui ne
sont pas expliqus . donc dautre variable qui explique les
ventes a part les promotions. Cest pour ca on faire appel a une
analyse de la variable a plusieurs facteurs.

Avec le test Anova on ne peut pas observer les diffrences significatives


entre le diffrent niveau cest pour a on doit utiliser ce quon appelle
tests post Hoc.

Vous aimerez peut-être aussi