Pratiques Et Méthodes de Sondage (PDFDrive)
Pratiques Et Méthodes de Sondage (PDFDrive)
Pratiques Et Méthodes de Sondage (PDFDrive)
Marie-Eve Tremblay
Pierre Lavallée
Mohammed El haj Tirari
Pratiques et méthodes
de sondage
DUNOD
Les contributions «Une approche comparative pour ordonner les attentes des usagers selon leur importance»
par Marie-Ève Tremblay et Sylvain Végiard et «Estimation du taux d'emploi régional québécois chez les
personnes ayant une incapacité à l'aide du modèle de Fay-Herriot» par Éric Gagnon et Robert Courtemanche
sont reproduites avec l'aimable autorisation des Publications du
AVAm"-PROPOS
"D
o
C
D
Û
o
(N
O
■SZ
CT1
>-
CL
O
U
Table des matières
"D
O
C
=3
Û
o
(N
O
■SZ
CT1
>-
CL
O
U
iv Pratique et méthodes de sondages
"D
O
C
D
Û
o
(N
O
■SZ
CT1
>-
CL
O
U
Table des matières
"D
O
C
=3
Û
o
(N
O
■SZ
CT1
>-
CL
O
U
vi Pratique et méthodes de sondages
"D
O
C
D
Û
o
(N
O
■SZ
CT1
>-
CL
O
U
Avant-propos
l'estimation sur petits domaines des taux d'emploi régional québécois des
personnes ayant une incapacité. Dominique Place compare des estimateurs
composites destinés à VEnquête emploi en continu, une enquête trimestrielle
avec renouvellement partiel de l'échantillon chaque trimestre. Les estimateurs
composites tirent avantage de la corrélation entre les échantillons de chaque
trimestre. Louis-Paul Rivest présente l'ajustement de modèles multiniveaux à
des données d'enquêtes complexes. Il ajuste les poids de sondage afin
d'obtenir des estimations convergentes des paramètres des modèles. Dans le
même ordre d'idée, Monique Graf termine ce chapitre en discutant de
l'analyse de données compositionnelles dans le cadre d'enquêtes complexes.
Ces données ont la particularité d'être assujetties à une contrainte de somme
comme les parts budgétaires.
V
En terminant, je veux remercier l'excellent travail de Marie-Eve Tremblay
et Mohammed El-Haj-Tirari qui n'ont pas compté leurs heures pour la
s
réalisation de cet ouvrage. Remercions aussi Céline Ethier pour sa mise en
page des articles. Cet ouvrage est l'aboutissement du Colloque francophone
sur les sondages de Tanger. Soulignons la contribution du comité scientifique
1 ^
et du comité d'organisation à la préparation tant scientifique que logistique"
de cet événement. Les partenaires majeurs qu'ont été la Société française de
statistique et la Faculté des sciences juridiques, économiques et sociales de
Tanger méritent également tous nos remerciements. Enfin, nous remercions
les auteurs des articles qui ont participé en si grand nombre au colloque et qui
se sont pliés de bonne grâce à nos exigences éditoriales pour la publication de
cet ouvrage.
Pierre Lavallée
Président du Comité scientifique
Colloque francophone sur les sondages de Tanger
en développement : la démarche
1
Jean-Jacques DROESBEKE
1.1 Introduction
Les avis qui portent sur l'usage des méthodes d'enquête dans les pays en
développement sont souvent diversifiés. Pour certains, beaucoup de méthodes
parmi celles utilisées dans les pays développés sont inapplicables pour
diverses raisons (absence de bases de sondage, difficultés pour recueillir
l'information auprès des individus sélectionnés...). Pour d'autres, les méthodes
retenues ne sont pas appropriées. On évoque aussi l'impossibilité de traiter
valablement les données recueillies. Ces critiques sont-elles toujours
pertinentes ? Faut-il s'arrêter à ces diagnostics déprimants ou, au contraire,
tenter d'examiner cette question de façon plus constructive ? Plusieurs
éclairages peuvent guider l'analyse de ce problème. Celui que nous avons
choisi est d'ordre historique.
1 Université libre de Bruxelles, LMTD, CP 139, 50, Avenue F.D. Roosevelt, 1050
Bruxelles (Belgique). Courriel : jjdroesb@ulb.ac.be.
2 Pratique et méthodes de sondages
Il n'est pas dans notre propos de faire ici une nc présentation de l'histoire
' 2
des méthodes d'enquête et de sondage". Nous concentrerons davantage notre
vision de cette histoire sur les éléments dont nous aurons besoin ici.
Parmi les méthodes d'enquête connues du grand public, le sondage occupe
certainement une place de choix. 11 y a aussi le sondage exhaustif, appelé
communément recensement, dont nous parlerons évidemment. Mais l'histoire
de la statistique nous apprend que deux autres approches méritent aussi notre
attention : la méthode du multiplicateur et la monographie. Ces quatre
méthodes ont-elles toutes été utilisées dans les pays en développement ?
L'histoire de ces méthodes peut-elle éclairer profitablement un tel usage ?
Nous tenterons de donner quelques éléments de réponse à ces questions. Mais
pour ce faire, nous croyons devoir d'abord rappeler brièvement quelques
étapes importantes de cette histoire.
1.2.1 Le recensement
2 Voir, par exemple, Antoine (2005), Droesbeke et Tassi ( 1997) ou encore Affichar
(1987).
3 La plupart des écrits traitant de ce sujet nous indiquent que les premières traces de ces
relevés remontent à la civilisation de Sumer (5C-2C millénaires avant notre ère).
1. Histoire et contexte des sondages 3
population souhaités par les rois et empereurs, mais aussi soutenus par des
motivations religieuses (le contrôle de la « coloration religieuse » vient
s'ajouter aux autres critères évoqués plus haut).
A dater de cette époque, le dénombrement des peuples (à propos duquel
Vauban a proposé en 1686 une Méthode génémlle et facille pour le réaliser)
est devenu un outil de gestion publique fort prisé. Colbert a aussi fortement
contribué à ce mouvement, tant en France que dans ses colonies. C'est ainsi
que7 « le premier relevé d'habitants, au Canada, se rapportait à la fondation
s
de Port-Royal, dans la nouvelle Ecosse, en 1605. On dispose encore d'autres
relevés, dont celui datant de la fondation du Québec, en 1628. En 1663, la
population de la Nouvelle-France est évaluée à 2 500 habitants, dont 800 à
Québec. Mais le premier recensement nominatif des temps modernes est
entrepris au Canada en février-mars 1666. Il donna 3 215 habitants, répartis
selon le sexe, l'âge, l'état matrimonial, la profession ». Avec un tel passé, on
ne s'étonnera pas du fait que le Canada ait développé une expertise statistique
aussi performante que celle qu'on lui connaît actuellement !
Mais si la France a accordé en ce XVIIe siècle une attention croissante aux
dénombrements, l'Angleterre, de son côté, s'est tournée vers une nouvelle
méthode qui va connaître un certain succès : Varithmétique politique, dont le
nom est tiré du titre d'un ouvrage publié par un personnage haut en couleurs,
William Petty8. Nous la présenterons brièvement ci-dessous sous le nom plus
explicite de méthode du multiplicateur.
Chacun sait que le XIXe siècle fut propice au retour généralisé des
recensements et que le XXe lui accorda une attention particulière à tous les
niveaux (gestion, formation des enquêteurs...). Nous n'y reviendrons pas ici.
1.2.3 La monographie
Recenser, c'est bien ! Mais on ne peut le faire que pour étudier des faits
généraux, des caractéristiques certes intéressantes, mais dont l'analyse n'est
pas fine. Par contre, si l'on se demande comment les individus passent leur
temps au cours de la journée ou comment vivent les pauvres, il est difficile de
recourir à un recensement pour répondre à ces questions. Il vaut mieux alors
analyser un nombre réduit d'individus pour avoir une analyse approfondie.
Mais comment choisir correctement cet ensemble d'individus ? Un homme va
avoir une idée au début du XIXe siècle : « Rien de tel que de recourir à des
réseaux de familiarité ». Cette idée vient à l'esprit de Pierre Guillaume
Frédéric Le Play (1806-1882) qui veut décrire les habitudes de vie des
ouvriers dans cette Europe qui s'ouvre à l'industrialisation. Il va examiner ce
problème en choisissant des ouvriers « typiques » désignés par les notables
des villages et décortique en détail leur existence10. De tels « échantillons »
seront bien sûr fortement critiqués par les adeptes des sondages aléatoires,
mais il ne faut cependant pas tenter de comparer des démarches
incomparables. Les objectifs ne sont pas identiques, la façon d'interpréter les
résultats de l'étude non plus.
1.2.4 Le sondage
eu une structure instable. Son histoire est essentiellement dessinée par des
mouvements migratoires qui ont fait cohabiter de façon plus ou moins
pacifique des groupes ethniques divers parmi lesquels les Bantous sont
probablement les plus connus. Des royaumes et des empires se sont succédés
au cours du temps, jusqu'à la dernière partie du XIXe siècle. Deux hommes
ont changé le cours des choses. Le premier est Léopold II (1835-1909), fils du
premier roi des Belges Léopold I, qui succéda à son père en 1865. Dès 1860,
il rêvait de posséder une colonie, comme toutes les puissances qui entourent
son pays. Après de nombreuses et vaines tentatives, un homme lui a permis de
satisfaire cette envie : le journaliste et explorateur britannique Henry Morton
Stanley (1841-1904) qui s'est rendu célèbre en 1871 pour avoir retrouvé sur
les rives du Lac Tanganyika David Livingstone, un autre explorateur porté
disparu depuis 1866. Après avoir exploré l'Afrique équatoriale jusqu'en 1878,
Stanley accepta de travailler pour Léopold II qui vit dans le bassin du Congo
un endroit propice pour créer cet état dont il rêvait. Stanley a installé une série
de comptoirs commerciaux le long du fleuve Congo pour le compte de ce
dernier. 1884 est une année cruciale pour Léopold 11 : une conférence
internationale qui se tient à Berlin lui attribue la possession d'une colonie
dont la surface correspond à une grande partie de l'Europe actuelle. Le
monarque reçut ainsi une «colonie privée» qu'il conserva jusqu'en 1908,
année durant laquelle il céda la souveraineté du Congo à la nation belge12.
Celle-ci la conserva jusqu'à la proclamation de l'indépendance du Congo, en
1960.
Deux enquêtes réalisées pendant cette période retiennent notre intérêt. La
première a été réalisée dans les années 1955-1957 et concerne une enquête
sociodémographique par sondage13. La deuxième enquête est un peu plus
contemporaine (1959) et porte sur une étude de l'emploi du temps du paysan
dans un village Zande du nord-est du Congo14. Que peut-on dire de ces deux
enquêtes ?
Commençons par la première. A l'époque, le Congo était composé de six
provinces, 23 districts, 135 territoires. Ces derniers étaient eux-mêmes divisés
en circonscriptions, groupements de villages, villages et petits centres. Pour
chaque territoire, on disposait pour chaque village du nombre d'habitants, de
l'appartenance tribale du village, de la liste des centres mixtes et de la
fonction économique de chaque centre. En général, chaque territoire avait un
chef-lieu pour lequel on disposait de fichiers d'habitations. On possédait aussi
des cartes assez complètes des territoires avec des plans de ville.
A partir de ces informations, trois strates par territoire ont été constituées
(localités rurales, localités urbaines et localités mixtes). Les localités de
chaque strate ont elles-mêmes été ventilées selon trois critères (la tribu, le
quartier et l'activité économique).
Les enquêteurs disposaient d'un recensement administratif récent (il existait
à l'époque une forte structure administrative au Congo). Leur volonté était
d'une part de vérifier la qualité de ce recensement et d'autre part de poser des
questions complémentaires. Disposant d'une base de sondage jugée comme
étant correcte, s'appuyant sur une équipe d'enquêteurs autochtones bien
acceptés sur le terrain et possédant un centre de traitement des données bien
organisé, les responsables de l'enquête ont dès lors procédé à un sondage
stratifié avec des taux de sondage par strate variant entre 10% et 15 %15.
Cette enquête par sondage présentait à coup sûr des qualités qui la rendaient
crédible.
La deuxième enquête que nous avons retenue s'apparente davantage à une
monographie16. Elle avait pour objectif d'analyser très finement la population
d'un petit village (Fuladu) d'une trentaine d'habitants. La manière dont elle a
été menée repose sur des choix clairement exprimés, avec un souci de la
précision dans le protocole d'enquête et une clarté dans la présentation des
résultats qui méritent d'être signalés, même si le recours fréquent à la
comparaison de pourcentages peut sembler excessif. Ici aussi, l'intervention
d'enquêteurs autochtones a contribué au bon fonctionnement de l'enquête.
Ces deux exemples illustrent clairement la possibilité de mener dans des
conditions globalement acceptables des enquêtes basées sur un sondage (ici
en complément d'un recensement) ou sur une monographie dans un pays en
développement. En revanche, il existe aussi des extrapolations dont on aurait
pu se passer. Un exemple flagrant est lié à l'usage d'un coefficient
multiplicateur fantaisiste.
En 1885, Stanley a publié The Congo and thefounding ofhisfree state dans
lequel il racontait ses missions pour Léopold IL II s'est rendu compte qu'il lui
était absolument nécessaire d'y mentionner une estimation du nombre
d'habitants de ce nouvel état et, pour y arriver, il recourut sans le savoir à la
méthode du coefficient multiplicateur. Il a estimé dans son ouvrage avoir
observé environ 806 000 habitants sur les rives situées de part et d'autre du
fleuve et de certains de ses affluents sur lesquels il a navigué. Après avoir
calculé que ces rives s'étendent sur 2 030 milles, il prit une hypothèse de
travail selon laquelle les habitants qu'il avait observés provenaient d'un
village situé au maximum à 10 milles de la rive. Connaissant la superficie
totale du pays, une petite règle de trois lui fit écrire que la population totale
était de 42 608 000 habitants. Ce nombre allait devenir une référence pour les
spécialistes, surtout anglo-saxons. Cet ouvrage fut traduit en français par
Gérard Harry à Bruxelles, au siècle suivant. Sans être un grand mathématicien.
ce dernier s'aperçut d'une petite erreur de calcul de Stanley. Pour arriver aux
2 030 milles que représente la longueur des rives où se trouvaient les
populations locales, il avait simplement multiplié par 2 (il y a en effet 2 rives
de part et d'autre d'un cours d'eau) la distance totale parcourue par son
bateau : 1515 milles. Harry se rendit compte que 2 fois 1 515 ne valait pas
2 030, mais bien 3 030. Et comme le dit si gentiment Stengers (2007) dans son
ouvrage, « discrètement, sans un mot d'avertissement au lecteur, le traducteur
rectifie le calcul de Stanley pour aboutir ainsi à une population de
27 694 000 habitants », ce deuxième chiffre devenant dès lors la référence
dans les pays de langue française. De nombreux ouvrages ont cité ces
estimations, parfois la première, parfois la seconde selon qu'on avait lu la
version originale du livre de Stanley ou sa traduction. L'histoire aurait pu
rester anecdotique si en 1999 n'avait paru un best-seller d'Adam Hochschild
dont le titre est évocateur : Les fantômes du roi Léopold II. Un holocauste
oublié11. Un document filmé a même été tiré de ce dernier, produit par la BBC
et diffusé sur les petits écrans avec un certain succès. L'effet aurait peut-être
été moins ravageur si la différence entre population en 1885 et population au
début du XXe siècle n'avait pas été basée sur l'estimation initiale de Stanley !
Il faut reconnaître que la disparition de près de 15 millions d'habitants due à
une erreur de multiplication, ce n'est pas si fréquent !
1.5 Conclusions
Il est certain que les leçons du passé sont toujours utiles quelle que soit la
nature du pays dans lequel on désire mener des enquêtes. Les pays en
développement n'échappent pas à cette règle. Rien ne sert d'appliquer une
méthode inapplicable si les conditions menant à la fiabilité de la procédure ne
sont pas réunies. Plutôt que de vouloir à tout pris utiliser une méthode
d'enquête inappropriée, il vaut mieux se tourner vers des approches adaptées
aux conditions dans lesquelles on travaille, comme par exemple celle
proposée par Dureau, Barbary, Michel et Lortic (1989).
BIBLIOGRAPHIE
Grande Dépression
18
Emmanuel DIDIER
C'est peu dire que la Grande Dépression provoquée par le krach de 1929 a
bouleversé les États-Unis. Ce ne fut pas seulement une crise économique, ni
même une crise sociale, mais aussi une profonde crise d'identité. Les acteurs
d'alors étaient nombreux à craindre de voir jusqu'au caractère démocratique
de la Nation remis en cause. Les fermiers, symboles d'autonomie
individuelle, étaient minés et contraints de quitter leur terre ; les ouvriers,
auparavant fer de lance du capitalisme libéral, formaient des hordes de
chômeurs ne vivant plus que de charité et commençaient à se retourner,
parfois très violemment, contre leurs employeurs ; les capitalistes, exemples
vivants de la liberté d'initiative individuelle, se défenestraient plutôt que
d'affronter la faillite ; enfin, on voyait ça et là, des villes élire des maires
socialistes, des administrateurs vanter les systèmes politiques expérimentés en
Italie ou en URSS. Bref, le changement causé par la Dépression semblait
menacer la nature même de la Fédération (Didier, 2009).
lorsqu'elle se dédouble en, d'une part, une partie d'elle-même qui se donne à
voir - la population dans notre cas, le corps pour la personne - et une autre
partie qui observe - ici l'administration et pour une personne ce serait son
regard - par l'intermédiaire d'une tierce entité placée à distance et qui
refléterait ainsi une image de la première pour l'aperception de la seconde -
le miroir pour une personne, les sondages dans notre cas. Est-ce le modèle qui
s'applique ici ? Nous allons mettre en évidence trois transformations très
profondes qui ont été nécessaires pour donner naissance aux sondages, et
nous verrons si le résultat final est conforme à ce modèle de réflexivité.
2.1 Théorie
Pour que les sondages puissent jouer leur rôle d'outil réflexif pour
l'administration, il a fallu d'abord en établir la théorie. Cette méthode avait
été présentée pour la première fois à la communauté des statisticiens par
Anders Kiasr, le directeur du Bureau de statistique de Kristiana (aujourd'hui
Oslo) en 1895, lors de la session de Berne de l'Institut International de
Statistique, le plus éminent regroupement de statisticiens d'État à l'époque.
Les sondages n'ont donc pas été, à proprement parler, inventés en Amérique.
Mais Kiasr n'obtint que peu d'effets immédiats et sa méthode fut ensuite peu
utilisée, puis assez vite oubliée - au moins dans son pays. De sorte que
lorsque l'administration américaine s'en est emparée pendant les années 1930,
elle a dû en pratique les réinventer.
Il y avait cependant une ancienne pratique administrative locale des
statistiques, principalement au ministère de l'Agriculture, très différente des
sondages d'aujourd'hui, mais qui reposait aussi sur un échantillon de
« Correspondants » remplissant des questionnaires. La réinvention des
sondages par l'administration américaine revint donc aussi à réformer
d'anciennes pratiques.
Il faut préciser, à cause de leur célébrité contemporaine, que ces sondages
réinventés par l'administration ne sont pas des « sondages d'opinion » comme
on l'entend à tort le plus souvent aujourd'hui en France. Certes, ces derniers
ont été mis au point peu avant 1936 par George Gallup et d'autres, ce qui leur
permit de prévoir la réélection de Roosevelt et de jouer un rôle important
pendant la période qui nous intéresse. Mais, il se trouve que ce ne sont pas ces
sondages-ci, apanage des entreprises privées principalement, que l'administration
a utilisé car ils reposent sur la méthode célèbre des quotas, dont les
administrateurs doutaient très profondément.
En fait, l'innovation théorique réalisée par l'administration fédérale fut de
parvenir à articuler extrêmement solidement la notion de représentativité à la
théorie mathématique des probabilités. La représentativité existait bien
entendu déjà dans une démocratie comme l'Amérique, mais elle désignait
initialement une relation de nature politique, la représentation démocratique
1. Histoire et contexte des sondages 13
2.2 Population
2.3 Politique
2.4 Conclusion
début de la crise. C'est dire comme ils ont été l'un des grands instruments de
réflexivité de l'Amérique pendant le New Deal. Pour ressaisir de gros êtres
comme l'Amérique, on peut ainsi se fier à ceux qu'ils mettent eux-mêmes en
place pour être réflexifs.
Mais la réflexivité qu'ils proposent diffère dès l'abord de façon importante
du modèle que nous avons esquissé dans cette introduction. La principale
différence réside dans la distance séparant l'Amérique qui se reflète et l'outil
de cette réflexion. En effet, contrairement à l'esquisse dressée initialement,
les sondages ne se trouvent en aucune façon à distance de l'Amérique ; au
contraire, ils en font très intimement partie, ils en sont devenus un des
éléments constitutifs.
Autrement dit, la réflexivité nous apparaît non comme une certaine façon
d'observer une image, mais plutôt de faire tenir ensemble un grand nombre
d'éléments initialement éparpillés, et parmi lesquels on compte l'instance
d'aperccption et l'instance aperçue, ainsi que l'instrument grâce auquel elles
sont reliées. Comme l'a si bien dit Alain Desrosières, la question qui se pose
est de savoir comment faire quelque chose qui se tient, ce qui n'a rien à voir
avec l'idée de reflet ou de miroir (Desrosières, 1993). La réflexivité
n'apparaît pas comme un type de contemplation passive, mais comme une
façon active de se ressaisir, c'est-à-dire de rattacher les morceaux. Ce
mécanisme est d'ailleurs assez proche de l'expérience individuelle de la
réflexivité : celui qui se demande qui il a le sentiment d'être éparpillé et
cherche en fait à se ressaisir pour repartir de l'avant ; autrement il ne s'agit de
rien d'autre que de narcissisme. Ainsi, pour le dire d'un seul mot, la
réflexivité d'un être gigantesque comme l'Amérique ressemble moins à un
reflet qu'à une certaine prise de consistance.
BIBLIOGRAPHIE
réflexion
19
Hasna Amina KADRI-MESSAÏD
3.1 Introduction
Les changements que vit la société algérienne depuis plus de deux décennies
ont un impact direct sur les pratiques de sondage ; il s'agit de l'ouverture sur
l'économie de marché qui est un élément non négligeable justifiant la
redynamisation du secteur privé national et l'apparition d'opérateurs
économiques étrangers, il y a également les événements politiques qui ont
engendré une nouvelle vision de la communication du fait des nouveaux
espaces d'expression tels que les associations par exemple. L'engagement de
l'Algérie au sein de l'économie de marché n'est cependant pas l'aspect
fondamental qui retient notre attention, dans la mesure où le sondage en tant
qu'outil quantitatif de recueil de l'information pose problème en tant que tel.
Cette préoccupation est d'ailleurs évoquée depuis quelques années par les
chercheurs en sciences sociales qui ont tendance à s'éloigner, depuis les
années 80, des enquêtes à caractère quantitatif au profit des enquêtes à
caractère qualitatif au motif que certains thèmes ne peuvent pas être soumis à
la quantification.
La problématique qui sous tend cette réflexion est relative à la fonction
remplie par le Sondage en Algérie : peut-il être considéré comme un moyen
de communication et d'information à l'instar de ce qui prévaut dans les pays
développés où l'information a tendance à être démocratisée, ou remplit-il une
autre fonction compte tenu des conditions spécifiques de son émergence ?
Peut-il être considéré comme un outil fiable du point de vue de son contenu
par rapport à notre réalité sociale, sachant que sur le terrain interviennent
aussi bien des bureaux d'études privés algériens que des bureaux étrangers ?
Est-il possible de donner du sens à une même question posée à des personnes
vivant dans des sociétés différentes ? le cas des études de marché est édifiant
dans ce cadre, à travers une question classique telle que : « achetez-vous
fréquemment ce produit ? » ou encore « parmi ces produits lequel préférez-
vous ? », il est clair que la compréhension et l'interprétation de la question
sont différentes compte tenu d'un certain nombre de caractéristiques telles
que la différence du pouvoir d'achat, le modèle de consommation, ou
La pratique des sondages est donc nouvelle en Algérie, ils étaient inexistants
durant la période de l'économie centralisée, car cette pratique s'opposait à
l'idéologie socialiste bâtie sur le principe d'une démocratie orientée par le
pouvoir étatique et représentée au niveau des différents espaces - publics et
professionnels - par des organes permettant le dialogue, l'expression et la
concertation.
Les années 90 sont la période au cours de laquelle se développa la tendance
démocratique, ce fut aussi la période de l'introduction des nouvelles
technologies de l'information et de la communication (NTIC), qui peu à peu
vont gagner le milieu du travail et les foyers (avec Internet et la parabole). Ce
contexte, va soumettre le citoyen algérien à un double apprentissage : celui de
la liberté d'expression et celui des technologies de l'information et de la
communication (TIC) qui vont indéniablement modifier sa manière de voir et
de concevoir la réalité. C'est dans ces conditions que les sondages vont faire
leur apparition. Toutefois, après une décennie la pratique des sondages, en
lien avec les élections ou avec l'opinion publique de manière générale, n'est
• r • r r20 * ' ^
pas encore banalisée dans notre société" Ceci se vérifie à travers le nombre
d'intervenants dans ce domaine qui est loin d'être important en Algérie
20 Selon Alain Garrigou dans l'Ivresse des sondages. Le Cerf Ed. 2006, il y aurait plus
d'un millier de sondages politiques par an en France.
20 Pratique et méthodes de sondages
Les thèmes les plus fréquents qui intéressent les sondages portent surtout
sur les médias, puis les sondages récurrents sont ceux qui portent sur les
habitudes de consommation et les intentions d'achat, ils sont utilisés dans une
démarche marketing. Si les grandes entreprises publiques figurent parmi la
liste des commanditaires (l'entreprise Mobilis, d'Algérie Télécom ou encore
l'entreprise Sonelgaz22), ce sont surtout les firmes multinationales installées
ou qui comptent s'installer en Algérie qui expriment une plus large demande
dans ce domaine. Elles interviennent soit en amont de l'élaboration d'une
stratégie, dans un but prospectif de pénétration ou d'extension (c'est le cas le
plus fréquent, il concerne les firmes activant dans le domaine de l'industrie
automobile et de la téléphonie mobile à titre d'exemple), soit en aval dans le
but d'évaluer d'une action déjà menée.
Les entreprises nationales par contre (privées ou publiques) ont un faible
intérêt pour les sondages, ceci s'explique d'une part par l'absence de
traditions dans le domaine du marketing (beaucoup d'entre elles possède un
service commercial mais pas toujours avec une fonction marketing autonome
et clairement structurée), et d'autre part par le nombre important d'entreprises
• 73 •
relevant du secteur de la petite et moyenne entreprise (PME)" et qui ne
possèdent pas les moyens pour financer ce type d'action.
Par ailleurs, il est relevé un vide juridique en matière de réglementation des
pratiques de sondage, le marché des sondages émergent a poussé l'État à
21 Tous ne possèdent pas de site Web, et lorsque c'est le cas le contenu n'est pas riche et il
n'est pas mis à jour.
22 Electricité et gaz.
23 320 000, avec 97 % de Très Petites Entreprises ( I à 5 salariés).
1. Histoire et contexte des sondages 21
24 En fait l'idée d'une loi sur les sondages a vu le jour depuis l'année 2002.
25 Ceci, malgré la préparation des enquêteurs qui est assurée dans ce domaine.
22 Pratique et méthodes de sondages
• • • • • 26
pourquoi les jeunes qui activent dans le cadre informel" et ne percevant pas
un salaire conventionnel ont une idée différente de « l'occupation » et ne se
déclarent pas de ce fait comme étant occupés.
Même si toutes les thématiques ne sont pas aussi sensibles que l'exemple
ci-dessus, il n'en demeure pas moins que les bureaux de sondage privés ont
saisi cette difficulté, ils mettent en œuvre à l'heure actuelle une autre
technique pour recueillir les opinions et attitudes des citoyens de manière
générale et celles des consommateurs de manière particulière : en l'occurrence la
technique qualitative dénommée « focus groupe » qui permet l'échange et la
confrontation comme conditions d'une mise en situation sociale de
l'expression d'une opinion.
3.4 Conclusion
BIBLIOGRAPHIE
26 L'économie informelle a connu une croissance importante ces dernières années, selon
les dernières estimations, l'emploi informel représenterait 40 % de l'emploi hors
agriculture.
1. Histoire et contexte des sondages 23
d'opinion
27
Hélène Yvonne MEYNAUD
si le blanc, référence implicite, en avait perdu son statut de couleur. Or, deux
chercheurs de l'université de Californie démontrent que la manière avec
laquelle des individus (ou des observateurs) perçoivent leur propre « race »
dépend de leur statut social. A partir d'une étude longitudinale sur un
échantillon représentatif des Etats-uniens, ils constatent que les individus au
chômage, incarcérés ou appauvris sont plus susceptibles d'être vus et
identifiés comme « noirs » et moins susceptibles d'être vus et identifiés
comme « blancs », indépendamment de la manière avec laquelle ils étaient
classés ou identifiés auparavant. Ce qui, selon les chercheurs, prouve que la
« race » n'est pas un attribut individuel fixe, mais plutôt un marqueur de statut
modifiable.
La perception subjective d'un phénomène se heurte parfois au calcul
rigoureux. La mesure de l'évolution du niveau de vie, techniquement juste,
peut être diamétralement opposée à la perception subjective (voire objective)
d'une dégradation des conditions d'existence. Si entre 1996 et 2007, les hauts
revenus ont moins progressé en France (14,7 %) que les bas revenus (21 %),
il reste que 14,7% de 10 000 euros, cela fait bien plus que 21% de
1 000 euros. Le chiffre sera juste, mais sera distinct de la perception.
L'opinion publique, telle que mesurée par divers sondages et indicateurs, a la
conviction que les prix ont fortement augmenté. Si l'indice d'ensemble des
prix (IPC) n'a pas forcément grandement augmenté, ceux des produits de
première nécessité ont fortement crû. Cherchez l'erreur, qui ne peut résider
dans la seule subjectivité des acheteurs et acheteuses. Les statisticiens de
l'Insee ont donc commencé à mettre en avant une mesure du revenu
réellement disponible pour une consommation dégagée des dépenses
contraintes.
souhaitent circuler vite, et celui de ceux qui habitent les territoires traversés,
pour qui le niveau de bruit et de nuisances va s'accroître sans forcément qu'ils
profitent de l'équipement construit.
Dans un deuxième temps, il peut être utile de déterminer quels sont les
segments de l'opinion publique qui sont résolument opposés à tel ou tel choix,
et quels seraient les corps constitués les plus à même d'entamer un débat avec
eux. C'est alors que les données sur l'environnement et sur la société prennent
une importance croissante aux côtés de données classiques techniques ou
économiques. On passe de l'analyse d'objets techniques à l'analyse de
données numériques (l'opinion publique) plus difficile à saisir, où il s'agit de
prendre en compte des phénomènes considérés par les univers techniciens
comme subjectifs voir irrationnels, rarement au courant de leur propre
subjectivité ou rationalité. Les outils mathématiques puissants, seuls capables
de traiter une telle information diverse et volumineuse, sont alors mis à la
disposition du travail sociologique. Les conférences de consensus
représentent une autre alternative de mise en débat.
Le « risque d'opinion » est fort pour les industriels qui commercialisent des
produits qui tiennent par la puissance de leur marque. Il suffit parfois qu'un
échantillon de produit soit reconnu comme contenant un produit nocif, qu'un
seul acte de travail soit discutable ou amoral, pour que son image et son usage
s'effondrent. C'est dire l'importance des enquêtes d'opinion comme pare-feu.
En même temps, il faut se rappeler à quel point l'opinion publique est un
artefact et l'immense prudence avec laquelle il faut analyser les réponses à
des questions d'enquêtes et de sondages.
Le type d'étude réalisée varie en fonction de l'interlocuteur. Le directeur de
communication va procéder à des sondages qui diront si son produit et son
organisation sont plébiscités. Un commercialisateur définira le produit que
des personnes souhaitent acheter, vérifiera si son usage est satisfaisant, testera
un service rendu, s'intéressera à la relation au client dans le cadre de la
dématérialisation. Des contre-pouvoirs, comme les associations de
consommateurs, procéderont à leurs propres enquêtes, et leurs publications
ont un poids déterminant. D'autres experts et journalistes déconstruiront les
chiffres, comme le fait l'association Pénombre, le site Acrimcd, ou encore la
chronique Désintox du journal Libération, où tel personnage a pu être qualifié
de « sériai truqueur statistique ».
Autres outils, les « benchmarks », études comparatives, sont très prisées, mais
sujettes à caution. Les consultants qui procèdent à cette démarche reçoivent, à
bon compte, des données précieuses en provenance de nombreux industriels,
à qui ils proposent un classement des uns par rapport aux autres. Ce savoir
pourra être revendu sous des formes diverses. Cette démarche s'apparente
26 Pratique et méthodes de sondages
BIBLIOGRAPHIE
Béroud, S., et Meynaud, H.Y. (2002). Opinion publique. Les Robins des bois
de l'énergie, (Éd., Cherche-Midi), 5, 133-148.
Meynaud, H.Y. (2009). Comptage « ethno-racial » : solution ou racialisation.
Dans La part de l'étrangère : travail & racisme, (Éd., Le bord de l'eau),
Chapitre 5, 290 pages.
Penner, A.M., et Saperstein, A. (2008). How social status shapes race.
Proceedings of the National Academy of Sciences of the United States of
America, vol. 105, no50, 19628-19630.
Salmon, C. (2007). Storytelling, la machine à fabriquer des histoires et à
formater les esprits. La Découverte, Paris, 240 pages.
Data, L. (2009). Le grand trucage. Comment le gouvernement manipule les
statistiques. La Découverte, Cahiers libres, Paris.
Ray, D. (2004). Mesure de la satisfaction des clients : pratiques et besoins
actuels des entreprises, positionnement des offres et principaux enjeux
méthodologiques. Revue Française de Marketing, numéro spécial sur
« satisfaction et fidélisation », n0197, 7-21.
Dujarier, M.-A. (2008). Le travail du consommateur. De McDO à eBay :
comment nous coproduisons ce que nous achetons. La Découverte, Paris.
28 Pratique et méthodes de sondages
1
Marie-Ève TREMBLAY et Sylvain VÉGIARD
1.1 Introduction
Le groupe des répondants auquel on attribue une paire donnée peut être vu
comme un échantillon aléatoire d'usagers provenant de la population visée.
Ainsi, une estimation de la proportion des usagers ayant jugé l'item A plus
important que l'item B, applicable à l'ensemble de la population visée, peut
être obtenue en ne retenant que les répondants ayant eu à se prononcer sur la
paire A-B. Évidemment, cela est possible en raison de la randomisation
effectuée initialement et du traitement de la non-réponse adéquat réalisé.
Pour chacune des 807 paires ij présentées aux répondants, on peut donc
procéder à l'estimation de la proportion de verdicts favorables à l'item /
versus l'item /, c'est-à-dire la proportion d'usagers ayant jugé l'item i plus
important que l'item j. On note cette proportion p/j. Plus formellement, la
formule d'estimation de chaque est la suivante :
n n
ij ji
u v
X t . ,a X
k=\ k^l
3 Par exemple, il est difficile de choisir l'item le plus important entre « le respect de la
confidentialité des renseignements » et « le souci d'aménager des locaux qui assurent la
confidentialité des échanges ».
32 Pratique et méthodes de sondages
où
- wk = poids d'échantillonnage du répondant k ;
- y-fç = variable valant 1 si l'item i est jugé plus important que l'item
j ; 0,5 si les deux items sont jugés d'importance égale et 0 si l'item j
est jugé plus important que l'item i pour les paires présentées dans
l'ordre ij pour le répondant &, & = 1, 2, ;
- yjik =variable valant 1 si l'item i est jugé plus important que l'item
j ; 0,5 si les deux items sont jugés d'importance égale et 0 si l'item j
est jugé plus important que l'item i pour les paires présentées dans
l'ordre ji pour le répondant k, k = \, 2, n- ;
- rijj = nombre de répondants ayant eu à juger la paire ij présentée
dans l'ordre ij ;
- n- = nombre de répondants ayant eu à juger la paire ij présentée
dans l'ordre ji.
Supposons que pik et pkj valent toutes les deux 1. Cela voudrait dire que
les usagers sont unanimement d'accord pour que, dans le classement, l'item i
soit situé avant l'item k et que l'item k soit situé avant l'item j. Dans ce cas,
on peut déduire que l'item i devrait être situé avant l'item j, ce qui suggère
que Pjj devrait valoir 1. De même, si pik et pkj valent toutes les deux 0, alors
Pij devrait valoir 0. Pour les proportions, plus réalistes, situées entre 0 et 1,
on a que, pour tout item k, l'estimation de p- imputée à partir des
estimations de pjk et pkj est donnée par :
«r
X Pik Pkj
' imp _ k<£{i, j};k=\
PU „imp
Hiïj
A J^/
1.5 Conclusion
BIBLIOGRAPHIE
quel travail ?
Ce texte présente une première étape de description des états de santé des
personnes en âge de travailler (Célérier, 2008). Sur ce point, les enquêtes
statistiques produisent des résultats convergents : les actifs en emploi sont, à
âge équivalent, en meilleure santé que les inactifs ou les chômeurs, et l'état de
santé est d'autant meilleur que Ton s'élève dans la hiérarchie des catégories
socioprofessionnelles (PCS). Nous cherchons à préciser ces résultats généraux
en identifiant des « situations santé-travail » articulant des caractéristiques
professionnelles et de santé des individus. Autrement dit, nous testons la
capacité discriminante de ces deux critères associés pour décrire une
population représentative en vérifiant la pertinence statistique et sociologique
des « situations » ainsi mises au jour.
L'exercice mobilise les données de l'enquête transversale Evénements de
vie et santé (EVS, Direction de la recherche, des études, de l'évaluation et des
(18-65 ans) et aux âges de plus forte activité (25-55 ans) ; mobiliser d'autres
sources statistiques complémentaires en données de santé et plus riches en
matière d'emploi et reproduire l'analyse en ne retenant que les
caractéristiques de santé comme variables actives (Cavalin et Célérier, 2011).
BIBLIOGRAPHIE
Handicap-Santé en France
7
Françoise YAOUANCQ
Une pré-enquête téléphonique réalisée par les agents des directions régionales
a précédé l'enquête afin de vérifier que la structure était dans le champ de
l'enquête, obtenir l'accord de la structure, et récupérer le nom d'au moins un
correspondant, facilitant ainsi le travail des enquêteurs. Sur 2 300 institutions
ayant fait l'objet de cette pré-enquête, seulement 133 structures ont été
o
écartées dont huit pour refus. Les structures qui refusaient faisaient l'objet
d'un protocole particulier : les directeurs régionaux étaient sollicités pour
convaincre les établissements réticents.
Ces résultats s'expliquent par une communication importante mise en
œuvre afin de faciliter la collecte de l'enquête. De nombreux professionnels
de la santé, les directeurs des différents établissements, les responsables des
services enquêtés ont reçu un courrier les informant du déroulement de cette
enquête. Les différentes étapes et le calendrier y étaient présentés.
9 II s'agit par exemple si les personnes peuvent faire des courses, faire la cuisine au sein
de l'établissement. Ces questions évitaient de poser inutilement des questions qui
auraient été sans objet.
10 Le nombre de personnes tirées au sort était selon le type d'établissement de six ou huit
en métropole. Il était de neuf dans les DOM.
11 Ce questionnaire permet de récupérer des infonnations administratives comme la date
d'entrée dans l'établissement, le coût payé par la personne elle-même...
42 Pratique et méthodes de sondages
Les enquêteurs ont souvent réalisé plusieurs visites pour mener les
différents entretiens qui duraient en moyenne une heure par individu. Dans
certains cas, tous les questionnaires étaient réalisés le même jour.
Le questionnaire « données de cadrage » devait être récupéré lors d'une de
ces visites et saisi au domicile de l'enquêteur sous CAPI.
Le dispositif de cette enquête a été mis au point grâce à trois tests effectués
avec les enquêteurs de six directions régionales, chacune d'elle participant à
un seul test, afin de ne pas mettre en péril la collecte de l'enquête définitive.
Les structures sélectionnées dans les tests avaient toutes été prévenues
qu'elles pouvaient à nouveau faire partie du champ de l'enquête.
Le premier test est un test papier réalisé en novembre/décembre 2007 afin
de tester le questionnaire, mesurer le nombre de visites nécessaires, les durées
des visites auprès de l'établissement et les temps de passation du
questionnaire. Le bilan a fait apparaître qu'il était important de récupérer les
coordonnées des référents contactés à l'occasion du recensement des
communautés, de mettre en place un soutien psychologique et d'adapter le
questionnaire afin de prendre en compte les spécificités des populations
vivant dans les institutions choisies.
L'objectif du second test (avril/juin 2008) devait tester le protocole. Un
questionnaire réduit papier a été posé aux personnes tirées au sort. Les
enquêteurs ont montré les difficultés du protocole initial : les institutions
sélectionnées dans la base de sondage n'étaient pas toutes dans le champ de
l'enquête, conduisant ainsi certains enquêteurs à une charge de travail quasi
nulle. A la suite de ce test, le protocole a été modifié : la pré-enquête a été
ajoutée. Les enquêteurs ont aussi indiqué que les personnes référents pour le
recensement des communautés n'étaient pas les personnes à contacter pour les
besoins de l'enquête. Ceci a conduit l'équipe conceptrice à demander lors de
la pré-enquête les coordonnées d'un ou deux référents spécifiques.
• ■\ • • r • 12 r r r • r
Le troisième test (janvier/février 2009) a été réalisé sous CAPI. Le
protocole déterminé avec les enquêteurs après le second test a été validé. Il a
permis de tester le dispositif de formation de cette enquête et d'améliorer son
contenu pour répondre aux attentes des enquêteurs. Notamment, prendre
contact avec des institutions est totalement différent de ce qu'ils font
habituellement. Le test a aussi montré que le questionnaire devait encore être
adapté pour éviter de poser certaines questions sans objet13. Mais une
contrainte très forte a empêché de trop filtrer : le questionnaire devait être
comparable à celui de l'enquête réalisée auprès de personnes vivant en
logement ordinaire. Le questionnaire auto-administré14 destiné à la personne
apte à répondre a été abandonné en raison du très faible taux de réponse.
13 Par exemple : il a fallu filtrer le questionnaire pour ne pas poser les questions sur
l'alimentation quand la personne est alimentée par sonde.
14 Ce questionnaire auto-administré permettait de recueillir les consommations d'alcool et
de tabac, notamment.
44 Pratique et méthodes de sondages
Malgré ces difficultés, les résultats de collecte sont très bons. La synergie
entre tous les acteurs est à signaler : cette enquête a été l'objet d'un travail
d'équipe où chacun (enquêteur, agent des directions régionales, hiérarchie et
membres de l'équipe conceptrice) s'est investi pour aboutir aux résultats de
collecte suivants :
Sur 1 567 institutions15, 96 % ont accepté la totalité de la phase institutions,
1 % a accepté, mais refusé le questionnaire des données de cadrage, et 3 %
seulement ont refusé ou sont hors champ16.
10 020 individus ont été échantillonnés : 91 % des entretiens ont été réalisés
en totalité, 1 % des entretiens ont été réalisés, mais les données de cadrage des
individus n'ont pas été récupérées, 8 % sont des déchets. Parmi ces déchets,
44 % sont des refus provenant soit de l'individu s'il est apte, soit des tuteurs,
soit des parents si l'individu désigné est inapte à répondre. 21 % sont des
individus partis vivre dans un logement ordinaire.
Si le résultat global fait apparaître un taux de réponse moyen de 91 % quel
que soit le type de l'institution, des différences existent entre les types
d'établissements. Le taux de réponse est plus bas dans les établissements
psychiatriques, mais il est meilleur que celui généralement constaté dans ce
type d'établissements et meilleur que celui de la dernière enquête en 1998.
Les taux de réponse par type sont les suivants :
1. Établissements pour personnes âgées : 93 %.
2. Établissements pour adultes handicapés : 94 %.
3. Établissements psychiatriques : 83 %.
4. Centres d'hébergement et réinsertion sociale : 88 %.
Cette enquête a été très appréciée de tous les acteurs. Les institutions ayant
participé à l'un des tests et tirées au sort dans le champ de l'enquête ont
souligné les efforts faits pour prendre en compte les difficultés rencontrées
lors des tests. Elle restera gravée dans les mémoires de tous ceux qui ont
contribué à sa réalisation.
départements volontaires et
représentativité nationale
17
Séverine DOS SANTOS
18 Le rôle de la Cnil est de protéger l'individu contre tout usage abusif de données
informatiques le concernant.
48 Pratique et méthodes de sondages
logistiques et quantiles
19 20
Anastase TCHICAYA et Modou DIA
5.1 Introduction
5.2 Méthodes
5.2.2 Données
5.3 Résultats
Alors que pour les modèles quantiles, sur l'ensemble des modalités et sur
toutes leurs distributions, aucun coefficient n'est significativement différent
de zéro, à l'exception du voisinage immédiat du 8e décile pour les coefficients
du « quintile 1 » et du « quintile 2 » pour l'année 2005, ainsi que pour l'année
2007 au-delà du 8° décile pour les coefficients du « quintile 2 » et du
« quintile 3 », au voisinage immédiat du 6e décile pour le coefficient du
« quintile 4 » (cf. tableau 2.3).
5.4 Conclusion
BIBLIOGRAPHIE
Kilicarslan, A., Isildak, M., Guven, G.S., Oz, S.G., Tannover, M.D.,
Duman, A.E., Saracbasi, O. et Sozen, T. (2006). Démographie,
socioeconomic and educational aspects of obesity in an adult population.
Journal ofthe National Médical Association, vol. 98, n08, 1313-1317.
Sassi, F., Devaux, M., Church, J., Cecchini, M. et Borgonovi, F. (2009).
Education and obesity in four OECD countries. OECD Health Working
Papers, n046, 1 -46.
Koenker, R., et Hallock, K. (2001). Quantile régression: An introduction.
Journal of Economie Perspectives, 15, 143-156.
TEDS-M
6.1 Introduction
6.2 TALIS
6.3 TEDS-M
BIBLIOGRAPHIE
de l'échantillon et redressement
7.1 Le contexte
Les panels d'élèves ou d'étudiants complètent les données issues des fichiers
administratifs dans la mesure où ils permettent d'observer les parcours des
bacheliers, qu'ils soient ou non en formation, et quelle que soit cette
formation (y compris celles qui ne relèvent pas de l'enseignement supérieur -
comme des formations professionnelles ou artistiques- ainsi que les
formations dispensées dans le cadre de contrats de professionnalisation, par
correspondance ou à l'étranger).
Ils permettent par ailleurs de mettre en évidence, grâce aux données
recueillies, différents facteurs susceptibles d'influer sur l'orientation et les
parcours après le baccalauréat : le passé scolaire du bachelier, son
environnement familial, les conditions de son entrée dans l'enseignement
supérieur, les difficultés rencontrées et l'évolution de ses projets.
La base de sondage utilisée est l'ensemble des bacheliers des séries générales,
technologiques et professionnelles de la session 2008 (juin et septembre),
scolarisés en 2007-2008 dans un établissement public ou privé (sous contrat et
hors contrat) de France métropolitaine (soit 448 755 bacheliers). Les
bacheliers inscrits dans les départements d'outre mer, qui représentent 3 %
2. Enquêtes sur la santé et l'éducation 61
Sur les 12 000 bacheliers interrogés, 10 058 ont répondu à l'enquête (soit un
taux de réponse de près de 84 %). La démarche utilisée pour corriger la non-
réponse a été la même que dans les panels précédents. Après la première
interrogation, une analyse de la non-réponse par une régression logistique a
été réalisée afin de déterminer les variables (ainsi que les modalités associées)
expliquant le mieux répond/ne répond pas à partir des données disponibles
dans la base de sondage. La possibilité d'utiliser pour cette analyse des
variables telles que le contexte de scolarisation en terminale a permis de
corriger l'attrition dans les meilleures conditions. Les variables identifiées
dans l'analyse de la non-réponse sont : la série du baccalauréat, l'âge au
baccalauréat, le sexe, la mention, la catégorie socioprofessionnelle, le statut
de l'établissement de terminale (public/privé), la taille de la commune de
résidence de l'élève, la nationalité regroupée (français/étranger), le statut de
boursier et celui d'apprenti.
Le fichier des répondants a été redressé par calage avec la macro CALMAR
sur la population de référence en utilisant comme variables de calage les
variables précisées ci-dessus. Au final, les pondérations sont comprises entre
21,8 et 73 (voir tableau 2.7).
BIBLIOGRAPHIE
Lemaire, S. (2010). Que deviennent les bacheliers après leur bac ? Choix
d'orientation et entrée dans l'enseignement supérieur des bacheliers 2008.
Note d'information N010.06 série enseignement supérieur et recherche,
Paris, ministère de l'enseignement supérieur et de la recherche.
Lemaire, S. (à paraître en 2011). Les bacheliers S : des poursuites d'études de
plus en plus éclatées. Note d'information série enseignement supérieur et
recherche, Paris, ministère de l'enseignement supérieur et de la recherche.
2. Enquêtes sur la santé et l'éducation 63
8. Méthodologie de comparaison et de
l'enseignement secondaire
27
Souleymane OUEDRAOGO
8.1 Introduction
8.3.1 Méthodologie
On détermine la note moyenne des lycées de l'échantillon - qui est aussi une
estimation de la note moyenne de la ville X - par la moyenne arithmétique
simple des notes moyennes calculées des lycées sélectionnés. Formellement,
on a :
n
i x
n
X 7=1
1 "p _
n
p X=1
8.5 Applicabilité
8.6 Conclusion
BIBLIOGRAPHIE
le français en partage)
28
Kalbi Flavien ZONGO
Les variables d'études du PASEC sont les scores en début et en fin de cycle.
Leur nature impose à cibler la population scolarisée. Compte tenu de la
particularité de la première année (l'initialisation) et de la sixième année
(l'examen de fin de cycle), le PASEC a retenu les classes de 2e et de 5e année.
La population cible est constituée donc d'élèves de 2e et de 5e année du
Une seule base de sondage a été utilisée pour sélectionner l'échantillon et elle
est fournie par le ministère de l'enseignement de base et de l'alphabétisation
(MEBA), mais les données provenaient de la Direction du privé et de la
Direction des Études et de la Planification ; les informations contenues dans
la base concernaient l'année académique précédente ou dataient de deux ans.
Grâce au roh (rate of homogeneity) théorique fixé à 0,4 pour le PASEC VIII,
la taille l'échantillon retenue a été de 180 écoles. Soit 2 700 élèves par niveau
et 15 élèves par classe.
Les poids finaux du PASEC ont tenu compte seulement de la non-réponse des
écoles. La méthode de repondération a été utilisée pour traiter les non-
réponses totales et celle des imputations multiples pour les non-réponses
partielles. Les scores estimés sont pondérés conformément aux particularités
du plan de sondage, ce sont le score calculé pour les modèles d'analyse
multivariée ; le score calculé pour une mesure dans le temps, le cas échéant ;
le score utilisé pour les comparaisons internationales.
9.3.1 Avantages
- Le fait d'avoir un seul plan de sondage pour les deux niveaux est un
choix délicat : pour une école sélectionnée, lorsqu'une classe de 2e ou
de 5e année a moins de huit élèves, on recours à la jonglerie pour la
remplacer.
- Les ajustements n'ont pas tenu compte de la non-réponse des élèves,
alors le taux est significatif (5,1 % au niveau 5 et 8,8 % au niveau 2).
Les élèves perdus pourraient avoir des caractéristiques différentes des
autres. Cela est d'autant plus vrai car une valeur du roh fixée à 0,4
suppose une hétérogénéité non négligeable à l'intérieur des classes.
9.4 Recommandations
- la prise en compte des non-réponses des élèves vu que leur niveau est
disparate ;
- stratifier en tenant aussi compte des critères souvent disponibles ci-
après : le statut public/privé, localisation en milieu urbain/rural,
classe multigrade/simple.
BIBLIOGRAPHIE
du contenu
29
Ridouan CHIHEB , Ridwan FAIZI29, Abdellatif EL AFIA 29
et
30
Mohammed TIRARI
Notre objectif dans cet article est de présenter une nouvelle approche pour
améliorer les performances des apprenants. Elle est basée sur l'analyse des
tests d'évaluation, pour identifier les forces et faiblesses de chaque groupe
d'apprenants et leurs proposer un contenu adapté à leurs niveaux.
10.1 Introduction
L'identification des profils s'appuie sur l'analyse des résultats des différents
tests d'évaluation.
Pour le besoin de connaître le niveau de chaque apprenant, nous avons
conçu et développé une plateforme de génération aléatoire des tests à partir
d'une banque de questions. Une fois que les résultats des tests sont collectés,
ils feront l'objet d'une analyse factorielle suivie d'une analyse typologique
(classification hiérarchique ascendante) dont l'objectif principal est de classer
les apprenants dans des groupes relativement homogènes en fonction de
l'ensemble des scores obtenus dans chaque chapitre.
Partant du fait que notre démarche s'inscrit dans l'amélioration continue de
l'apprentissage en présentiel, par une adaptation du contenu pour chaque
profil d'apprenants, seuls les résultats du dernier test de chaque apprenant
feront l'objet d'une analyse détaillée. Enfin, pour résoudre le problème
d'adaptation de contenu, nous envisageons d'étudier les possibilités
d'extraction de l'information à partir des documents de référence provenant
du web ou développés par les chargés des cours.
Dans un contexte d'améliorer les performances des apprenants en formation
présentielle par la proposition de formation à distance, notre approche se
distingue par rapport à celle proposée par Durand (2010) en incluant de plus
l'identification des profils d'apprenants et par rapport aux travaux réalisés
dans Delestre, Pécuchet et Gréboval (1998) et Habieb, Tarpin et Prevot
(2003) qui traitent seulement l'adaptation d'un hypermédia pédagogique au
profil cognitif.
Il faut noter que l'objectif principal derrière les tests est seulement de
connaître le niveau des apprenants afin de les aider à surmonter leurs
difficultés dans l'apprentissage d'un contenu assuré dans la formation en
présentiel. Un test a été proposé aux étudiants de première année du cycle
d'ingénieurs dont voici un exemple des résultats obtenus pour quatre
chapitres d'un cours d'anglais.
72 Pratique et méthodes de sondages
alors être interprété à la lumière des variables qui sont grandement corrélées
pour ce facteur. Comme le montre la figure 2.2, on peut conclure que
l'apprenant 22 est le plus mauvais de tous, les individus 1, 11 et 14 sont ceux
qui n'ont aucune difficulté dans les quatre chapitres étudiés.
2-
J-
o-
i-
2-
3-
4- © 22
10.5 Conclusion
Afin d'atteindre les objectifs visés par notre projet, nous avons développé une
plateforme de génération aléatoire de tests, de collecte des scores des
apprenants, de préparation des données et d'identification des profils en
74 Pratique et méthodes de sondages
BIBLIOGRAPHIE
besoins
31 32
Wendnso Maria Sidonie GOUEM et Adama TRAORE
11.1 Introduction
son lien avec le décollage économique escompté. Les échecs rencontrés pour
accroître du point de vue quantitatif le niveau d'alphabétisation sont
également une autre source d'inquiétude, mais tout semble évoluer sans qu'on
ne puisse tirer de véritables enseignements. Aussi alphabétiser ne saurait être
une fin en soi, si alphabétiser ne repose pas sur des compétences techniques
réelles susceptibles d'assurer à son détenteur l'accès à la science et à la
technique universelle.
En effet, en a-t-on tiré des leçons pour engager une refondation en
profondeur du processus d'alphabétisation qui soit à la mesure des défis posés
par la taille de l'analphabétisme au sud du Sahara et particulièrement au
Burkina Faso ? Même si les financements n'ont pas atteint les niveaux
escomptés, c'est l'argument qui est récurrent en pareille circonstance, le peu
de ressources engagés l'a-t-elle été dans un esprit de recherche d'efficacité et
d'efficience ? Selon certaines analystes, la seule certitude est que le
réformisme semble être le jeu favori des acteurs autour du concept « faire »,
comme si cette seule syllabe était la seule responsable de notre
analphabétisme stratégique dans l'approche de la question de
l'alphabétisation : « laisser faire », « faire », « faire-faire », « faire-faire
consolidé », « faire ensemble », etc. Que n'a-t-on pas imaginé avec ce terme !
Dans le même sens, il convient de savoir par rapport à l'alphabétisation ce
qu'elle est et ce qu'elle n'est pas avant de s'interroger sur comment
l'accélérer. De la même manière, on ne peut pas accélérer quelque chose qui
s'ignore ou plutôt dont on ignore tout. Il faudra donc bien définir le concept,
circonscrire son champ, évaluer rigoureusement les besoins avant de se lancer
dans toute aventure stratégique. Au lieu de s'enfermer dans la magie du mot
« faire », il faut plutôt en sortir. A cet égard, une réforme de l'approche
comme celle qui est en cours présentement au Burkina Faso peut être une
propédeutique à toute politique future qui se veut prometteuse en Afrique.
Une personne est apte à lire et à écrire dans une langue quelconque lorsqu'elle
est capable d'interpréter et de transcrire les faits de la vie quotidienne dans
cette langue. Précisez la principale langue étrangère dans laquelle la personne
sait lire et écrire et la principale langue locale dans laquelle la personne sait
lire et écrire. Cependant, Pour s'assurer qu'un individu sait lire et écrire, on
occulte une dimension importante en se fiant aux déclarations du chef de
famille. 11 fallait poser la question de savoir s'il sait lire, écrire et expliquer
une lettre, ou traduire une lettre dans une langue. Aussi a-t-on attiré l'attention
des enquêteurs pour le cas particulier des enfants de moins de 10 ans qui
fréquentent l'école, les parents peuvent avoir tendance à dire « oui » à la
simple question « Est-ce que (Nom) sait lire et écrire ? » même si l'intéressé
ne sait pas lire et écrire selon la définition retenue, il fallait donc absolument
poser la question suivante : « Est-ce que (Nom) est capable de lire, écrire et
2. Enquêtes sur la santé et l'éducation 77
expliquer une lettre ou traduire cette lettre dans une autre langue ? ». 11 ne
s'agit pas de ceux qui savent seulement lire et écrire les chiffres, mais de ceux
qui savent lire et écrire un texte.
Dans quelle(s) langue(s) [NOM] sait-il lire et écrire ? : C'est la question qui
est posée aux personne âgées de 10 ans et plus dans le but d'enregistrer le
niveau d'alphabétisation fonctionnelle (l'aptitude à pouvoir lire et écrire des
phrases simples de la vie de tous les jours, ainsi que des textes ordinaires, tels
que les lettres et les journaux). La personne alphabétisée peut l'être dans
n'importe quelle langue tant qu'elle est communément utilisée sous une
forme écrite. Si la personne sait lire mais pas écrire, elle sera considérée
analphabète. Cette enquête n'inclut pas la passation de test rigoureux pour
déterminer les aptitudes à lire et à écrire. Les enquêteurs utilisent leur
jugement et les informations en provenance de la personne interrogée pour
évaluer chaque personne.
Le bon niveau de scolarité et la continuité dans le temps des études sont des
facteurs positifs de bonnes compétences en lecture et en manipulation des
chiffres. Comme toutes les actions menées en alphabétisation, le raccrochage
scolaire a de bons résultats chez les adultes de moins de 25 ans, grâce aux
organismes d'alphabétisation qui œuvrent dans le pays. Les centres
d'éducation de base non formelle, les centres d'alphabétisation et tous les
acteurs de l'alphabétisation continuent de faire leurs preuves, mais le nombre
de personnes qui ont besoin d'une formation de base ne cesse d'augmenter.
Cette constatation doit encourager les décideurs politiques à favoriser le
développement de l'éducation tout au long de la vie tout en facilitant le retour
aux études scolaires ou la formation continue des adultes en situation
professionnelle. Ces constats soulèvent également d'autres questions, comme
le choix des langues d'alphabétisation, le niveau qui doit être considéré
comme le plus élevé pouvant permettre à un individu d'être fonctionnel et
opérationnel dans une société qui avance en laissant de nombreuses personnes
de côté, sans considération d'égalité ou d'équité. La prévention du décrochage
scolaire et le maintien dans des systèmes de fonnation ont déjà montré des
résultats positifs.
78 Pratique et méthodes de sondages
a) L'échantillonnage
parmi ces personnes, seule une par ménage sera choisie au hasard pour
répondre au questionnaire individuel et passer le test.
11.4 Conclusion
BIBLIOGRAPHIE
Jaspard, M., Brown, E. et Condon, S. (2003). Les violences envers les femmes
en France - Une enquête nationale. La documentation française, Paris.
Bon, F. (1974). Les sondages peuvent ils se tromper ? Calman-Lévy, Paris.
Galabert, J.M. (2005). La commission des sondages : une expérience de
régulation. Dans Etudes en F honneur de Gérard Timsit, Bruxelles,
Bruylant, 309-326.
Gendreau, F. (1993). La population de l'Afrique Manuel de démographie.
KARTHALA - CEPED, Paris, 424 pages.
12.1 Introduction
La population visée est celle des étudiants du semestre 5 (S5), options gestion
et analyse économique. La population observée s'est restreinte aux étudiants
inscrits dans le module 4 dans les deux options (voir tableau 2.10).
X
_ ap ~ Xav
=
ZN ,n _
10 x
- aV
Pour calculer des estimations de yN et zN, la méthode d'estimation la plus
naturelle est de les remplacer par le gain brut moyen yn de l'échantillon et le
gain relatif moyen zn de l'échantillon. ic fh = 25 % fh = 25 % fh = 25 %
82 Pratique et méthodes de sondages
On donne dans le tableau 2.12 le gain brut moyen et le gain relatif moyen qui
correspondent à six matières enseignées en MQ, ces deux mesures donnent
une première idée sur l'effet de l'apprentissage des MQ.
On a jugé qu'une question directe adressé aux étudiants sur l'impact perçu de
l'enseignement des MQ sur les MEG donnera un jugement collectif fiable.
Ainsi, on remarquera que 70 % des étudiants considèrent qu'une condition
essentielle pour réussir leur apprentissage en MEG est l'apprentissage des
MQ. Cela évoquerai que la plupart des étudiants ont compris
l'indispensabilité des MQ pour la maitrise ou la compréhension des matières
de la discipline sciences de l'économie et de gestion.
De la même manière, on a obtenu un taux de 72 % des étudiants qui
considèrent qu'un bon niveau en MQ va les aider à comprendre les MEG.
Dans cette partie, nous avons réalisé une analyse de la variance en utilisant la
procédure anova et glm du logiciel S-plus 2000. Nous avons considéré
l'impact des facteurs Pedag.mq : pédagogie de l'enseignant, Prese.mq :
présence de l'étudiant aux cours des MQ, Inter.mq : intérêt du cours des MQ,
Aime.mq : passion de l'étudiant pour les cours des MQ, sur la satisfaction de
l'étudiant dans son apprentissage des MQ, la variable qui définit la
satisfaction de l'apprentissage des MQ est notée Satis.mq. Le résultat de
l'analyse est donné dans le tableau 2.13.
Gaussian model
Response: SATIS.MQ
BIBLIOGRAPHIE
Enquêtes sociales
1
Corinne RÉGNARD
Les questions d'intégration occupent une place importante dans les débats
actuels. La création du ministère de l'immigration, de l'intégration, de l'identité
nationale et du développement solidaire a encore renforcé l'opportunité de ce
débat mais a aussi permis de rassembler des moyens importants pour faciliter
l'intégration des migrants dans notre société.
Pour compléter l'ensemble d'informations d'origine administrative ou
statistique sur les migrants, le Département des statistiques, des études et de la
documentation (DSED) du Ministère de l'immigration, de l'intégration, de
l'identité nationale et du développement solidaire (MIIINDS) met en place un
dispositif d'enquêtes concernant principalement le domaine de l'intégration.
Ce dispositif est constitué, en tout premier lieu, par l'enquête ELIPA (Etude
longitudinale sur l'intégration des primo-arrivants). Il s'agit d'un suivi de
Le problème majeur dans le suivi d'une cohorte réside dans le suivi des
personnes et donc dans l'attrition de la base avec toutes ses conséquences sur
le plan de la représentativité des résultats dès la première ré-interrogation. Ce
problème est particulièrement aigu pour l'enquête ELIPA dans la mesure où
le motif de la non-réponse peut être directement lié à l'intégration de
l'étranger, donc à l'objet même de l'enquête.
La première expérience en France d'un suivi longitudinal de migrants a été
réalisée par la Direction de la recherche, des études, de l'évaluation et des
statistiques (Drees) en 2006/2007 avec l'enquête « Parcours et profils des
migrants récemment arrivés ou régularisés en France (PPM) ». L'attrition
avait alors été de 38 % entre la première et la seconde vague, s'expliquant en
très grande partie par la perte de vue des personnes (64 %) puis par des
absences de longue durée (20 %) et des refus (14,5 %).
BIBLIOGRAPHIE
2 Cette application, dite AGDREF, est gérée par le MIIINDS. En cas d'absence
d'information sur le numéro AGDREF dans la base de sondage, le recueil du numéro
était prévu dans le questionnaire sur la base du volontariat.
3. Enquêtes sociales 91
problèmes de comparabilité
internationale
3
Didier NGANAWARA
Les sources administratives sont les services des Etats membres qui
recueillent des données destinées à l'utilisation des institutions publiques. Les
sources les plus fréquentes sont de trois types : les registres administratifs des
polices des frontières, les fichiers des étrangers résidant dans chaque pays et
les fiches d'immatriculation des émigrés auprès des missions diplomatiques à
l'étranger.
Les polices des frontières recueillent des données sur les flux d'entrée et de
sortie du territoire national à partir des fiches d'embarquement et de
débarquement des aéroports internationaux, des ports, et des notices des
postes de frontières terrestres. Les informations recueillies concernent
l'identité de la personne (nom, prénom, date et lieu de naissance, etc.), la date
d'entrée/sortie du territoire, le pays de provenance/destination, la durée de
séjour, etc.
Les fichiers des étrangers sont constitués à partir des visas et titres de séjour
délivrés aux étrangers installés dans chaque pays. Ils fournissent des
informations relatives à leur nationalité, leur pays de naissance, leur statut
d'activité, le type de visas ou de permis de séjour, leur durée de validité, etc.
Les fiches d'immatriculation des émigrés concernent les nationaux vivant à
l'étranger. Elles sont établies au moment de leur enregistrement auprès des
missions diplomatiques et renseignent sur l'identité de la personne
enregistrée, sa situation professionnelle, son adresse dans le pays d'accueil,
etc.
Cependant, les données collectées par ces sources peuvent servir à élaborer
des séries chronologiques permettant de dégager le profil temporel des flux
migratoires, d'apprécier temporellement le solde migratoire international de
chaque pays, de calculer la population étrangère résidente ou d'estimer le
nombre de ressortissants résidant de manière légale à l'étranger (Ba et
Ndione, 2006). Malheureusement, elles sont peu exploitées du fait que les
structures en charge de la collecte des données manquent de moyens
technique et matériel nécessaires pour bien remplir leur mission.
l'information sur cette durée n'a pas été enregistrée dans tous les
recensements des pays de la CEMAC comme celui de la Centrafrique en
2003. Cette variable sert, plus précisément, à déterminer la date de la dernière
migration ou la date d'installation dans le pays du recensement.
considérés comme membres du ménage résidant. Tout porte à croire que cette
approche sous-estime le nombre d'émigrants internationaux.
BIBLIOGRAPHIE
(MAFE-Sénégal)
3.1 Introduction
3.2.1 Objectifs
L'enquête MAFE au Sénégal était adressée aux ménages, puis aux individus
de 18 ans y résidant. Le questionnaire ménage décrivait sa composition, les
caractéristiques de ses membres (y compris ceux qui ont migré), les transferts
financiers ou matériels effectués, ainsi que l'habitat et le patrimoine du
ménage. Le questionnaire individuel, biographique, décrivait la vie
matrimoniale, génésique, professionnelle, ainsi que l'histoire migratoire.
1 143 ménages sur 1 320 échantillonnés ont répondu à l'enquête ménage, soit
un taux de réponse de 87 %, légèrement inférieur à ce qui avait été anticipé
(90 %). L'essentiel de la non-réponse provient de refus (89 %), peu de
ménages ayant été absents ou injoignables.
Afin de nous faire une idée des biais engendrés par cette absence de réponse
de certains ménages, nous avons calculé des taux de non-réponse, puis
comparé les estimations obtenues avec la pondération initiale et la
pondération corrigée pour quelques variables d'intérêt.
Dans l'enquête MAFE, deux variables sont disponibles chez les ménages
répondants et ceux non-répondants : la strate du DR en dix postes, obtenue en
classant les DR selon la proportion de ménages migrants observée au
recensement 2002, et la strate du ménage recueillie lors du dénombrement.
On n'observe pas de variation importante ou régulière de taux de réponse
selon la strate du DR. Par exemple, dans la strate où la proportion de migrants
a été la plus faible au recensement de 2002, de même que dans la strate où
elle a été la plus élevée, les taux de réponse sont identiques (88,5 %). De
même, les taux de réponse ne sont guère différents chez les ménages
« migrants » et « non-migrants », respectivement 85,5 % et 87,6 %. Ainsi, la
non-réponse de niveau ménage ne semble pas corrélée avec la proportion de
migrants de la zone, ni avec le statut migratoire du ménage.
Lorsqu'on compare les estimations obtenues chez les répondants, selon la
pondération utilisée, on constate un faible écart entre les estimations. Par
exemple, la proportion de ménages de la région de Dakar comprenant un
migrant est estimée à 47,1 % si on utilise la pondération initiale, et à 47,4 % si
on utilise la pondération redressée. La proportion de ménages ayant reçu un
transfert financier au cours de l'année écoulée est estimée à, respectivement
45 % et 45,4 %.
Les enquêteurs ont réalisé parfois jusqu'à dix tentatives pour contacter un
individu échantillonné et lui proposer l'enquête. 10 % des interviews n'ont pu
se faire qu'au bout de quatre tentatives de contact ou plus. Par rapport aux
répondants joints plus facilement, ces répondants difficiles à joindre sont plus
nombreux à avoir eu trois enfants ou plus (54 % contre 50,8 %). Toutefois, le
pourcentage d'entre eux ayant séjourné un an ou plus hors du Sénégal
(20,4 %) n'est pas très différent de celui des répondants faciles à joindre
(18,2%). Des pourcentages proches sont également observés pour le fait
d'avoir effectué des transferts réguliers à l'étranger (8,7 % contre 7,6 %).
On peut faire l'hypothèse que les caractéristiques de ces personnes difficiles
à joindre sont assez proches de celles des individus qu'on n'a pas pu enquêter.
Les résultats montrent alors que les individus non redondants ne sont pas très
différents des répondants par rapport aux variables d'intérêt de l'enquête.
3. Enquêtes sociales 99
3.5 Conclusion
BIBLIOGRAPHIE
Démographiques et de Santé
9
Frédérique ANDRIAMARO et Valérie DELAUNAY10
La démographie de la famille reste encore peu répandue dans les pays du Sud,
tout particulièrement à Madagascar. Les études réalisées au niveau national
ou régional, ne fournissent que des données assez globales sur les familles et
ménages malgaches (taille des ménages, âge moyen des chefs de ménage,
niveau d'instruction des chefs de ménage,...), mais les connaissances sur les
structures des ménages à Madagascar restent encore très rares.
Néanmoins, comme la plupart des pays d'Afrique subsaharienne,
Madagascar a bénéficié du programme des Enquêtes Démographiques et de
Santé (EDS) à quatre reprises, en 1992, 1997, 2003 et 2008-2009.
Christine Tichit propose une méthode de reconstitution de la composition
familiale des ménages à partir des EDS (Tichit, 2008). Dans les EDS, le
questionnaire prévoit, pour chacun des membres du ménage, l'enregistrement
du lien de parenté avec le chef de ménage. En cela, le fichier ménage produit
par ces enquêtes ne permet pas une analyse fine des structures. Mais
l'exploitation d'autres informations, que Ton trouve dans les questionnaires
adressés aux femmes de 15 à 49 ans et aux enfants de moins de 15 ans permet
de repérer les différents noyaux qui composent le ménage. Dans cette
communication, nous appliquons cette méthode aux données des EDS menées
à Madagascar en 1992, 1997 et 2003-2004.
Un noyau secondaire est défini comme une cellule parentale, composé d'au
moins un parent et un enfant. Il peut s'agir d'un couple avec leur enfant
(parental), d'un couple avec l'enfant d'un des deux membres du couple
(recomposé) ou d'un seul parent avec son enfant, marié ou non (on distingue
les noyaux monoparentaux célibataires des noyaux monoparentaux dont le
conjoint réside ailleurs). Un certain nombre d'indicateurs concernant les
noyaux secondaires sont présentés dans le tableau 3.3.
La présence de noyaux secondaires concerne 12,2 % des ménages en 1992,
11 % en 1997 et 9,4 % 2003. Les ménages concernés comprennent entre 1 et
4 noyaux secondaires, mais le nombre moyen de noyaux secondaires reste
très proche de 1. Ces noyaux secondaires sont plus fréquents dans les
ménages parentaux et dans les ménages dont le chef est seul et sans enfants.
La tendance va vers une nette augmentation des noyaux secondaires dans ce
dernier type de ménage.
La grande majorité des enfants vivent avec leurs parents biologiques (près de
65 % des à enfants). Une partie des enfants vivent avec leur mère seule (17 à
18 %), suite à une séparation plutôt qu'au décès du père ; peu d'enfants vivent
avec leur père seul (4 à 6 %) et cette proportion tend à diminuer. Enfin une
partie des enfants ne vivent ni avec leur père ni avec leur mère (13 à 14 %) et
cette proportion tend à augmenter. Dans la grande majorité des cas, les
parents biologiques sont en vie. Il ne s'agit donc pas d'orphelins, mais
d'enfants confiés. Ces enfants sont confiés en grande partie à leurs grand-
parents (60%) ou à d'autres parents (15%). Une partie d'entre eux sont
déclaré comme enfant adopté ou confié, dans la variable « lien de parenté » et
on perd donc l'information sur un lien de parenté éventuel.
On s'interroge alors sur la prise en charge de ces enfants confiés. A qui
sont-ils confiés ?
Parmi les enfants qui ne résident ni avec le père ni avec la mère, nous
pouvons observer comment se répartit le lien de parenté avec le chef de
ménage (Tableau 3.4). La majorité de ces enfants sont dans le ménage de
leurs grands-parents (près de 60 % pour les 2 dernières enquêtes). Une part
importante sont codé « enfant adopté ou confié », ce qui ne renseigne pas sur
le lien de parenté. Cette modalité ne devrait pas figurer dans la liste des liens
de parenté et constitue une limite à l'analyse.
BIBLIOGRAPHIE
11 12
Peter-Paul BORG et Guillaume OSIER
5.1 Introduction
La plupart des états développés réalisent au niveau national des enquêtes dites
« Budget des Ménages » (EBM). Dans leur forme la plus courante, il s'agit
d'enquêtes par sondage portant sur un échantillon de ménages privés avec
pour but de collecter de manière détaillée les dépenses de consommation des
ménages sur certains postes de dépense tels que définis par la nomenclature
COICOP. Aujourd'hui, les EBM sont reconduites régulièrement dans la
plupart des pays européens. Leur principal objectif au niveau national est de
permettre la mise à jour des pondérations de l'Indice des Prix à la
Consommation (IPC). Par ailleurs, certains postes de la consommation des
ménages dans le système des comptes nationaux sont évalués en recourant
aux données EBM. Même si quelquefois les coefficients de pondération de
l'IPC sont basés directement sur les chiffres de la Comptabilité Nationale, les
EBM restent néanmoins une des sources d'information pour établir ces
derniers.
une meilleure harmonisation des données EBM entre les pays, les états
membres conservent une grande liberté sur les choix méthodologiques : plan
d'échantillonnage, concepts et définitions à utiliser, mode de collecte des
données.
L'objectif final de la collecte EBM au niveau européen est de produire pour
chaque pays un certain nombre d'indicateurs relatifs aux dépenses de
consommation des ménages privés ainsi qu'à la structure des dépenses
moyennes de consommation. Ces indicateurs sont accessibles depuis la base
de données en ligne d'Eurostat (NewCronos)13.
La dernière vague de collecte des EBM portait sur l'année de référence 2005.
Elle a couvert les 27 pays de l'Union Européenne (UE), ainsi que la Croatie,
la Norvège et la République de Macédoine. La majorité des pays ont transmis
à Eurostat des fichiers de micro-données, même si quelques uns ont choisi de
transmettre seulement des tableaux agrégés contenant les principaux
indicateurs-cible.
La taille moyenne de l'échantillon national EBM pour les pays de l'UE27
était de 9 735 ménages, ce qui est tout à fait satisfaisant à la vue d'autres
enquêtes sur les ménages. Si on compare par exemple les tailles des
échantillons EBM avec celles de l'enquête EU-SILC pour l'année 2005, on
voit que l'échantillon EBM est plus important aux niveaux UE15, UE25 et
UE27. En outre, il est intéressant de constater que la couverture géographique
de l'EBM est meilleure. Ceci peut s'expliquer en partie par les difficultés
liées à la mise en application par certains pays des dispositions du règlement
européen pour EU-SILC.
13 http://epp.eurostat.ec.europa.eii/portal/page/portal/living_conditions_and_sociaI_protection/
data/database.
106 Pratique et méthodes de sondages
(18 %). En fait, les enquêtes budget des ménages impliquent une charge de
travail particulièrement lourde pour les ménages, qui doivent noter chaque
jour leurs dépenses dans des carnets. Et tous les ménages ne tiennent pas une
comptabilité exacte de leurs dépenses qui faciliterait grandement les réponses
aux questions sur les achats non périodiques.
La non-réponse est un problème pouvant nuire gravement à la qualité des
données : elle entraîne une perte de précision, puisque la taille effective de
l'échantillon diminue. Par ailleurs, elle risque de biaiser les résultats, surtout
si les ménages non-répondants ont un profil différent de celui des ménages
répondants. En plus d'endommager la précision des données, la non-réponse
nuit à leur comparabilité. 11 sera en effet difficile de comparer les données de
deux pays ayant chacun des taux de réponse très différents : c'est le cas par
exemple de la Roumanie (90 %) et de la Belgique (6 %).
L'absence de la variable « Loyer fictif » pour certains pays pose un sérieux
problème de comparabilité. Un loyer fictif (Imputed rent en anglais) est
généralement attribué aux ménages qui sont propriétaires de leur logement. Il
correspond au loyer que le ménage percevrait de son logement si celui-ci était
loué au prix du marché. Une pratique courante dans les EBM est de
considérer le loyer fictif à la fois comme un revenu et une dépense non-
monétaire (d'une certaine façon, on « dépense » le logement que l'on occupe).
L'expérience a montré que l'absence de cette variable influe sensiblement sur
l'estimation de la dépense totale moyenne des ménages.
Par ailleurs deux pays, en l'occurrence l'Allemagne et la République
Tchèque, ont tiré leurs échantillons EBM en utilisant des méthodes non-
probabilistes (quotas pour la République Tchèque, échantillonnage de
volontaires pour l'Allemagne). Ceci pose à l'évidence un autre sérieux
problème de comparabilité lorsqu'on compare les données de ces pays avec
celles de pays ayant échantillonné selon des méthodes probabilistes.
Enfin, un autre problème de comparabilité vient de la collecte des dépenses
pour l'éducation et la santé. De nombreux pays disposent en effet de systèmes
d'éducation et de santé largement publics et qui sont directement financés via
l'impôt. Dans ce contexte, un ménage pourra déclarer ne rien dépenser pour
ces deux postes, même si en réalité la dépense se fait par un autre canal. A
l'inverse, d'autres pays auront des systèmes d'éducation et de santé privés
beaucoup plus développés. Le niveau de dépenses des ménages pour
l'éducation et la santé sera alors plus élevé.
DK / AT
At-risk-of-poverty rate
—i—
100 Tsô 200"
EU-SILC
108 Pratique et méthodes de sondages
5.4 Conclusion
l'UEMOA
14
Ousman KORIKO
6.1 Introduction
V
2 - 1 " A -, ml'Tl -, DEFF2
Vj 1 - /, ^2^2 E)EFFI
ou encore
^2 Y ..1-/2
Vi a|3 1- '
Dans l'exemple qui suit, on fait l'hypothèse que y =0,5 et a =0,75. Alors,
on obtient (3 =1,33. Les effets de grappe sont tous améliorés pour les villes de
Bissau, Bamako, Dakar et Lomé, avec un échantillon de 112 unités primaires
et un nombre constant de 9 ménages par unité primaire.
6.6 Conclusion
L'EDM 2008 a le mérite d'être exécutée pour la deuxième fois, après celle de
1996, avec succès dans les principales agglomérations des pays membres de
l'UEMOA. Les résultats obtenus sont fiables et comparables. Cependant,
force est de constater que l'application d'un plan de sondage identique induit
des effets différents selon les agglomérations. De bonnes pratiques sont
proposées pour l'amélioration du dispositif d'enquête.
3. Enquêtes sociales 113
et Laurent TOULEMON18
BIBLIOGRAPHIE
19 En plus des données issues du Tronc commun des ménages des enquêtes de f Insee qui
comprend une question sur le Pacs depuis 2009. C'est l'empilement des différents TCM
sur plusieurs années qui apportera à terme des données utiles pour l'étude du pacte civil
de solidarité.
3. Enquêtes sociales 117
Sénégal (ESPS_2005_2006) :
degrés
20
Fatou Bintou NIANG CAMARA
8.1 Introduction
Au stade actuel, le problème social majeur réside sans conteste dans la forte
incidence de la pauvreté dans les pays en développement surtout en Afrique
subsaharienne, d'où l'importance accordée à la lutte contre la pauvreté par le
Sénégal et leurs partenaires au développement. Les programmes nationaux de
lutte contre la pauvreté offrent des opportunités pour la mobilisation de tous
les acteurs à la formulation et la mise en œuvre de politiques sociales. Cela
contribuerait ainsi à la réalisation des Objectifs du Millénaire pour le
Développement à l'horizon 2015.
L'Enquête de Suivi de la Pauvreté au Sénégal de 2005 (ESPS_2005) s'est
inscrite dans ce cadre et a été réalisée par la Direction de la Prévision et de la
Statistique (DPS), devenue Agence Nationale de la statistique et de la
Démographie (ANSD) grâce à l'appui financier et logistique de l'Agence du
Fonds de Développement Social (AFDS). Les principaux objectifs de
1,ESPS_2005 sont :
1. de collecter les informations nécessaires à l'identification et à la
classification des groupes cibles de populations et ;
2. de fournir dans un court délai, des données de base nécessaires au
suivi du développement économique et social du pays.
a) Taille de l'échantillon
Elle porte sur un échantillon de 13 600 ménages répartis entre le milieu urbain
(8 564 ménages) et le milieu rural (5 036 ménages). On a onze domaines
d'études qui correspondent aux onze régions administratives du Sénégal,
divisées en 3 départements chacune, sauf la région de Dakar qui en compte
quatre. Chaque département est stratifié en urbain et rural.
L'échantillon est constitué de 820 Districts de Recensement (DR) au total,
dont 505 en milieu urbain et 315 en milieu rural. Dans chaque strate ou
département, 25 DR sont tirés, 15 en milieu urbain au sein des communes et
10 en milieu rural au sein des communautés rurales. Ce qui donne par
conséquent, un total de 16 ménages à enquêter tous milieux confondus.
Toutefois, dans les milieux urbains de Kébémer (Louga), Kanel (Matam),
Ranérou (Matam), et de Oussouye (Ziguinchor) où on y enregistrait une
insuffisance de nombres de DR par rapport aux autres, le nombre de ménages
à enquêter a dépassé 16, surtout pour Ranérou qui ne comportait qu'un seul
DR. Dans ce cas, tous les 164 ménages qui l'ont composé ont été enquêtés.
Il convient de souligner que la base de sondage est constituée de la liste des
districts de recensement (DR) obtenus avec la cartographie réalisée dans le
cadre de la réalisation du Recensement Général de la Population et de
l'Habitat de 2001 (RGPH/2001). Elle est organisée en fichier informatique et
comporte 10 000 DR environ. Cette base a servi au tirage des 820 DR de
l'ESPS_2005.
b) Tirage des DR
Djibouti ?21
22 23
Sébastien MERCERON , Sandrine MESPLE-SOMPS et
24
Laure PASQUIER-DOUMER
d'enclavement, est en général d'autant plus importante que l'îlot est de taille
importante.
L'analyse des résultats et des intervalles de confiance devra prendre en
compte ce plan de sondage aréolaire stratifié. La dispersion des pondérations
des ménages enquêtés est relativement forte du fait des différentiels de taux
de sondage appliqués dans les différentes strates formées par le croisement
des trois critères de stratification. Il ne s'agit cependant pas d'une allocation
optimale de Neyman car l'allocation suit une logique spécifique : les taux
appliqués sont d'autant plus élevés que l'îlot est enclavé, précaire et dans la
zone PDU1 (notre population cible).
.-.asJri
-.3 :<
t.-
K j**
OS :
15 S r*-'
trz «
r-'
n
3* * &e.rdBBL
issamsb
V I . 7i
"D '' S
O V f"
c
D Wi
Û ^EV
■R
o urff.JI'fsIKal ' r. —Or
(N
O
-C
en
>-
CL
O
(J
3. Enquêtes sociales 125
contrainte d'enquête
10.1 Introduction
10.2.1 Population
Une base de sondage de 910 services recensés dans 216 communes d'Ile de
France a été établie à partir de différentes sources. Un plan de sondage à trois
degrés, inspiré de la méthode Ined-Insee, a été mis en place. Au premier
degré, après stratification les services ont été tirés aléatoirement et
proportionnellement à leur taille. Au second degré, les jours d'enquête ont fait
l'objet d'un tirage aléatoire à partir des jours ouvrables des services. Au
troisième degré, les usagers ont été tirés de façon aléatoire soit à partir d'une
liste soit à partir d'un point de passage obligatoire dans le cas des structures
ne disposant pas de liste. L'échantillon surreprésente la population parisienne
(70 %), les femmes (50 %) et les jeunes de moins de 25 ans (25 %).
La somme des poids des 840 individus constitue une estimation du nombre de
personnes adultes francophones ayant fréquenté les services d'aide
franciliens, pendant une semaine moyenne de la période d'étude. Cette
estimation s'élève à 21 176 personnes avec un intervalle de confiance à 95 %
de [17 582 ; 24 770]. La proportion d'hommes est de 65 % [54 ; 74], l'âge
médian est de 37 ans avec un écart interquartile de 18 ans, la proportion de
personnes ayant la nationalité française est estimée à 46 % [39 ; 52] et 29 %
[18; 41] déclarent travailler. La prévalence des troubles psychiatriques
sévères s'élève à 31 % [25 ; 38], la prévalence des troubles de la personnalité
à 21 % [16; 27]. Les troubles non sévères de l'humeur concernent 16%
[9 ; 26] de la population et le risque suicidaire moyen et élevé 13 % [9 ; 18].
La présence d'au moins une addiction a été détectée chez 29 % [22 ; 37] de la
population, 21 % [16; 27] présentent une dépendance à l'alcool et 16%
[11; 22] consomment régulièrement du cannabis.
10.6 Conclusion
BIBLIOGRAPHIE
31
Stanislas SPILKA , Olivier LE NEZET 32,
33
Stéphane LEGLEYE et François BECK34
garantissant ainsi une large représentation des situations parmi les personnes
sans hébergement personnel. Selon les structures, il s'agit en effet de
solutions d'hébergement plus ou moins stable : en CHRS, les personnes
peuvent être hébergées pour une durée de 6 à 12 mois, alors que dans les
centres d'hébergement d'urgence il s'agit d'un abri pour la nuit. La
population non couverte par l'enquête correspond à la fois à une partie des
personnes qui se sont installées dans une vie à la rue, en tente notamment,
ainsi qu'aux situations les plus proches de l'insertion (type salarié vivant à
l'hôtel). L'absence des individus donuant au moment de l'enquête dans des
lieux non prévus pour l'habitation (squats, lieux publics, caravanes...) est
susceptible d'avoir constitué un biais de représentativité, même si durant
l'hiver un certain nombre d'entre eux sont amenés à fréquenter les
hébergements d'urgence.
Les critères d'inclusion étaient le fait d'être majeur et francophone. Au
total, 1 954 personnes ont été interrogées par des enquêteurs professionnels au
sein de 160 centres d'hébergement répartis sur l'ensemble du territoire,
auxquels il convient d'ajouter ceux interrogés en Ile-de-France lors de
l'enquête réalisée par le SAMU de Paris à la même période. L'enquête a été
réalisée par questionnaire lors d'un entretien d'une heure en face à face, avec
un enquêteur professionnel recueillant les données sur support papier.
L'échantillonnage a été réalisé en janvier 2009, à partir de la base nationale
recensant les centres d'hébergement métropolitains. Seuls neuf centres ont
refusé de participer à l'enquête et ont été remplacés par une structure
équivalente (choix raisonné). Après avoir reçu un courrier, les structures
participantes ont été contactées par les enquêteurs afin d'organiser une
prévisite qui devait permettre l'organisation des passations. Lors de cette
première visite, les enquêteurs devaient alors déterminer à l'aide d'une table
de nombre aléatoire les personnes à interroger. Le tirage s'effectuait sur la
liste des résidents, numéro de chambre ou de lit un jour donné (le nombre de
personnes à interroger était fixé proportionnellement au nombre de personnes
inscrites sur la liste). Afin de pallier les refus, les enquêteurs devaient
sélectionner un nombre supérieur de personnes et lorsqu'une d'entre elles
refusait de répondre, elle était alors remplacée en respectant toutefois l'ordre
du tirage aléatoire.
Les tableaux 3.9 et 3.10 montrent la diversité des situations et des réalités
individuelles confirmant l'hétérogénéité des publics sans domicile. Derrière
ces situations, on retrouve des comportements d'usages tout aussi variés
interdisant les généralités. Les analyses, en cours et qui seront publiées à la
fin de l'année 2010, laissent toutefois apparaître des consommations souvent
supérieures à celles observées parmi la population générale du même âge.
Pour conclure, cette première expérience confirme l'intérêt de mener avec
des outils de mesure standardisés des études parmi une population précaire
même si certaines adaptations sont bien évidemment nécessaires. Un taux de
132 Pratique et méthodes de sondages
A
Tableau 3.10 : Age des personnes selon le sexe
BIBLIOGRAPHIE
quantitative et qualitative
35 36
Stanislas SPILKA , Stéphane LEGLEYE et
3
François BECK '
12.1 Introduction
12.5 Conclusion
BIBLIOGRAPHIE
cas de Ouagadougou
Idrissa OUILI39
13.1 Introduction
Recensement
Cohorte dynamique (Mise à jour par des passages périodiques)
de base
Pour répondre à notre objectif, il convient d'adopter une stratégie qui permet
de fournir des résultats utiles tout en respectant la logique d'un observatoire
qui veut que l'on suive une zone bien précise. Pour fournir des résultats utiles,
deux stratégies possibles s'offraient à nous.
La première consistait à travailler sur des populations vulnérables, et tester
des interventions sanitaires sur ces populations. Quant à la deuxième, elle
visait à fournir aux décideurs des indicateurs à l'échelle de la ville pour les
guider dans la hiérarchisation des politiques sanitaires.
La deuxième stratégie qui vise une représentativité de la ville entière,
suggère un échantillon aléatoire. Si elle est adaptée pour les enquêtes
ponctuelles, elle l'est moins pour un suivi démographique dans un milieu
urbain caractérisé par une forte mobilité. En plus, avoir des résultats
régulièrement mis à jour sur toute la ville de Ouagadougou qui compte un
million quatre cent mille habitants semble être idéaliste en raison de coûts
énormes que cela peut engendrer.
Nous avons donc privilégié la première stratégie qui permet de mettre
l'accent sur les acteurs qui travaillent au sein de la population et qui voudront
faire une intervention pouvant améliorer les conditions sanitaires des
populations vulnérables.
Pour concrétiser le choix des zones à suivre, trois critères ont été définis. Le
premier critère met l'accent sur la possibilité de pouvoir réaliser des
interventions dans la zone et mesurer leur impact. Pour cela, il faudra au
minimum deux grandes zones non contigûes et comparables sur le plan
sociodémographique. Ensuite, pour que les interventions puissent être
bénéfiques et visibles, il faut travailler avec des populations vulnérables et
moins mobiles. Les populations les plus vulnérables se rencontrent dans les
zones périphériques de la ville. Enfin, la taille de l'échantillon a été choisie de
3. Enquêtes sociales 139
sorte à pouvoir estimer les causes de la mortalité des enfants. Elle a été
estimée à environ 80 000 individus.
( oueUion d'eneius
Entretien siu le terra m
Base de
données
<< lu oui lion »
, Transi
Transfert Base brouillon vers base d analyse
Base «le
données
d'analyse
Chaque enquêteur se rend dans les ménages qui lui sont attribués et procède
à la mise à jour des informations sur les individus, les ménages et leurs
habitations. Un premier contrôle est réalisé à ce niveau à travers les filtres et
autres contrôles de cohérence sur les modules des questionnaires. Lors ces
entretiens, des incohérences peuvent apparaître entre les données collectées au
passage r - 1 et le passage en cours entraînant des corrections.
Une fois les données collectées, il faut les transférer des PPC vers le server.
Ce transfert se fait en deux étapes.
Tout d'abord, les données collectées sont quotidiennement transférées du
PPC vers une première base de données qu'on appelle base « brouillon »
(base en production) via internet. Une fois par semaine et à la fin de la
collecte des données pour ce passage, une validation de cette base
« brouillon » est réalisée. Ces validations permettent de détecter des
incohérences et erreurs qui sont soit corrigées sur place ou sur le terrain sous
forme de « Retour Terrain » (RT). Après la dernière validation des données de
la base « brouillon » à la fin du passage, ces données sont transférées vers la
base d'analyse, grâce à une application informatique. À l'issue de ce transfert,
une validation finale est effectuée sur l'ensemble des données de la base
d'analyse (données de tous les passages y compris le passage en cours). A
cette validation, un contrôle d'intégrité de la base est réalisé. Cela peut à son
tour entrainer des corrections d'erreur sur place ou par des retours terrain.
C'est après correction des erreurs issues de cette validation finale que la base
peut enfin être mise à la disposition des chercheurs pour exploitation.
Cette technique permet d'alléger la collecte de données des observatoires de
population, améliore la qualité des données par l'intégration des contrôles à
plusieurs niveaux de la collecte, rend les données disponibles plus rapidement
et surtout réduit considérablement le coût de la collecte.
13.2 Conclusion
BIBLIOGRAPHIE
40
Cécile LEFÈVRE
questions ne prennent pas le même sens dans tous les pays. Et la gestion du
terrain peut également prendre des formes variées.
Nous avons étudié la manière dont trois pays, la Russie en 2004 et 2007, la
France en 2005 et 2008, et la Géorgie en 2006 et 2009, ont réalisé les deux
premières vagues de cette enquête. Comment ont-ils adapté le questionnaire
standard ? Ont-ils eu des soucis de traduction ? Ont-ils rencontré des
difficultés communes ou spécifiques sur le terrain ? L'enquête répondait-elle
à des préoccupations scientifiques similaires ? Avec la réalisation de la
seconde vague, la comparabilité des méthodes et des résultats est de plus
réinterrogée par les différences de mise en oeuvre des dimensions
longitudinales de l'enquête.
La déclinaison nationale d'un projet d'enquête tel que GGS s'est traduite
dans la méthode de sondage et procédure de collecte d'une part, et dans le
contenu et la formulation du questionnaire d'autre part. Pour les trois pays
retenus, nous envisageons ce double aspect.
satisfaisants : très bons en Géorgie, bons pour une enquête ménage en France,
ainsi qu'en Russie, à la nuance près de grandes variations entre grandes villes
et campagne.
BIBLIOGRAPHIE
France
Pierre BRÉCHON42
Ces différences infrastructurelles sensibles n'ont en fait que des effets limités
sur les opinions et les valeurs, ce qui est au fond peu étonnant puisque les
relations entre valeurs et variables infrastructurelles ne sont souvent que
d'intensité faible ou moyenne. Une comparaison systématique montre que,
148 Pratique et méthodes de sondages
même sans pondération, les écarts sont en général faibles entre les deux sous-
échantillons. Les écarts les plus importants (sur une dizaine de variables)
atteignent entre 4 et 6 points. L'échantillon par quotas apparaît un peu plus
critique (personnes plus insatisfaites de leur travail, plus critiques à l'égard du
fonctionnement démocratique, faisant une moindre confiance au parlement et
au gouvernement), il est aussi plus matérialiste, plus attaché à la permissivité
et aux libertés des comportements et des choix individuels. Le phénomène
s'explique assez bien par le caractère plus jeune et plus urbain de l'échantillon
par quotas.
L'échantillon par quotas est aussi un peu moins sociable, moins politisé,
plus abstentionniste, ce qui va contre l'idée parfois soutenue selon laquelle
l'échantillon par quotas surreprésente les personnes extraverties, sociables,
ayant envie de s'exprimer47. De plus, si cette hypothèse était vérifiée, on
devrait observer des taux de sans-réponse moins élevés dans l'échantillon par
quotas. Or les écarts sont en la matière très faibles. L'hypothèse n'est donc
pas vérifiée sur cet échantillon par quotas renforcés, avec contrôle du niveau
de diplôme. C'est plutôt l'inverse qui s'est produit dans notre cas : plus
diplômé, l'échantillon aléatoire est plus sophistiqué et participatif, il manque
- encore plus que l'échantillon par quotas - de minorités défavorisées, par
exemple des étrangers (4,6 par quotas, 2,7 en aléatoire).
Le problème redoutable expérimenté pendant la réalisation du terrain a donc
bien été de réussir à limiter les problèmes de l'échantillon aléatoire, alors que
la réalisation du plan d'échantillonnage par quotas s'est révélée sans surprise,
et donnant un échantillon plutôt meilleur, à moindre coût. Heureusement, ces
faiblesses ne semblent pas avoir d'effets importants sur les réponses dans les
différents domaines de valeurs au centre de l'étude. La proximité globale des
réponses obtenues dans les deux échantillons permet de conclure qu'il est
parfaitement légitime, en utilisant une pondération qui fait disparaître une
partie des différences brutes, de considérer l'échantillon comme un ensemble
unique.
L'échantillon aléatoire est certainement une bonne pratique lorsqu'on peut
disposer d'une très bonne liste de population et pour des échantillons de taille
importante. Le pis-aller du random route est largement un leurre. La méthode
est très coûteuse pour un résultat décevant. L'échantillonnage par quotas,
pratiqué sur un nombre suffisant de critères et avec un contrôle très strict des
enquêteurs, se révèle un très bon mode d'administration.
47 En cas de refus d'un enquêté potentiel, l'enquêteur par quotas passerait très vite à la
porte voisine. Alors que l'enquêteur aléatoire devrait insister fortement puisqu'il a peu
d'adresses en réserve et que le taux de réussite est contrôlé.
3. Enquêtes sociales 149
BIBLIOGRAPHIE
Bréchon, P., et Tchemia, J.-F. (Dir.) (2009). La France à travers ses valeurs,
Armand Colin.
Bréchon, P., et Galland, O. (Dir.) (2010). L'individualisation des valeurs,
Armand Colin.
Une enquête auprès des ménages s'inscrit dans un planning d'enquêtes mis à
jour plusieurs fois par an. Dès les prémices, une période de collecte est
assignée pour chaque projet en fonction des autres projets. Les contraintes
sont nombreuses - les ressources ne sont notamment pas illimitées - et les
acteurs multiples. Cette période assignée peut évoluer en fonction de plusieurs
paramètres : les décisions politiques concernant le projet, les financements
disponibles, la définition du contour de l'enquête.
Lorsqu'il est certain que l'enquête pourra être réalisée, le projet entre dans
une phase de gestation active, phase qui commence environ deux ans à
deux ans et demi avant la période de collecte prévue. Nous nous intéresserons
aux enquêtes dont le questionnaire est informatisé (logiciel Biaise). On parle
également de questionnaire électronique.
a) Le test papier
La préparation d'une enquête est soumise à deux tests sur le terrain et se clôt
par une répétition générale. Le premier est le « test-papier ». Il peut être
précédé de groupes de discussions dits focus group, tests plus informels qui
permettent de valider un protocole, de s'assurer qu'un sujet sensible peut être
accepté par les enquêtés. Ce test papier a lieu en général après le passage
devant le Cnis et avant le passage devant le comité du label. Les focus group
et le test papier sont essentiels : ils engagent fortement l'équipe statistique et
les directions régionales concernées.
Après ce premier test, le questionnaire est validé par le comité du label. Le
questionnaire est alors mis sous format électronique dynamique (ou
« datamodel » de l'enquête) : les réponses aux questions orientent le
questionnement de façon adaptée du fait des spécifications et des filtres.
b) Le test Capi
entre les concepteurs et les enquêteurs est toujours très riche d'enseignements.
La plupart des supports de formation sont donc également mis au point, et
préfigurent le module de formation de l'enquête.
C'est en général à cette occasion, lors de la confrontation avec le terrain et
les enquêteurs, que l'équipe conceptrice prend conscience de difficultés
encore mal appréciées. Pour y rémédier, les modifications entre la version du
« datamodel » du test Capi et celle de la répétition générale peuvent être
importantes. Par ailleurs, le protocole de l'enquête peut être légèrement
modifié, le questionnaire évolue... Tout ceci peut également entraîner des
modifications dans les spécifications des postes de collecte et de gestion.
c) La répétition générale
3e recensement général de la
population et de l'habitat du
Cameroun ?
51
Marcel NKOMA
17.1 Introduction
à ces types d'enquêtes qui sont normalement exécutés un à deux mois après la
fin des opérations du dénombrement. Pour apporter une réponse à cette
interrogation, notre analyse mettra l'accent principalement sur les
considérations méthodologiques ayant permis la réalisation de l'EPC afin de
redresser les donnés du 3e RGPH.
L'EPC a été de ce fait conçue à l'image des enquêtes à passages répétés des
années 70 expérimentées sous les auspices du Groupe de Démographie
Africaine (GDA). Le questionnaire ménage de l'enquête comporte des
questions rétrospectives spécifiques à poser aux populations vivant dans les
zones de dénombrement retenues dans l'échantillon. Ces questions ont été
agencées puis formulées pour être adaptées aux objectifs de l'opération et
pour tenir compte en outre, du fait que la période de référence des données
recueillies est particulièrement longue : une année.
La conception de l'enquête post-censitaire du 3e RGPH n'a pas entièrement
été indépendante du recensement dans la mesure où la base de sondage est
constituée par les ZD du recensement, les agents enquêteurs ont été recrutés
parmi les meilleurs agents recenseurs et formés spécialement aux procédures
de collecte des données de l'enquête, puis affectés dans un autre
arrondissement que celui dans lequel ils ont travaillé lors du dénombrement
principal et les chefs d'équipe ont été choisis parmi les cadres du BUCREP
dont la plupart avaient pris part à l'encadrement des travaux du
dénombrement en novembre 2005. Les travaux de collecte des données se
sont déroulés du 11 novembre au 15 janvier 2007.
17.3 Échantillonnage
strate, le tirage des ZD-échantillon a été réalisé avec des probabilités inégales
proportionnelles à leur taille (méthode des totaux cumulés). Le taux
d'omissions dans une strate a été obtenu en faisant la moyenne pondérée des
taux d'omission empirique calculés dans chaque ZD-échantillon ; les
coefficients de pondération utilisés sont les inverses des probabilités de tirage
des ZD-échantillon. Au niveau de l'ensemble du pays, le taux d'omission
global a été calculé comme une moyenne pondérée des taux calculés dans
chaque strate, en utilisant comme coefficients de pondération, le
démographique de chaque strate dans l'univers.
Dans cette démarche, on a raisonné comme si au niveau de chaque strate, la
« vraie population » totale de la strate en question, comportait deux catégories
de ménages :
- les individus omis lors du dénombrement en proportion ;
- et les individus recensés lors du dénombrement en proportion.
BIBLIOGRAPHIE
Burkina Faso
52
Lougué SIAKA et Bonkoungou ZAKALIYAT53
18.1 Introduction
Le recensement est une opération très lourde et très conteuse qui doit se
réaliser chaque dix ans dans les pays en développement selon les Nations
Unies. C'est la seule opération statistique qui permet d'avoir l'effectif total de
la population d'un pays donné en l'absence d'un état civil qui fonctionne
correctement. Elle apparaît donc comme une opération assez importante dans
les pays pauvres d'autant plus que l'état civil est généralement déficitaire.
Comme la plupart des opérations de collecte statistique, les données des
recensements sont le plus souvent entachées d'erreurs. D'où la nécessité de
faire des corrections.
Plusieurs types d'erreurs peuvent être rencontrés et les techniques utilisées
pour effectuer des corrections de celles-ci ne font pas toujours l'unanimité.
Tandis que certaines techniques de correction ne souffrent pas d'ambiguïté,
d'autres, par contre, peuvent induire des formes d'erreurs ou même déformer
la réalité. Ainsi, une analyse préalable de la qualité des données s'impose
pour décider de la validité de l'ensemble des données.
L'apurement des données commence sur le terrain et se poursuit au bureau.
Une grande partie de l'apurement des données s'effectue généralement par
programmation informatique qui est qualifié de « spécification de correction
automatique ». Le dernier recensement général de la population et de l'habitat
(RGPH) du Burkina Faso a eu lieu en décembre 2006. Les données collectées
ont fait l'objet de plusieurs types d'apurement. 11 s'agira, ici, de partager cette
expérience.
Les données recueillies dans tous les recensements et toutes les enquêtes
comportent des valeurs manquantes qui correspondent aux informations
manquantes pour diverses raisons. Les méthodes utilisées pour introduire les
corrections nécessaires dépendent du type de données considéré. Dans la
plupart des cas, il est possible d'attribuer aux données en cause des codes
valides, tout en étant assuré de leur exactitude et en utilisant les réponses
apportées à d'autres questions.
Il existe deux techniques automatiques d'imputation des données erronées.
Il s'agit de l'imputation par la méthode cold deck qui est utilisée pour les
données manquantes ou inconnues. Le programme de vérification attribue une
3. Enquêtes sociales 161
données selon les modalités des variables. Mettre l'accent sur les données
relatives au code des localités et à l'activité économique.
18.7 Conclusion
Au RGPH de 2006, la spécification n'a pas été faite au même moment que la
saisie. Lorsque les données sont produites, elles sont au fur et à mesure
passées sous le programme de spécification et les erreurs apparaissent. C'est
ainsi qu'il a été possible de tester la fiabilité des corrections proposées. Cette
activité a été faite après la saisie des données. Ce qui a prolongé le temps
consacré à la disponibilité des données. Alors que cela aurait eu l'avantage de
déceler les erreurs de saisie et aussi de revenir immédiatement si besoin sur
les questionnaires. Dans la mesure où la saisie se fait par commune, province
ou par région, il peut y avoir des problèmes particuliers liés à une commune
spécifique que des agents de terrain ou de saisie peuvent facilement détecter
et corriger. Une autre difficulté, et non la moindre, est l'absence de
documentation sur les spécifications des données des opérations de
recensements passés. Or ces archives, en relevant les difficultés du passé
auraient aidés à mieux orienter les travaux.
Au terme de cette analyse il faut, pour assurer une meilleure qualité des
données de recensement à venir :
- Mettre en place et commencer la rédaction du document de
spécification dès le début de la phase préparatoire de l'opération ;
- Appliquer le programme de spécification technique au fur et à mesure
que les données sont saisies afin de déceler certaines erreurs
spécifiques à des régions ce qui rendrait plus performant et réaliste
les spécifications techniques ;
- Mettre en place une équipe fonctionnelle d'archivage de tous les
documents de l'opération tels que les rapports de terrain de tous les
agents de terrain ainsi que des superviseurs. Il en est de même des
rapports des différents ateliers et réunion afin d'améliorer les
spécifications dans la mesure où certaines informations supposées
être des erreurs pourraient provenir de décisions de terrain ou de
réunions antérieures.
164 Pratique et méthodes de sondages
l'élection précédente ?
54 55
Claire DURAND , Isabelle VALOIS et
56
Mêlante DESLAURIERS
19.1 Contexte
19.2 Méthodologie
Trois séries de bases de données ont été utilisées pour examiner les questions
posées. Ce sont d'une part, les données du Panel électoral français (PEF) en
ce qui a trait aux élections présidentielles françaises de 2002 et de 2007,
d'autre part, les données de l'Étude électorale canadienne (EEC) de juin 2004
qui s'est poursuivie par un panel pour les élections de janvier 2006 et de
septembre 2008, et enfin, les données de notre propre enquête panel, effectuée
par la firme CROP, pour ce qui est des élections québécoises de mars 2007 et
de décembre 2008. Dans les cas de la France et du Québec, il y a présence
d'un parti ou d'un candidat de droite de type populiste, alors que ce n'est pas
le cas pour le Canada, sauf peut-être pour une composante du vote
conservateur de 2004.
Les analyses portent a) sur le rappel de vote comparé au vote réel, ce qui
permet d'évaluer la fiabilité du rappel et, pour le Québec, son évolution dans
le temps, b) sur le double rappel de vote (pour le Québec et le Canada), ce qui
permet d'estimer la prévalence de la non-fiabilité et d'en étudier les
déterminants individuels, et enfin c) sur l'estimation de l'intention de vote
utilisant le redressement par le rappel de vote, ce qui permet d'estimer les
conséquences de la pratique dans diverses situations.
19.3 Résultats
Par ailleurs, nous avons trois mesures de double rappel de vote. Pour
l'élection canadienne de 2004, 21 % des personnes réinterviewées déclaraient
un vote différent en 2006 qu'en 2004 alors que, pour ce qui est du vote de
2006 déclaré de nouveau en 2008, il s'agissait de 29 % des répondants. Pour
ce qui est de l'élection québécoise de 2007, 25 % des personnes
réinterviewées en 2008 donnaient une information différente de celle donnée
après l'élection. Le mauvais rappel n'est donc pas un phénomène rare.
Pour ce qui est de la France, alors que les sondeurs utilisant le redressement
par la déclaration de vote à l'élection précédente avaient sous-estimé le vote
pour le Front National en 2002 (Durand et coll., 2004) et surestimé ce même
vote en 2007 (Durand, 2008), le redressement par le rappel de vote utilisant
les données du PEF 2007 entraîne une amélioration de l'estimation du vote
Front National. Pour ce qui est du Québec, l'utilisation du redressement
provoque une hausse de l'estimation des intentions de vote pour l'ADQ pour
les deux élections, ce qui aurait amené une meilleure estimation du vote
uniquement en 2007. Enfin, pour ce qui est du Canada, le redressement
entraîne une forte surestimation du vote pour le Parti Conservateur en 2004.
Par contre, en 2006 et en 2008, ce redressement ne change pratiquement rien.
3. Enquêtes sociales 167
19.4 Conclusion
BIBLIOGRAPHIE
Durand, C., Biais, A. et Larochelle, M. (2004). The poils in the 2002 French
presidential élection: An autopsy. Public Opinion Quarterly, vol. 68, n04,
602-622.
Durand, C. (2008). The Poils of the 2007 French presidential campaign: Were
lessons learned from the 2002 catastrophe? International Journal of Public
Opinion Research, vol. 20, n03, 275-298.
Waldahl, R., et Aardal, B.O. (1982). Can we trust recall data? Scandinavian
Political Studies, vol. 5, n02, 103-116.
168 Pratique et méthodes de sondages
20.1 Introduction
Les procès verbaux (PV) d'accidents sont rédigés par les forces de l'ordre à
l'issue du constat des faits et des auditions des impliqués, des ayant droit et
des éventuels témoins. Ils sont destinés en priorité à la justice. Ces PV sont
numérisés et centralisés par l'association AGIRA (Association pour la
Gestion des Informations sur le Risque Automobile) pour les diffuser ensuite
aux sociétés d'assurance concernées par l'indemnisation des victimes.
Portant sur les accidents corporels uniquement, les PV recueillent nombre
d'informations, sur les circonstances de l'accident : date, heure, lieu, type et
état de la voirie, météo, type de collision, caractéristiques des véhicules
impliqués, usage d'équipements de protection ou de sécurité ; sur l'accidenté :
âge, sexe, activité - profession (peu précise), possession du permis de
conduite et date d'obtention. En l'état, l'adresse du domicile de l'accidenté est
recueillie mais pas saisie. Cette information est pourtant essentielle si l'on
souhaite mener une analyse socio-territoriale fine (à l'échelle de l'Iris60). En
l'état actuel du système de recensement des accidents routiers, une telle
analyse nécessite de numériser les PV et de coder les adresses à l'Iris à l'aide
de bases d'adresses et de système d'information géographique (Alam, Fleury,
Godillon, Medikane, Millot, Peytavin et Saint-Gerand, 2010). La lourdeur de
ce travail de reconstitution permet difficilement de le généraliser à un large
territoire.
Enfin, certains accidents ne sont pas recensés, comme le montrent des
comparaisons avec le registre des accidentés du Rhône (Amoros, Martin et
Laumon, 2007). 11 s'agit notamment des accidents légers, sans antagoniste. Il
est vraisemblable que ces sous-déclarations soient inégalement distribuées
socialement ou spatialement, ce qui peut être source de biais dans la mesure
des disparités de risque routier.
L'enquête nationale transport est ainsi la seule base statistique qui permette
de rapprocher, pour un même individu, sa situation sociale, ses conditions de
réalisation de la mobilité, les caractéristiques de cette mobilité et la survenue
d'accidents routiers. L'échantillon de TENTD, 20 200 ménages en 2008 (dont
18 600 individus de 6 ans et plus), ouvre la voie à des analyses par type
d'espace (urbain/périurbain/rural, sur un regroupement de régions, voire sur
une taille de ville...). Mais, pour des raisons de fiabilité statistique, son
utilisation ne peut porter sur des espaces trop restreints ou spécifiques, ni sur
des analyses spatiales trop désagrégées, et ce, à plus forte raison si Ton se
concentre sur une catégorie de population ou d'usagers particulière. Pour cela,
peuvent être mobilisées les enquêtes ménages déplacements (EMD) locales.
62 Concernant la motorisation des ménages et l'usage des véhicules, une autre enquête
nationale, le Panel Parc Auto Sofres analysé par TINRETS-DEST, offre des possibilités
d'analyse importantes.
63 S'ils ne sont pas en cours de scolarisation ; ou pour un scolaire ou étudiant du ménage
tiré au hasard parmi l'ensemble des individus actuellement scolarisés.
172 Pratique et méthodes de sondages
« Road safety Data Collection, Transfer and Analysis » (7e PCRD), visent en
particulier à harmoniser et à mettre en commun les données de sécurité
routière au sein de la base CARE (y compris les nouveaux pays membres) et à
l'enrichir par l'adjonction de diverses données communes : données
d'exposition au risque, indicateurs de performance en sécurité routière. Des
actions de recherche visent également à harmoniser les enquêtes, de mobilité
des ménages notamment, à l'aide des nouvelles technologies, comme l'action
Cost Shanti. Citons aussi la 3e enquête sur le comportement des conducteurs
européens (SARTRE3, 2006).
Au plan national, le paysage des bases de données se transforme très
rapidement ces dernières années, par l'essor de nouveaux réseaux de bases de
données : réseau Quetelet en sciences humaines et sociales, plateforme
PLASTICO64 en épidémiologie (Goldberg, Quantin, Guéguen et Zins, 2008).
Sous cette impulsion, les débats autour de l'évolution du fichier BAAC et des
accès aux PV, la création d'une plateforme intégratrice à l'Inrets autour de la
question des grandes bases de données en transport65 montrent des évolutions
vers une meilleure intégration des différentes bases de données (Fontaine,
Gourlet, L'Hoste et Muhlrad, 2003). La mise en relation des données de
nature très diverse (de trafic, de mobilité, d'accident, d'ordre
socioéconomique) laisse néanmoins ouvertes différentes questions : autour
des enjeux institutionnels d'une mise en place d'une plateforme scientifique
et technique commune et des enjeux réglementaires ; du respect des règles de
la commission nationale de l'informatique et des libertés (Cnil) ; des aspects
techniques concernant les modalités d'appariement individuel de données à
caractère personnel et l'enrichissement de bases de données par la fusion
d'informations issues de fichiers de source différente ; et des modalités de
centralisation et de mise à disposition en retour, aux chercheurs, des bases de
données ainsi constituées.
BIBLIOGRAPHIE
Enquêtes économiques
Canada
1
Richard LAROCHE
1.1 Contexte
1 Statistique Canada, Division des méthodes d'enquêtes auprès des entreprises, Ottawa,
Canada. Courriel : richard.laroche@statcan.gc.ca.
176 Pratique et méthodes de sondages
1.2 Utilisations
Dans les enquêtes auprès des entreprises de Statistique Canada, les données
administratives peuvent être utilisées aux fins suivantes : création et mise à
jour de bases de sondage, vérification et imputation, tabulation directe,
remplacement de la collecte des données, variables auxiliaires, validation,
évaluation. Le lecteur peut consulter Yung, Rancourt et Hidiroglou (2007)
pour une description plus détaillée des différentes utilisations des données
administratives.
Le fichier le plus important pour les enquêtes annuelles auprès des entreprises
est celui qui concerne l'imposition des sociétés. La présente section donne
une liste non exhaustive des obstacles rencontrés lors de son utilisation.
Même si ces difficultés sont décrites dans un contexte bien précis, celles-ci
sont communes à plusieurs sources de données administratives. Lavallée
(2007) donne une liste élargie de ces difficultés.
1.3.1 Erreurs
Les variables génériques sont utilisées par les entreprises ne pouvant fournir
de renseignements détaillés. Étant donné que les différentes enquêtes ont,
entre autres, besoin des variables détaillées à l'étape de l'estimation, ces
variables génériques doivent nécessairement être réparties parmi les détails
qui leur sont associés.
1.3.4 Concepts
Les définitions sur lesquelles les données fiscales sont fondées ne coïncident
pas toujours avec celles qui doivent être utilisées dans les enquêtes pour des
raisons d'uniformité avec le Système de comptabilité nationale ou pour les
besoins d'analyse. Un outil est donc nécessaire pour faire le lien entre les
deux concepts.
1.3.5 Actualité
1.3.6 Structure
1.4 Traitement
détails sur ces méthodes peuvent être obtenus dans Andrews, Hamel,
Martineau et Rondeau (2007).
Dès leur réception à Statistique Canada, les données du fichier d'impôt des
entreprises constituées en société sont vérifiées et corrigées, le cas échéant.
Le processus commence par la détection des valeurs aberrantes. Ensuite, on
vérifie l'équilibre des états financiers en s'assurant de l'égalité de certaines
équations de base. On s'assure également que la somme des composantes
d'une section donnée est égale au total de la section.
Il arrive parfois que des champs ne pouvant prendre que des valeurs
positives soient négatifs (et vice-versa). Lorsqu'une telle situation se produit,
ces valeurs sont transférées dans un champ équivalent où elles prendront une
valeur positive (ou négative dans la situation contraire).
D'autres vérifications, telles que celles portant sur la présence de
chevauchement des périodes fiscales pour un même enregistrement ou la
cohérence entre le revenu calculé à des fins comptables et le revenu calculé
aux fins de la Loi de l'impôt sur le revenu, sont aussi effectuées.
Les erreurs sont corrigées de façon systématique s'il est possible de le
faire ; des corrections manuelles sont effectuées dans le cas contraire.
Les états financiers fournis par les entreprises sont formés de différentes
sections nommées « bloc ». Un bloc est en général composé d'une variable
générique et d'un ou de plusieurs détails. La variable générique est un champ
de type « non classé ailleurs » et sert à déclarer les montants qui ne l'ont pas
été dans les champs détaillés. Les variables génériques sont fréquemment
utilisées, car la déclaration des champs détaillés n'est pas obligatoire.
Lorsqu'un montant apparaît dans le champ générique d'un bloc, il doit être
réparti parmi les détails de ce même bloc dans le but d'éviter une sous-
estimation de ces détails. L'idée générale derrière la méthodologie utilisée
4. Enquêtes économiques 179
pour désagréger les variables génériques est simple, mais son élaboration et sa
mise en œuvre ont présenté de nombreux défis. Cette méthodologie peut
brièvement être résumée par les trois étapes suivantes :
a) définir des classes homogènes à partir des entreprises ne déclarant
que des détails pour un bloc donné ;
b) déterminer la classe à laquelle appartient une entreprise déclarant un
générique pour le bloc considéré ;
c) utiliser, dans chaque classe, la distribution des détails des répondants
pour imputer les détails des entreprises ayant déclararé un générique.
Statistique Canada a élaboré des lignes directrices pour toutes les étapes
principales d'une enquête (Statistique Canada, 2009). Certaines de ces lignes
directrices ont trait à l'utilisation des données administratives. En voici
quelques-unes :
- utiliser les données administratives lorsqu'elles constituent une
solution de rechange rentable à la collecte de données ;
- entretenir des liens avec le fournisseur des dossiers administratifs ;
- documenter la nature et la qualité des données administratives.
Ces lignes directrices sont toutes mises en pratique. Par exemple, des
réunions bilatérales entre Statistique Canada et l'ARC ont lieu régulièrement,
un document résumant la qualité des données administratives est produit
chaque année (voir Lebreux et MacEachem, 2009) et des initiatives sont en
cours pour trouver des moyens d'accroître l'utilisation de données
administratives.
1.6 Remerciements
BIBLIOGRAPHIE
2.1 Introduction
d'environ 5 500 entreprises. Plus de détails peuvent être obtenus dans Daoust,
Bohossian, Gauthier, Deniers et Nicholas (2008) et Bohossian, Daoust et
Gauthier (2009).
Variables des
Étape Variables des bilans
états de revenus
<<f
une variable commune
NO
ii
i
Ajustements annuels
pour les m variables
détaillées des SFTE Kid,) = Âid,) * R^d,)
liées à une variable
commune (/< = 1, ..., m)
Ajustements trimestriels
pour les variables ÂT,, w = M4) * Àjid,)
des SFTE
Estimations
trimestrielles ajustées =
^T,*, Ajustée CO ^T.kid/) + ÂT
des SFTE
2.3.1 Post-stratification
La figure 4.1 donne un aperçu de l'ampleur des ajustements pour les trois
premiers trimestres de 2009 selon les actifs, les revenus d'exploitation et les
bénéfices d'exploitation.
L'ajustement est relativement petit pour tous les trimestres (moins de 1 %)
pour les industries non financières (nf). Le premier trimestre fut un trimestre
d'actualisation. On note ensuite que l'incidence des ajustements augmente à
mesure que l'on s'éloigne de cette actualisation, ce qui est tout à fait
prévisible. Par contre, les ajustements sont pratiquement nuls et plus
irréguliers pour les industries financières (f). Cela est lié à la dominance des
entreprises à tirage complet dans la population enquêtée de ces industries.
4. Enquêtes économiques 185
1,0% -
0,8% - □ f actifs
□ f revenus
0,6% - □ f bénéfices
0,4%
□ nf actifs
0,2% - ZI nf revenus
0,0% a nf bénéfices
0,2%
10,0%
□ f actifs
5,0% "I a f revenus
i f bénéfices
0,0% LTjj i da. ^J] rJ L
□ nf actifs
-5,0% 1 □ nf revenus
nf bénéfices
-10,0%
T1 2003 T1 2004 T1 2005 T1 2006 T1 2007
186 Pratique et méthodes de sondages
Pour les trimestres de mise à jour, des zones tampons sont présentement à
l'étude. La zone tampon est une règle de résistance utilisée afin de réduire la
migration des entreprises entre les strates ou post-strates. Dans la figure 4.3,
simplifiée à une dimension, les flèches pâles indiquent les unités pour
lesquelles la migration n'est pas permise, tandis que les flèches foncées
indiquent où cela est permis. Une première version a été mise en œuvre pour
restreindre le mouvement des unités entre la partie à TP vers la strate à TC au
premier trimestre 2010. Une étude effectuée en 2009 a aussi démontré que de
petites zones tampons permettraient de restreindre considérablement les
mouvements d'unités entre la partie enquêtée et la partie à tirage nul.
4. Enquêtes économiques 187
TC
..tt Ne permet
TI pas de migrer
TPI . ■ /
^
TP2 W T r~
Permet de migrer
jJL.
——n
TN
2.5 Conclusion
BIBLIOGRAPHIE
à l'OFS
Daniel KILCHMANN4
3.1 Introduction
L'implémentation finale est planifiée pour la fin de l'année 2010 pour les
premières enquêtes auprès des entreprises. Par contre, l'évaluation du
potentiel d'optimisation ne peut se faire qu'après deux à trois cycles de
l'enquête. Toutes les enquêtes de l'OFS devraient être standardisées à long
terme sur la base des premières implémentations du manuel EDI M BUS.
Imliahsation Données
hrules
Enquête + Inlluence ?
saisie
Phase 2 :
Micro-préparation des données
l'I'SI ) Préparation Préparation
interactive automatique
Rapports Qualité ?
Fin Fin
3.6 Conclusions
BIBLIOGRAPHIE
DACSEÏS Project (2004). Data Quality in Complex Surveys within the New
European Information Society, http://www.dacseis.de.
EUREDIT Project (2004). Towards Effective Statistical Editing and
Imputation Stratégies - Findings of the Euredit project.
http://www.cs.york.ac.iik/eiiredit/results/resiilts.html.
Granquist, L., et Kovar, J. (1997). Editing of survey data: How much is
enough? Dans Survey Measurement and Process Quality. New York : John
Wiley & Sons, Inc. 415-435.
Hidiroglou, M.A., et Berthelot, J.-M. (1986). Contrôle statistique et
imputation dans les enquêtes-entreprises périodiques. Techniques
d'enquête, 12, 1,79-89.
Hulliger, B. (1999). Simple and robust estimators for sampling. Dans
Proceedings of the Section of Research Methods, American Statistical
Association, 54-63.
Luzi, O., Di Zio, M., Guamera, U., Manzari, A., De Waal, T., Pannekoek, J.,
Hoogland, J., Tempelman, C., Hulliger, B. et Kilchmann, D. (2007).
Recommended Practices for Editing and Imputation in Cross-Sectional
Business Surveys.
françaises
6 7
Fabien GUGGEMOS et Philippe BRtON
Ces points atypiques non aberrants sont très problématiques dans la mesure
où ils contribuent à augmenter fortement l'instabilité des estimateurs utilisés
pour produire les statistiques par branches et par secteurs. En effet, selon
qu'ils sont présents ou non dans l'échantillon de l'enquête, ces statistiques
peuvent prendre des valeurs très différentes ! En d'autres termes, s'ils ne font
4. Enquêtes économiques 197
2. D'autre part, utiliser les variables d'intérêt initiales, pondérées par les
poids de sondage winsorisés.
BIBLIOGRAPHIE
données passées
8
Emmanuel GROS
15500D0Q
15000000
l 450000 Q
-- ■ ■■—— —
y
l 4 00000 0
0 500 10 0 0 15 0 0 2000 2500 3000
4. Enquêtes économiques 203
Sur cet exemple, on constate que le contrôle des 500 unités les plus
influentes pour le score local considéré - soit moins de 20 % du total des
unités contrôlables - suffît pour obtenir un estimateur robuste : l'impact de
contrôles supplémentaires sur des unités moins influentes est quasiment nul.
En conséquence, le seuil de ce contrôle peut être défini comme la valeur du
score de la 500e unité.
Le nombre de seuils à calculer dans le cadre du système Esane se comptant
en centaine de milliers9, il est évidemment impossible de procéder par examen
visuel pour chaque série ; la méthode artisanale de détermination des seuils
décrite ci-dessus a donc été automatisée.
Cette procédure automatique s'appuie toujours sur l'analyse de l'évolution
de la statistique d'intérêt en fonction du nombre d'entreprises contrôlées, mais
le caractère négligeable de l'erreur de mesure résiduelle est cette fois-ci
mesuré à l'aune de l'erreur d'échantillonnage : le seuil est automatiquement
déterminé de telle sorte que l'erreur de mesure résiduelle soit dominée par
l'écart-type de l'estimation. En pratique, la valeur du seuil correspond au score
de la première entreprise10 à partir de laquelle l'estimation reste à l'intérieur
d'un intervalle centré sur l'estimateur final et de magnitude égale à un
pourcentage donné de l'écart-type de l'estimation".
203ÛÛÛÛD
20200000
20 1 0000D
20000000
19900QDD
0 500 1000 1500
- d'autre part, il arrive pour certains secteurs que les erreurs de mesure
soient, dès le départ, négligeables devant l'erreur d'échantillonnage -
soit parce que la variance de l'estimateur était très importante sur le
passé, soit parce les entreprises avaient directement bien répondu lors
de l'enquête précédente - ce qui conduit à des seuils particulièrement
élevés, d'où un risque de sous-contrôle. Afin de prévenir ce risque,
un « filet de sécurité » a été mis en place, sous la forme d'un niveau
de seuil maximal toléré, ce qui assure qu'aucune unité importante ne
passe au travers des contrôles.
BIBLIOGRAPHIE
12 13
Adama KOURSANGAMA et Ouambi YAMEOGO
6.1 Introduction
6.2 Méthodologie
Le module pluvial couvre le milieu rural (le milieu urbain est exclu). Le
domaine d'étude ou domaine de significativité des résultats est la province.
6.2.2 Échantillonnage
a) Stratification
En somme, les ménages de chaque province ont été scindés en deux strates.
Les unités primaires sont obtenues par regroupement des ménages d'un même
village appartenant à la même strate. Ainsi, un village peut se retrouver dans
les deux strates et formé ainsi deux unités primaires. C'est ce qui explique le
fait qu'on ait 1 500 unités primaires et 1 311 villages réels dans l'échantillon.
Le cahier 2, parmi les quatre cahiers constituant les questionnaires, est celui
utilisé pour estimer la production définitive. Les variables utilisées pour
l'estimation de la production par spéculation sont la superficie et le
rendement. L'ensemble des parcelles de tous les ménages échantillons sont
mesurés de façon objective à l'aide de boussoles et de rubans, et un carré de
rendement est posé sur chaque parcelle pour le calcul du rendement par
spéculation. La superficie d'une spéculation dans une province donnée est
obtenue en extrapolant la superficie obtenue dans chaque ménage échantillon
par le coefficient de pondération du ménage (il est l'inverse de la probabilité
d'apparition du ménage). Le rendement d'une culture (en pure, en principal
ou en secondaire) est obtenu par la moyenne simple des rendements obtenus à
l'aide des carrés de rendement posés sur les parcelles.
P, = (1 + r*) x /?,_! x S,
avec
- P, : la production prévisionnelle de la campagne en cours ;
- : le rendement de la campagne passée ;
- 5, : la superficie de la campagne actuelle.
r* = (1 - a) x Rw + a x INDVICOR
où
- Rw : la variation des rendements attendue par le paysan obtenue par
interview (entre le 1 et le 15 septembre). Elle est égale à :
14 La méthode SIF correspond à la variation des rendements obtenus par les observations
satellitaires de la biomasse (TND1VCOR). Autrement dit, il s'agit du ratio des indices de
végétation entre la décade d'un mois donné (en octobre généralement) de la campagne
en cours par rapport à la même décade du même mois de la campagne passée.
208 Pratique et méthodes de sondages
Rw = -Q- - 1
1 +5
- (2 : le ratio entre la production attendue et la production de la
campagne passée obtenue par la déclaration du producteur ;
- 5 : la variation des superficies de la campagne en cours par rapport
aux superficies définitives de la campagne passée et est égale à :
S,-,
- IND/VCOR : la variation des rendements obtenue par les
observations satellitaires de la biomasse. C'est le ratio des indices de
végétation entre la décade d'un mois donné (en octobre
généralement) de la campagne en cours par rapport à la même décade
du même mois de la campagne passé ;
- a : la part de la variation du rendement expliquée par l'indice de
végétation. Des analyses ont montré qu'elle est supérieure à 75 %
(0,75 < a < 1).
6.3 Conclusion
BIBLIOGRAPHIE
à Madagascar
15 Esitpa Rouen Lamsad & LMRS UMR 6085 France. Courriel : staibi@esitpa.org.
16 Laboratoire Raphaël Salem LMRS UMR 6085 France.
Courriel : manase.bezara@univ-rouen.fr.
210 Pratique et méthodes de sondages
7.2.1 Le questionnaire
7.3 Résultats
Au total 200 arbres on été utilisés dans les deux analyses qui suivent. Une
centaine de facteurs a été prise en compte.
7.4 Conclusion
Cette étude a permis de nous éclairer sur les critères à prendre en compte pour
améliorer le rendement d'une exploitation. Les résultats de cette enquête
permettent à l'équipe technique du Campus Paysan de mieux adapter les plans
de formations et répondre aux besoins des campusards (rizipisciculture,
gestion, irrigation, soins vétérinaires, micro crédits...).
L'Observatoire de la Ruralité de Tamatave constitue un outil d'analyse de
la situation agricole dans la Région et permet de collecter des données pour
dégager des indicateurs fiables de développement local et mesurer l'impact du
Campus Paysan.
4. Enquêtes économiques 213
BIBLIOGRAPHIE
17 18
Jossie RANDRIAMIANDRISOA et Nirina RABEVOHITRA
Le ROR réalise des enquêtes à passages répétés, sur une base annuelle, dont
l'unité statistique est le ménage. Les investigations sont conduites sur un
échantillon de 500 ménages par observatoire en moyenne. Le mode
d'échantillonnage a recours à un choix raisonné, conçu en étroite
collaboration avec les opérateurs de terrain chargés de la collecte des données
et commandités par les partenaires financiers.
Les enquêtes ROR sont d'ordre rétrospectif et en vue d'assurer une
synchronisation avec le calendrier agricole, la période de référence s'étale
d'octobre de l'année «-là septembre de l'année n. Du fait de son échelle
d'intervention, les données du ROR ne font l'objet d'aucune représentativité
statistique, tant à l'échelle nationale que régionale. En conséquence, en
extrapoler les données ne peut être entrepris à moins d'une procédure
scientifiquement et statistiquement valable et rigoureuse. La vocation du ROR
consiste plutôt à illustrer une problématique particulière du monde rural, des
informations qui demeurent tout de même fidèles à la réalité des campagnes.
19 http://www.dial.prd.fr/dial_enquetes/dial_enquetes_observatoires.htm.
4. Enquêtes économiques 215
Pour vérifier l'hypothèse de plus grande vulnérabilité des ménages dirigés par
des femmes, la démarche méthodologique adoptée comprend trois étapes.
Dans un premier temps, une analyse comparative sur la base des dotations en
capital des ménages en fonction du genre du chef de ménage est effectuée.
Ensuite, une mesure de la vulnérabilité est proposée. Enfin, un modèle
économétrique de type probit est élaboré pour vérifier l'influence des
variables sociodémographiques (âge, sexe, niveau d'instruction du chef de
ménage, ratio de dépendance démographique et économique) ainsi que
d'autres variables relatives aux divers types de capital détenus par les
ménages sur la probabilité d'être pauvre ou non. Les données utilisées aux
fins de l'analyse sont tirées d'un panel de 712 ménages enquêtés de 2005 à
2008 dans les observatoires ruraux de Farafangana (403 ménages) et
Manakara (309 ménages) localisés dans le Sud-est de Madagascar. Par
rapport à l'ensemble du réseau, ces deux observatoires se caractérisent par
une incidence relativement élevée de ménages dirigés par des femmes,
environ un ménage sur quatre.
et la valeur moyenne des transferts reçus est beaucoup plus élevée. Il faut
toutefois souligner le caractère instable et précaire de ce type d'assurance
informelle.
Les résultats des tests ont mis en évidence que les ménages dirigés par des
femmes ont significativement plus de chance d'être pauvres dans les deux
observatoires. En effet, le fait d'avoir un individu du sexe féminin à la tête du
ménage augmente de 18 % la probabilité d'être pauvre à Farafangana et de
15 % à Manakara. Par contre, le niveau d'instruction du chef de ménage
présente une influence négative sur la vulnérabilité dans les deux
observatoires.
4. Enquêtes économiques 217
BIBLIOGRAPHIE
20
Fabris 14/. COMPAQ RE
9.1 Introduction
Le secteur des TIC connait une émergence particulière ces dernières années
en Afrique. Notons en effet à titre d'illustration que l'Afrique enregistre un
taux de croissance annuel moyen de 65 % du nombre des abonnés au
téléphone mobile contre respectivement 24, 38 % pour les Amériques et
l'Europe sur une moyenne mondiale de progression de 33 % (World Bank,
2006).
Les problèmes de faible taux d'alphabétisation, du chômage galopant et de
la pauvreté ont induit une main-d'œuvre abondante, mais non qualifiée. C'est
pourquoi le secteur informel des TIC connait une extension considérable.
Dans ces imités, les règles dominantes ne sont pas salariales, mais
coutumières, hiérarchiques, affectives et les relations de proximité
essentielles.
Il est généralement admis que le secteur informel est constitué d'activités
économiques qui ne sont pas enregistrées, non pas par la volonté de se
soustraire aux réglementations en vigueur, mais plutôt par l'incapacité des
réglementations à s'appliquer à des réalités de nature difficile à saisir. Il
comprend les entrepreneurs individuels travaillant à leur propre compte sans
employer de salariés de façon permanente et ceux qui peuvent employer des
salariés de façon permanente, mais le font à un taux de salaire en dessous
d'un certain seuil, en l'occurrence le Salaire Minimum Industriel Garanti
(SMÏG).
En passant en revue les différentes conceptions du secteur informel, il est
loisible de constater qu'il n'y a pas de consensus, et que les critères varient
d'une définition à l'autre. Pour les besoins de notre analyse, nous allons
adopter celle proposée par le Professeur Abdoulaye Niang (Niang, 1996) de
l'Université Gaston Berger et qui nous paraît la plus compréhensive. Cette
conception permet de définir le secteur informel des TIC comme les activités
décrites ci-dessus et relatives aux technologies numériques combinant les
télécommunications, l'informatique et l'audiovisuel.
9.4 Méthodologie
Le manque de données sur le secteur informel des TIC a exigé tout d'abord un
recensement pour la constitution d'une base de sondage qui a servi à
l'échantillonnage. Un échantillon de l 000 unités d'exploitations a été pris sur
toute l'étendue du territoire burkinabé. Pour assurer la représentativité de
l'échantillon, le sondage aléatoire proportionnel a été considéré ; les critères
utilisés sont le sexe, le domaine d'activité (télécommunication, informatique
et internet, audiovisuel numérique) et la zone géographique (milieu urbain ou
rural).
Pour atteindre nos objectifs, les variables suivantes seront explorées : sexe,
niveau d'instruction, zone géographique, domaine d'activité, rémunération
mensuelle.
4. Enquêtes économiques 221
9.5 Résultat
La plupart des promoteurs du secteur informel des TIC sont des hommes
(86 %), les femmes ne représentant que 14 %.
9.6 Conclusion
Le secteur informel des TIC se révèle être un refuge pour la frange jeune non
qualifiée de la population du Burkina Faso. En effet, le niveau d'instruction y
est relativement minime avec une rémunération moyenne inférieure au SMIG.
Le secteur des TIC, dominant en milieu urbain et majoritairement du domaine
de la télécommunication, ne favorise pas les femmes.
BIBLIOGRAPHIE
d'échantillonnage : l'exemple de
24
Moussa THIAM
10.1 Introduction
10.3 Estimations
Pour une strate donnée, l'estimateur par expansion du total pour une strate
h est :
= Z Z Khykh- (2)
h k&Sjh
"D Var(f,,)
_ = Z Z ûuhwxkhylhykh ^klh
I-cc. . /cr. .
kes2hles2h TllL/Z-TT
\klh 2klh
a
Q A
A-
2klh
fNj + X X w\ihW\khyihykh^
£rl
kes2hles2h ' 2klh
-C
ai = Vlh+ï2h. (3)
>-
CL
o
U
25 Unité ayant cessé d'activité ou dont l'activité ne répond pas à la définition des ISBLSM.
226 Pratique et méthodes de sondages
t2h = A. (4)
K
kesjh 2kh ^Xkh
Cette expression se calcule sans difficulté, tous les éléments étant connus.
De même,
1/
v _ V1 ^\klh ~ ^\kli^\lh) .. ..
\h - lu 2-j ~ : : : : y^kh
kes2h les2h nlklhn\khn\lhK2khn2lh
/
^ (1 nUh) 1 1
-2 y2kh (5)
kzsjh ^kh V 2kh ^2kh y
et comme le plan de première phase est un tirage aléatoire simple dans chaque
strate, alors, nWh peut être estimé comme suit :
/^l/
nmh = ^/7|/,—— pour k * L (6)
Nh(Nh - 1) H
10.4 Conclusion
BIBLIOGRAPHIE
11.2 Échantillonnage
a) Base de sondage
b) Tirage de l'échantillon
probabilité pour qu'un ménage figurant dans l'échantillon ECAM figure dans
l'échantillon GPL. La seconde étape a consisté à utiliser les coefficients
d'extrapolation utilisés à l'ECAM 11 pour extrapoler les résultats sur
l'ensemble des ménages du Cameroun.
Pour une région donnée k{k allant de 1 à 12), la probabilité Pik pour qu'une
structure de type i(i allant de 1 à 5) soit tiré est : Pik = nik / Nik. où nik est le
nombre de structures de type i tirées et enquêtées dans la région k et Nik le
nombre total de structures de type / dans la région k.
Ainsi, le coefficient d'extrapolation d'une structure tirée de type i dans la
région k qui est l'inverse de la probabilité de tirage de la structure est :
c
ik = Nik1 "tk-
Les restaurants universitaires ont tous a priori un coefficient
d'extrapolation égal à 1.
BILIOGRAPHIE
2
Géraldine VIVIER Pernelle ISSENHUTH et
3
Isabelle FRECHON
En France, I40 000 jeunes de moins de 21 ans sont pris en charge par l'Aide
Sociale à l'Enfance (ASE) et accueillis en famille d'accueil, en foyer ou en
studio... (ONED, 2008). Alors que la majorité d'entre eux quitteront les
dispositifs ASE autour de 18 ans, on sait peu de choses sur la période qui suit
la fin de placement. Les travaux de Firdion (2006) montrent une forte
surreprésentation des personnes ayant été placées parmi les jeunes sans
domicile (35 % des 18-24 ans) et les études sur le devenir adulte d'anciens
placés, bien que plus « optimistes », soulignent aussi une période de sortie
difficile. Leurs trajectoires restent néanmoins mal connues. Les études
prospectives sont rares, inexistantes même en France (Frechon et Dumaret,
Ce test visait à interviewer in fine 100 jeunes : une première fois en face-à-
face au printemps 2009, et une seconde fois par téléphone, à l'automne de la
même année. Une fois l'identité graphique de l'enquête créée (logo, charte
graphique), une plaquette de présentation d'ELAP, un argumentaire destiné
aux équipes éducatives, une lettre-avis adaptée à chaque type d'interlocuteur
ont été rédigés et adressés aux différents acteurs concernés par l'étude :
centres gestionnaires, structures et familles d'accueil, jeunes échantillonnés et
parents de ces jeunes dès lors qu'il s'agissait de mineurs. En effet, pour ces
derniers (n = 70), les responsables légaux devaient être préalablement
informés de leur droit à refuser l'interview de leur enfant. Au final, 262
fiches-contact ont été distribuées aux dix enquêteurs formés pour ce test. Sur
chacune figuraient l'identité du jeune, son âge, son adresse postale, le nom de
sa famille d'accueil ou de l'établissement dans lequel il vivait. Au verso,
l'issue de chaque tentative de contact devait être notée : prise de rendez-vous,
contact avec un éducateur, refus, interview réalisée... ainsi que le jour et
l'heure de chaque essai. Une dizaine de tentatives (à des jours et horaires
variés) était requise avant d'abandonner, le cas échéant, une fiche.
6 Les logements dits « éclatés » sont des chambres ou des studios géographiquement
dispersés, qui ne se situent pas à l'adresse principale de la structure qui les gère.
236 Pratique et méthodes de sondages
alors de capter des profils de jeunes différents, ceux vivant notamment dans
des hébergements plus autonomes. Enfin, 10 % des jeunes n'étaient plus, au
moment de l'enquête, dans la structure indiquée dans le fichier ASE, ce qui
confirme la forte mobilité, y compris intra-institutionnelle, de ces jeunes.
La seconde vague d'enquête a été menée, environ 5 mois plus tard, par 8 des
10 enquêteurs ayant participé à la première phase. Annoncé par courrier,
l'entretien téléphonique d'une quinzaine de minutes visait principalement à
évaluer l'attrition tout en actualisant certaines informations collectées en
première vague.
94 % des jeunes initialement interviewés ont pu être recontactés et la quasi
totalité d'entre eux (à l'exception de 2) ont accepté de participer à cette
seconde étape - la plupart se déclarant aussi d'accord sur le principe d'un
troisième entretien. De nouveau, 4 tentatives de contacts ont été nécessaires,
en moyenne, pour réaliser un entretien mais un tiers des questionnaires ont
requis 6 appels ou plus, 7 jeunes restant finalement impossibles à joindre.
La plupart des jeunes enquêtés en première vague (92 %) avaient accepté de
donner leur numéro de téléphone portable (6 % n'en ayant pas, 2 % refusant
de le communiquer) ce qui a bien sûr considérablement facilité la collecte
suivante et permis de recontacter les jeunes malgré leur importante mobilité
intra ou extra-institutionnelle. Un tiers des jeunes avaient en effet changé de
lieu de vie entre les deux vagues. Le recueil de divers types de coordonnées et
le maintien de contacts réguliers restent néanmoins primordiaux pour éviter
l'attrition. De ce point de vue, si très peu d'adresses email ont été collectées
en première vague, 2 jeunes sur 3 avaient en revanche mentionné une
« personne relais » (parfois deux) susceptible de faire le lien avec eux en cas
de changement de coordonnées. L'exploration des liens entre les jeunes et ces
personnes relais montre la prédominance de la sphère institutionnelle dans ces
réseaux relationnels. Sur 74 personnes citées, 48 appartiennent à l'univers de
l'ASE (famille d'accueil, éducateur, responsable de foyer...), 15 à la sphère
amicale et enfin 11 sont des membres de la famille.
Si les résultats de cette seconde vague sont très satisfaisants, cette
expérience montre néanmoins l'importance de conduire, durant les 12 à 18
premiers mois du suivi au moins, des vagues de collecte plus rapprochées
(tous les 6 mois environ) qu'initialement projeté. Cet étroit suivi est non
seulement important pour limiter l'attrition mais c'est aussi une nécessité
pour collecter des informations précises sur les changements, nombreux et
rapides, qui jalonnent les trajectoires professionnelles et résidentielles de ces
jeunes en fin de placement et durant leurs premières années d'autonomisation.
5. Enquêtes longitudinales et rétrospectives 237
BIBLIOGRAPHIE
biographiques en Afrique
7
Philippe ANTOINE
2.1 Introduction
Le recueil des biographies s'appuie sur un bon repérage dans le temps des
événements vécus par l'enquêté. Peu de personnes mémorisent les dates des
événements vécus, mais en revanche, l'enchaînement des événements
familiaux est facilement gardé en mémoire. Dans le cas de ces enquêtes, pour
aider les personnes enquêtées à placer dans le temps les principaux moments
de leur vie, nous avons eu recours à la fiche Ageven (Antoine, Bry et Diouf,
1987) qui met en correspondance les âges et les événements. Les événements
vécus sont replacés au fur et à mesure de l'entretien sur une fiche où figurent
une échelle de temps (années calendaires) et la durée écoulée depuis
l'événement.
2.2.2 Le questionnaire
2.3.1 L'analyse
Le recul de l'âge au premier mariage des femmes est souvent imputé à une
série de facteurs liés plus ou moins directement à l'urbanisation ; scolarisation
plus importante des filles, activité des femmes, en particulier dans le secteur
moderne de l'économie, adoption de nouveaux comportements et de
nouvelles conceptions des relations sentimentales avant le mariage. L'effet de
générations est bien mis en évidence dans les différentes enquêtes
240 Pratique et méthodes de sondages
2.4 Conclusion
BIBLIOGRAPHIE
8
Le/Va BOUFRAIOUA
de 18 ans, et celui des hommes de 24 ans, nombre de jeunes filles étaient donc
mariées dès la puberté. C'est au début des années 1980 que l'âge au 1CI
mariage des femmes enregistre un net recul de quatre ans pour atteindre en
moyenne 22 ans contre 27,7 ans pour les hommes (recensement). Depuis plus
d'un quart de siècle, le schéma nuptial a connu de profonds changements. En
l'espace de quelques décennies, les mariages précoces ont laissé place aux
mariages tardifs et le choix du conjoint, qui relevait autrefois de l'autorité des
aînés, laisse aujourd'hui une plus grande liberté aux jeunes générations.
Cependant, cette liberté de choix du conjoint reste entravée par le wali, c'est-
à-dire le tuteur matrimonial. Dans l'esprit du législateur, le tuteur est établi
dans l'intérêt de la femme. Le wali prend en charge la conclusion du contrat
de mariage, cette procédure s'établit devant deux notaires appelés les
« Adoul ». L'article 11 de la Moudawana dresse par ordre de priorité la liste
des tuteurs allant du père à n'importe quel autre membre masculin de la
famille. Le futur époux peut conclure personnellement son contrat de mariage,
tandis que la femme doit désigner un tuteur pour conclure son mariage. En
2004, le code de la famille a été réformé, et la tutelle matrimoniale est
annulée, même si dans les faits elle se maintient encore. Paradoxalement,
l'endogamie familiale est restée à un niveau stable (1/3 des mariages) et le
célibat définitif rare (autour de 3 %). En 2004, les indicateurs de nuptialité
indiquaient une hausse radicale de l'âge au Ie' mariage, les hommes se
mariant en moyenne à l'âge de 31 ans contre 26 ans pour les femmes.
ville et celle de sa région (Sous Massa Drâa) on constate qu'à Sidi Ifni, les
hommes se marient quatre ans plus tard, et les femmes trois ans plus tard
qu'au niveau régional. Cependant, le recensement ne permet pas de
comprendre et d'expliquer ce retard de l'âge au 1er mariage, d'où la nécessité
d'effectuer une enquête de terrain. Il s'agit d'observer les transformations
progressives des régimes de nuptialité qui ont touché la ville de Sidi Ifni. Les
évolutions sociales, notamment l'âge au 1er mariage particulièrement élevé à
Sidi Ifni, révèlent-elles un changement dans le système matrimonial ? Quel
est le degré de similitude ou de dissemblance qui existe entre les schémas de
primonuptialité féminins et masculins. Le retard au 1er mariage chez les
hommes et les femmes répond-il à l'évolution des mêmes variables
explicatives ? Quels sont les facteurs qui ont contribué à un éventuel
affaiblissement du modèle culturel traditionnel du mariage ? Selon les
recensements ou les enquêtes sociodémographiques précédentes, les raisons
invoquées pour justifier ce retard à la primonuptialité, plus particulièrement
chez les femmes, sont généralement la scolarisation, l'accès à l'emploi des
jeunes filles, et chez les hommes la crise économique (le chômage et la crise
du logement). Dans le cadre de l'étude d'un phénomène aussi complexe que
la nuptialité, nous proposons une approche diachronique des évolutions de la
primonuptialité, en analysant conjointement les changements socioculturels,
économiques et la dynamique des structures familiales afin d'expliquer ce
retard de calendrier du premier mariage.
934 19 il
1911 944
954 1991
1991
191.1
1974 19/J
1981 1901
994 1994
2004
1200 1000 -A a: 0 o *n 6:; 1000 1200
Effectifs en centimes Effectifs en centaines
Source : Recensement 2004.
244 Pratique et méthodes de sondages
africain
BIBLIOGRAPHIE
5. Migrations internationales et
trajectoires matrimoniales :
sénégalaises
13 14
Cris BEAUCHEMIN , Arnaud BRINGÉ et
15
Elisabeth MORAND
16 Les résultats présentés dans cet article exploitent les données de l'enquête MAFE-
Sénégal. La partie sénégalaise du projet Migrations entre l'Afrique et l'Europe (MAFE)
est coordonné par l'Ined (C. Beauchemin), en association avec l'Institut de Population,
Développement et Santé de la Reproduction de l'Université de Cheikh Anta Diop
(IPDSR, Sénégal). Sont également impliqués : l'Université Pompeu Fabra (P. Baizan),
le Centro Nacional de Investigacion Cientificas (A. Gonzalez-Ferrer), et FIERI (Forum
Internazionale ed Europeo di Ricerche suH'Immigrazione ; E. Castagnone). L'enquête a
été réalisée grâce au soutien financier de l'Ined, de l'Agence Nationale de la Recherche,
de la région Ile de France Région, et du programme FSP 'Migrations internationales,
recompositions territoriales et développement dans les pays du Sud.
17 Pour plus de détails sur cette enquête (questionnaires, méthodologie, document de
travail...), voir le site : http://www.mafeproject.com/.
18 Le seuil de 15 ans permet d'exclure les migrations des enfants de l'analyse (qui par
nature ne sont pas liées à un événement matrimonial concernant ego) sans pour autant
perdre les premières unions précoces, relativement fréquentes dans la population
féminine sénégalaise. Le seuil de 40 ans permet, quant à lui, d'éviter une trop grande
hétérogénéité dans les durées d'observation des individus, sans perdre pour autant un
trop grand nombre d'événements, ceux-ci survenant essentiellement avant l'âge de
40 ans. NB : pour les personnes nées après 1968, la période d'observation s'arrête avant
40 ans, à l'âge de l'enquête. Au total, 734 individus sont inclus dans l'analyse, dont 562
enquêtés en Europe (migrants actuels) et 172 au Sénégal (migrants de retour).
19 On considère donc comme simultanés deux événements pouvant ne pas être proches
dans le temps (21 ans 1 mois et 21 ans 11 mois). L'absence d'information sur les mois
de migrations ou les dates des unions impose cette contrainte.
252 Pratique et méthodes de sondages
La trajectoire d'un individu est décrite par la séquence constituée des états
pris chaque année entre 15 et 40 ans^ . On aura, par exemple, la séquence
répétée suivante : SS-SS-SS-SS-SS-SS-SS-SS-SS-SS-ES-ES-ES-ES-ES-ETS-
ETS-ETS-ETS-ETS-ETS-ETS-ETS-ETS-ETS-ETS, que l'on peut aussi noter
sous la forme : SS/10-ES/5-ETS/11 (état suivi du temps passé dans cette état).
La trajectoire des individus peut aussi être analysée en faisant abstraction du
nombre d'années passées dans chaque état. On parle alors de séquence non
répétée qui, appliquée à l'exemple précédent, prend la forme suivante : SS-
ES-ETS.
Notre objectif est de décrire, de manière synthétique, l'articulation des
trajectoires migratoires et matrimoniales des 734 individus observés. Faute de
> • • xi 21 t •
place, nous ne présenterons ici que les résultats" d'une seule technique
d'analyse : l'identification des séquences les plus fréquemment observées.
' • • 22
Les analyses sont effectuées en distinguant le sexe"" et le statut migratoire au
moment de l'enquête (l'échantillon sénégalais concerne des migrants de
retour, l'échantillon européen des migrants actuels). Tous les résultats
présentés sont pondérés. La construction des variables et la constitution des
fichiers d'analyse ont été réalisées avec le logiciel STATA®, les statistiques
descriptives sur les séquences avec le package Traminer du logiciel R
(Gabadinho, Ritschard, Studer et Millier, 2008).
5.2 Résultats
20 On enregistre donc un maximum de 26 états pour les individus ayant atteint 40 ans
avant l'année de l'enquête. Pour le plus jeune individu de l'échantillon, 10 états
seulement sont enregistrés.
21 Les résultats d'autres techniques seront présentés dans une publication ultérieure.
22 Afin de distinguer les spécificités des trajectoires masculines et féminines.
5. Enquêtes longitudinales et rétrospectives 253
Chez les hommes, deux figures émergent nettement : d'une part, celle du
migrant solitaire marié. Le cas H1 représente la plus simple et la plus
fréquente séquence de ce type ; Ego d'abord célibataire au Sénégal (SS),
épouse une sénégalaise (SCS) et part à l'étranger en laissant sa conjointe au
pays (ETS). Le cas H10 est une variante de Hl. L'état de couple transnational
(ETS) peut être relativement durable. Il peut être suivi d'un regroupement
familial (H7), d'une rupture (H9, cas plus rare), ou encore d'un retour au pays
d'ego. Ceci n'est pas un cas fréquemment observé dans l'échantillon
européen" . En revanche, il est relativement fréquent parmi les migrants de
retour : au moins 18 % d'entre eux ont eu une trajectoire du type SS-SCS-
ETS avant de rentrer au pays. La deuxième figure masculine émergente est
celle du migrant célibataire. Au moment de la troncature, 14 % des hommes
ont eu une trajectoire très simple du type SS-ES (cas H2). D'autres sont entrés
en union, et il n'est pas rare que cette union ait été conclue avec une femme
restée au Sénégal. Les migrants partis célibataires, mariés à distance
représentent ainsi 21 % des observations pondérées du top 10 (H2, H5, H8).
Chez les femmes enquêtées en Europe, le cas le plus fréquemment observé
(13 %) renvoie au cas type de l'épouse regroupée (El) : la femme contracte
une union au Sénégal (SS-SCS), son conjoint part à l'étranger (STS) et elle le
rejoint (ECS). Si l'on tient compte des variantes du cas FI (F4, F5, F7, F9), il
ressort qu'environ un tiers des migrantes résidant en Europe ont rejoint leur
23 Cela supposerait que le migrant ait fait un retour au Sénégal, puis un retour en Europe.
254 Pratique et méthodes de sondages
BIBLIOGRAPHIE
familiales et intergénérationnelles
24
Arnaud RÉGNIER-LOILIER
6.1 Introduction
-X. X
_x_
o / X. o X
0
00 O 00
o 0 000
o
STATUT
D'OCCUPATION DU
LOGEMENT
• o
.aie - V /
ONATUf E TAILLE DE L'UNITE URBAINE ETAT DE SANTE INTENTION DE MODE DE COHABITATION CATEGORIE
GRISAT ON PERÇUE DEMENAGER DANS SOCIOPROF3SIONNELLE
IXPRES i LES 3 ANS
Source : Ined-Insee, ERFI-GGS1-2, 2005-2008
Légende : rond grisé : facteurs ayant une influence significative sur la probabilité
d'attrition, au seuil de 5 % ; croix : facteurs dont l'influence est non significative.
Lecture : la « personne de référence » (réunissant l'ensemble des caractéristiques de
référence : un homme, de 30 à 34 ans, etc.) a une probabilité de 31,2 % de ne pas avoir
été réinterrogé en 2008 (ligne continue). La probabilité pour une femme réunissant les
mêmes caractéristiques de référence est de 28,6 %, « toutes choses égales par
ailleurs », probabilité significativement inférieure à celle des hommes.
258 Pratique et méthodes de sondages
BIBLIOGRAPHIE
26 Un certain nombre de refus de participer à la seconde vague parmi des personnes ayant
accepté de participer au panel en 2005 sont en effet parvenus au service des enquêtes
pour ce motif.
5. Enquêtes longitudinales et rétrospectives 259
France
27 28
Aurélie VANHEUVERZWYN et Eléna VOUGE
7.1 Introduction
7.2 Méthodologie
leur lieu de travail étaient alors mesurés sur les deux lieux. Les taux de
recrutement et de maintien de ce sous-échantillon déclinant d'année en année,
il a été décidé de laisser aux panélistes le choix du lieu d'installation. Le panel
compte depuis cette date deux échantillons d'intersection non vide :
- les panélistes observés à domicile,
- ceux observés sur leur lieu de travail.
Exclusifs
domicile
Exclusifs
travail
Domicile ivail
Les individus mixtes observés sur le lieu de travail sont moins nombreux que
ceux observés à domicile. Le premier contrôle de qualité de la fusion porte sur
l'utilisation de la base des donneurs. Les objectifs sont les suivants :
- utiliser le plus grand nombre possible de donneurs,
- minimiser le nombre de réplications d'un même donneur.
Ces deux objectifs ont pour but de favoriser la diversité des comportements
d'audience sur le lieu de travail et de veiller à ne pas répliquer des
comportements qui pourraient être atypiques.
5. Enquêtes longitudinales et rétrospectives 261
Le second contrôle porte sur les résultats de duplication site par site. En
effet, on dispose d'un historique allant jusqu'en juin 2008 de duplications
observées sur des individus réellement observés sur leurs deux lieux de
connexion. On dispose par ailleurs d'une enquête externe permettant de
recueillir, en déclaratif, les lieux de connexion sur un certain nombre de sites.
L'indicateur de duplication se calcule de la manière suivante :
En toute rigueur, seules les variables communes sont utilisables dans le calcul
des distances entre individus. Or les seules informations strictement
communes sont des variables sociodémographiques. Des premiers tests ont
été menés avec ces seules variables, mais les résultats obtenus en termes de
duplications étaient très faibles. Si ces variables sociodémographiques sont
discriminantes sur le volume global de connexions à Internet, elles ne le sont
pas suffisamment au niveau des sites visités.
Les similitudes entre les sites visités depuis le domicile et le lieu de travail
ont été étudiées, sur le panel « historique », dans le but d'appréhender les
comportements communs qu'il pouvait y avoir entre les deux lieux. Cette
analyse nous a permis d'identifier un certain nombre de sites dont la
duplication est suffisamment élevée pour pouvoir les considérer comme
variables communes.
Pour toutefois ne pas mettre sur le même plan les variables
sociodémographiques, strictement communes, et les variables de connexion,
les premières sont utilisées pour la constitution de strates au sein desquelles
seront réalisées les fusions. Ces variables seront par conséquent des
contraintes obligatoires dans le rapprochement des individus.
Au cours du 4e trimestre 2009, des tests ont été réalisés dans le but de vérifier
les résultats obtenus et leur stabilité dans le temps.
Sur le plan statistique, les résultats sont satisfaisants. Près de 80 % des
donneurs potentiels sont utilisés avec un nombre maximum de dons pour un
même donneur de 8. Par ailleurs, quelle que soit la strate étudiée, l'utilisation
des donneurs est uniforme.
Pour ce qui est des niveaux de duplication obtenus, ceux-ci sont cohérents
avec les résultats historiques et on observe des hiérarchies comparables à
l'enquête externe menée en parallèle.
7.4 Conclusion
La méthode présentée dans cet article a été adoptée à partir du mois de janvier
2010. Après quelques mois d'applications, les résultats sont stables et
cohérents avec les différentes sources de validation.
5. Enquêtes longitudinales et rétrospectives 263
BIBLIOGRAPHIE
Collecte de donnés et
sondages en ligne
1
Marc CHRISTINE et Sébastien FAIVRE
3 Lesquels étaient complétés par des listes de logements « neufs », construits après le
dernier recensement, alimentées par les fichiers de pennis de construire.
4 L'enquête Emploi n'entre pas dans le champ de ce système : son échantillon est
aréolaire et, depuis le début 2009, les logements sont tirés en grappes à partir des
fichiers fiscaux.
6. Collecte de donnés et sondages en ligne 267
Un échantillon de ZAE a ensuite été tiré au sein de chaque région avec des
probabilités proportionnelles à leur taille et sous des conditions d'équilibrage
impliquant différentes données sociodémographiques : nombre de résidences
principales, revenu fiscal total, âge en trois tranches, répartition des logements
dans les espaces urbain/périurbain/rural. Les grandes communes au-dessus
d'un certain seuil sont d'office et peuvent avoir plusieurs enquêteurs affectés.
Les autres sont sélectionnées aléatoirement et attribuées chacune à un
enquêteur.
BIBLIOGRAPHIE
2.1 Introduction
2.2 Procédure
2.2.2 Le calendrier
2.3 Résultats
Au total, l 836 généralistes ont été rappelés afin que leur soit proposé ce
questionnaire « on line ». Parmi eux, 129 ont finalement accepté de répondre
par téléphone et 532 ont donné leur accord pour répondre par internet (en
acceptant de transmettre leur adresse mail). Parmi ces derniers, 286 n'ont pas
répondu, 47 ont abandonné en cours de questionnaire, et pour 14, un
problème d'adresse mail n'a pas permis de les inviter à se connecter sur le site
Internet mis en place; au final, 185 ont répondu au questionnaire web
représentant près de 9 % de l'échantillon final (n = 2 083) et 10 % des primo-
refusants. Le taux de participation global est ainsi passé de 48,0 % à 57,1 %.
Le taux de réussite diffère selon la qualification initiale des adresses : il est
relativement faible pour les appels ayant conduit à un raccrochage (4,2 %) ou
à un refus de la part du secrétariat (5,5 %) contrairement aux situations de
refus du médecin (13,2 %). Le taux de réussite pour les médecins n'ayant pu
honorer les rendez-vous téléphonique est quant à lui particulièrement
important (9,9 %) alors même que les médecins n'ont eu qu'une semaine pour
répondre.
Pour 40 % des 185 médecins ayant répondu au questionnaire web, une relance
par mail a été nécessaire. Près des deux tiers (63,8 %) ont répondu en une
seule fois, 18,9 % en deux fois. Plus de 2 connexions ont été nécessaires pour
17,3 % des médecins (le maximum atteignant 12 connexions).
Un quart des interviews a été réalisé la dernière semaine, suite à la relance
générale. La majorité des interviews a été réalisée à des horaires et dates pour
lesquels l'enquête téléphonique ne pouvait être assurée : 27,8 % des
connexions ont eu lieu entre minuit et 5 heures du matin, 24,9 % entre 5 et 8
heures et 17,8 % entre 21 heures et minuit. Une sur dix a eu lieu le dimanche.
La durée globale pour répondre au questionnaire « on line » s'est avérée
équivalente à celle de l'enquête téléphonique, soit 25 minutes.
2.4 Conclusion
BIBLIOGRAPHIE
Aulagnier, M., Obadia, Y., Paraponaris, A., Saliba-Serre, B., Ventelou, B.,
Verger, P., Les membres du comité de pilotage et Ventelou, B. (2007).
L'exercice de la médecine générale libérale. Premiers résultats d'un panel
dans cinq régions françaises. Etudes et résultats, no610.
Beck, F., Guilbert, P., Gautier, A. et Arwidson, P. (2008). L'acharnement
téléphonique dans les enquêtes est-il justifié ? Dans Méthodes de sondages -
Cours et cas pratiques - Master, écoles d'ingénieurs, (Dir., P. Guilbert,
D. Flaziza, A. Ruiz-Gazen et Y. Tillé), Dunod, Paris, 254-259.
Gautier, A. (2005). Baromètre santé médecins/pharmaciens 2003, INPES.
Gautier, A. (2008). Enquête Nicolle 2006, INPES.
274 Pratique et méthodes de sondages
3.1 Introduction
a) Le volet Unité
Dans un premier temps, les directeurs des unités de recherche ont été appelés
à répondre sur les langues pratiquées dans le cadre de leur unité, pour les
publications, les séminaires et les rencontres internationales en France, mais
aussi pour les traductions et les formations. Ils étaient également invités à
exprimer leurs propres opinions sur révolution internationale des pratiques,
les perspectives, les politiques convenables et leurs objectifs et moyens. Le
remplissage du questionnaire durait en moyenne une heure.
La consultation était exhaustive : l'ensemble des 3 645 directeurs d'unités
éligibles ont été contactés. Durant la collecte (décembre 2007 - avril 2008) et,
après plusieurs relances, 1 946 directeurs ont rempli le questionnaire (53 %).
b) Le volet Individu
3.4 Conclusion
BIBLIOGRAPHIE
13
Régis BIGOT et Patricia CROUTTE
4.2 Méthodologie
Dans un certain nombre de cas, le redressement ne corrige pas les écarts entre
les internautes et la population générale. Par exemple, 63 % des internautes
sont partis en vacances au cours des douze derniers mois, contre 34 % des
non-internautes. Après redressement, le taux de départ dans l'échantillon des
internautes diminue à 59 %, mais reste éloigné du taux observé en population
générale (53 %).
70
60
50
40
30
20
10
0 i— —r
Internautes Non Échantillon Ensemble de la
internautes d'internautes population
redressé
Le redressement est
insuffisant dans 17
cas où les
internautes étaient a Les internautes sont
priori différents similaires, avant
redressement, à la
population générale
Le redressement est dans 43 cas
efficace dans 44 cas
où les internautes
étaient a priori
différents
4.4 Conclusion
Cette expérience montre qu'un redressement peut être efficace dans un grand
nombre de cas pour corriger les biais liés au fait que l'on n'interroge que des
internautes. Mais ce redressement n'est pas toujours efficace, même lorsque
les calculs de pondération cherchent à contrôler très précisément le profil des
internautes. D'autres facteurs que les critères sociodémographiques entrent en
ligne de compte ; le fait, en soi, d'être internaute ou pas est lié, toutes choses
égales par ailleurs, à des attitudes, des opinions ou des comportements
spécifiques.
La principale limite de cette expérience tient à son côté « artificiel ».
L'idéal consisterait plutôt à réaliser deux enquêtes en même temps : l'une en
face-à-face et l'autre sur Internet, afin de comparer les résultats de ces deux
modes de recueil des données. En particulier, ce test ne dit rien du problème
d'auto sélection. La plupart des enquêtes en ligne sont en effet réalisées via
des access panels : les panélistes ont demandé ou accepté d'être interrogés
régulièrement ; non seulement ils n'ont pas été choisis au hasard, mais le
risque que certains soient des « professionnels » des enquêtes est non nul.
6. Collecte de donnés et sondages en ligne 283
données Afrobaromètre
17
Sondo EloiSOMTINDA
5.1 Introduction
5.2.2 L'Internet
L'avantage des sondages à travers l'Internet est son caractère intime. En effet,
les répondants peuvent répondre franchement ce qu'ils pensent sans être
influencés par l'intervieweur. On sait que pour les sujets délicats, il vaut
mieux éliminer l'intervieweur du processus qui entraîne des réponses
socialement acceptables et pas vraiment la vérité. Les sondages en ligne sont
aussi plus fiables, car pour certains types de questions, il est préférable
d'utiliser le sondage en ligne, car on peut montrer des images. Ils permettent
en outre de joindre plus facilement certaines catégories de personnes qui sont
très actives et difficilement accessibles au téléphone (jeunes qui sortent
beaucoup, cadres actifs, médecins, etc.). Cette stratégie de sondage possède
néanmoins des inconvénients. Le principal est le taux de non-réponses élevées
6. Collecte de donnés et sondages en ligne 285
80
■ Pas d'éducation
Niveau primaire
■ Niveau secondaire
■ Niveu universitaire
Les figures ci-dessus montrent que les diplômés utilisent en plus grande
proportion le téléphone portable et l'Internet. L'ampleur de l'utilisation du
téléphone portable croît presque pratiquement avec le niveau d'éducation. Il
en est de même avec l'Internet, mais la proportion des diplômés (20,28 %) qui
font usage de l'Internet régulièrement est relativement basse, mais non
négligeable. Sur la base de ces résultats, on pourrait d'emblée croire qu'un
sondage en ligne via Internet dans les pays africains ne serait pas efficace. Ce
serait se tromper largement. Un sondage pour l'insertion des diplômés serait
d'autant plus efficace que les diplômés ont une forte probabilité d'avoir
recours au téléphone et l'Internet comme moyen de communication et
d'information. Fort de cela, nous estimons dans la partie suivante l'estimation
de cette probabilité.
Le point passé nous a permis de formuler une présomption sur le lien existant
entre le niveau d'éducation et l'usage du téléphone portable et de l'Internet.
Cette partie nous permet de tester cette hypothèse du lien positif entre ces
deux variables. Nous avons utilisé à cet effet un modèle de régression logit
multinomial où la variable dépendante est l'utilisation du téléphone portable
et de l'Internet, et le vecteur des variables indépendantes contient le niveau
d'éducation, la confiance interpersonnelle, le genre, le milieu de résidence, la
pauvreté vécue et le niveau de sécurité sociale.
6. Collecte de donnés et sondages en ligne 287
5.4 Conclusion
Les sondages par téléphone portable et par Internet sont des méthodes de
sondage dont les observations peuvent être utilisées par un bon nombre de
pays africains, bien qu'elles présentent des inconvénients. Les fréquences
d'utilisation quotidienne du téléphone portable par les diplômés s'avèrent fort
élevées. Il en est de même pour la probabilité d'usage réguler de ces
instruments de communication et d'information. La recherche d'informations
sur l'Internet est, par contre, moins pratiquée par la plupart des diplômés.
Néanmoins, la probabilité qu'un diplômé utilise fréquemment l'Internet est
grande, ce qui rend possible son utilisation par les observatoires. Cependant,
cela doit se faire avec de mesures prudentielles, car l'adresse des étudiants est
rapidement mise hors service lors de leur sortie.
Il émane aussi de nos analyses que le critère genre doit être pris en compte
lors d'une pratique de sondage en ligne à travers le téléphone portable et
l'Internet. Par ailleurs, la pauvreté vécue par les diplômés ne constitue pas un
obstacle au recours de ces méthodes. Elle en est plutôt, une raison.
288 Pratique et méthodes de sondages
BIBLIOGRAPHIE
Beaupère, N., et Giret, J.-F. (2008). Les enjeux méthodologiques posés par le
suivi de l'insertion des diplômes de l'enseignement supérieur au niveau
local, régional et national. Nef, n028.
d'abonnés au téléphone
18
Nathalie BELTZER , Régis BIGOT19, François BECK20,
Laurent TOULEMON21, Christophe DAVID22,
Isabelle G REM Y 23 et Josiane WARSZAWSKI24
6.1 Introduction
6.3.1 Participation
Le test pilote a montré qu'il est possible d'interroger des hommes et des
femmes pendant près de 45 minutes sur un téléphone mobile, durée plus
longue que celle prévue initialement.
Il a été décidé de ne pas envoyer dans l'enquête réelle de SMS d'annonces
aux personnes interrogées via leur mobile. A chaque tentative de contact, un
numéro régional (en 01) d'accès gratuit s'affiche, plutôt qu'un numéro
masqué ou un numéro en 0800, afin de laisser la possibilité aux personnes
interrogées de rappeler en cas de coupure accidentelle.
26 Cette enquête a pour objectif d'étudier les enjeux en santé reproductive des femmes et
des hommes âgés entre 15 et 49 ans en s'appuyant sur une approche biographique.
27 II se pourrait que le groupe ayant reçu le SMS leur précisant le numéro qui serait
présenté au moment de la tentative d'appel ait filtré les appels.
6. Collecte de donnés et sondages en ligne 291
Group
000 000 Groupe Groupe Ha Groupe llb
sur-échantillon iiiin N = 4 000 N = I 000
franciliens ,
6.5 Conclusion
BIBLIOGRAPHIE
Beltzer, N., Fénies, K., Halfen, S., Lert, F., Levu, S. et Lydié, N. (2005). Les
connaissances, attitudes, croyances et comportements face au VIH/sida en
France - Évolutions 1992-1994-1998-2001-2004. Rapport de FORS Ile-de-
France.
Bigot, R., et Croutte, P. (2008). La diffusion des technologies et de la
communication dans la société française. Rapport du CREDOC, Paris.
Beck, F., et Guilbert, P. (2007). Baromètres santé : un éclairage sur leur
évolution. Dans Baromètre santé 2005 : Attitudes et comportements de
santé, (Éds., F. Beck, P. Guilbert et A. Gautier), INPES, Saint-Denis, 27-43.
pratiques addictives
En dépit des tailles d'échantillons importantes des deux enquêtes, qui offrent
une très bonne sensibilité aux tests, la plupart des différences observées selon
le mode de recueil de données se sont révélées non significatives, en dehors
de la consommation d'alcool. Ces résultats persistent après ajustement sur le
sexe, l'âge, la vie de couple, la situation professionnelle et le niveau de
diplôme dans des modèles logistiques.
7.4 Conclusion
BIBLIOGRAPHIE
Organisationnels et Informatisation
2006
32
Elisabeth ALGAVA
par téléphone, soit qu'elles aient été injoignables par téléphone mais
contactées directement à leur domicile.
85 % des questionnaires ont été passés par des enquêtrices, les femmes
étant très majoritaires dans le réseau de l'Insee. Lorsque l'enquêteur est un
homme, l'entretien s'est plus souvent déroulé en face-à-face (19% contre
13 %). Cet écart reste d'ampleur importante toutes choses égales par ailleurs
et l'odd ratio associé est de 1,8. La présence des hommes enquêteurs, bien que
toujours minoritaire, est en effet très variable selon les régions et le type
d'agglomération notamment. Enquêteurs hommes comme femmes ont moins
souvent recours au face-à-face dans l'agglomération parisienne et dans les
zones rurales ou les petites agglomérations et ce comportement dépend assez
peu du sexe de l'enquêté.
Le niveau de diplôme et la catégorie socioprofessionnelle dessinent une
opposition très marquée entre ceux qui sont interrogés par téléphone - les
cadres et les plus diplômés - et ceux que les enquêteurs rencontrent en face-à-
face - les ouvriers, les personnes moins diplômées. Ainsi, 25 % des salariés
de niveau d'études primaire sont interrogés en face-à-face, contre 5,5 % de
ceux passés par une grande école ou une école d'ingénieur. Plus
généralement, le face-à-face est plus fréquemment utilisé auprès des
personnes qui semblent avoir une insertion sociale et professionnelle plus
fragile : celles qui ont un handicap ou un problème de santé qui les empêche
d'effectuer certaines tâches ou de tenir certains postes, celles dont les deux
parents sont nés à l'étranger ; celles qui vivent dans une famille
monoparentale ou encore celles qui travaillent moins de 35 heures par
semaine.
influe sans doute aussi sur les réponses données et la différence selon
les modes de collecte.
3. Les hommes semblent plus confiants et expansifs en face-à-face tandis
que les femmes semblent plus indifférentes au mode de passation. Pour
les hommes, vingt-trois indicateurs sont significativement affectés par le
mode de collecte, onze seulement pour les femmes. Une des pistes
d'interprétation consiste à dire que les hommes au téléphone se limitent
plus souvent aux réponses convenues, qu'ils estiment attendues du fait
notamment de leur intériorisation du rôle social de l'homme au travail.
Pour un homme comme pour une femme, décrire ses conditions de
travail comme mauvaises n'est ni très facile ni très valorisant. Mais la
marche à franchir serait plus haute pour les hommes.
BIBLIOGRAPHIE
mixte innovant
33
Flora CHANVRIL et Viviane LE HAY34
38 Dans l'enquête CAWI, les communes de moins de 20 000 habitants sont sous-
représentées ; celles de plus de 100 000 habitants sont sur-représentées.
39 Dans le premier cas les retraités sont recodés selon leur ancienne profession, dans le
second ils ne le sont pas.
40 Cette variable est présente dans l'enquête CATI, donc comparable, même s'il ne s'agit
pas d'un quota.
6. Collecte de donnés et sondages en ligne 303
Une procédure statistique en trois étapes a été adoptée. Premièrement, des tris
croisés, selon le mode d'administration, ont permis de sélectionner les
questions retenues pour l'analyse. Seules celles pour lesquelles les
distributions des modalités de réponse sont statistiquement exploitables sans
recodage41 et dont le V de Cramer était supérieur ou égal à 0,15 ont été
conservées : 32 questions sur les 75 questions communes aux deux
enquêtes42, présentant un effet brut du mode d'administration, ont ainsi été
retenues. Deuxièmement, des régressions logistiques multinomiales ont été
réalisées sur les variables de confiance afin de raisonner « toutes choses égales
par ailleurs ». Elles permettent de mesurer l'effet du mode d'administration tout
en introduisant dans le modèle les cinq variables sociodémographiques
communes aux deux enquêtes et comparables (sexe, âge, niveau de diplôme et
profession de la personne interrogée, catégorie d'agglomération). Troisièmement,
les probabilités prédites obtenues ont enfin été comparées par des tests de
Student, pour mieux comprendre les écarts engendrés par ces deux modes
d'interrogation. L'ensemble de ces régressions montre un effet significatif du
mode d'administration. Cela confirme son influence massive sur la mesure
des concepts de la confiance.
9.3.2 Résultats
45
Figure 6.7 : Histogramme des probabilités prédites et écarts
75% - -- 0,75
607< -- 0,6
457 -- 0,45
307© -- 0,3
157 0,15
I i: WD ♦♦ HH
07 ♦♦
157. -- -0,15
307
Tout a Plutôt Ni ni Plutôt Pas du Tout à Plutôt Ni ni Plutôt Pas du
fait pas tout fait pas tout
d acc. d'acc. d'acc. d'acc.
CATI □ CAWI B Ecarts (CATI - CAWI)
9.4 Conclusion
BIBLIOGRAPHIE
mixte
47
Caroline BAYART et Patrick BONNEL
10.1 Introduction
Face au déclin des taux de réponse des enquêtes ménages déplacements, il est
nécessaire que les recherches sur les méthodes d'enquêtes travaillent sur la
mise en place de protocoles d'enquête mixtes. Dans cette perspective, le
Laboratoire d'Économie des Transports a mené une enquête web auprès des
non-répondants à l'enquête ménages déplacements, administrée en face-à-face
sur l'agglomération lyonnaise en 2005-2006 (Bayart et Bonnel, 2008).
L'analyse comparative des données montre que, globalement, les répondants
en face-à-face se déplacent davantage que les répondants web (3,31 vs 3
déplacements quotidiens). Cet écart s'explique par une forte proportion de
personnes immobiles, en particulier dans l'enquête web (environ une
Nous considérons une variable aléatoire j,- distribuée selon une loi de Poisson
avec G,- = exp(P'v/), Xj étant un vecteur de variables explicatives et p un
vecteur de paramètres. Si ^ est positive, alors nous pouvons écrire :
P(};/>O) = l-exp(-0,).
Pour illustrer nos propos, nous utilisons les données issues de l'enquête
ménages déplacements réalisée à Lyon en 2006. L'analyse est menée sur
l'échantillon web, d'une part, et face-à-face, d'autre part (tableau 6.4).
10.4 Conclusion48
BIBLIOGRAPHIE
11.1 Introduction
Les Baromètres santé ont été créés au début des années 1990 (Baudier,
Dressen et Alias, 1994). Depuis près de vingt ans, ces enquêtes permettent de
suivre les principaux comportements, attitudes et perceptions liés aux prises
de risques et à l'état de santé de la population résidant en France
métropolitaine : tabagisme, alcoolisation et consommations d'autres drogues,
18
16
12
2
0 —
1998 2000 2002 2004 2006 2008
11.5 Conclusion
BIBLIOGRAPHIE
50 Laboratoire d'Économie des Transports, UMR CNRS 5593, Université de Lyon (École
Nationale des Travaux Publics de l'État). Courriel : lourdes.diaz-olvera@entpe.fr ;
didier.plat@entpe.fr ; pascal.pochet@entpe.fr.
6. Collecte de donnés et sondages en ligne 315
Quelle est l'ampleur des disparités sociales de mobilité selon la précision des
revenus ? Pour le savoir, ce mode de recueil est mis en perspective avec celui
utilisé dans l'enquête sur le cadre de vie des populations de Yaoundé et
Douala (CAVIE, 2002). Dans cette enquête, les revenus de l'ensemble des
membres du ménage sont obtenus par le biais d'un seul informateur (le chef
de ménage ou son conjoint) et pour un nombre plus limité de postes.
La comparaison de l'impact du mode de recueil des revenus sur les mesures
d'inégalités est effectuée par simulation, dans l'enquête PMU, de revenus
selon un mode de recueil simplifié. Cette simulation consiste en une mise à 0
aléatoire de certains revenus de l'enquête PMU pour aboutir à la même
316 Pratique et méthodes de sondages
répartition des individus selon les catégories de revenu principal que celle
issue de l'enquête CAV1E (Tableau 6.5). Trois cent simulations ont été
réalisées. Les coefficients de concentration obtenus avec les revenus observés
sont comparés à la moyenne des coefficients de concentration avec revenus
simulés (Tableau 6.6). Ces coefficients, obtenus en triant les individus ou les
ménages par revenu croissant, mesurent les écarts de surface entre la courbe
de concentration de l'indicateur de mobilité et la droite d'équi-répartition.
Observee
o Simulées
| 0-8 "
w
Q)
W
c
(D
Q.
^ 0.6 -
w
0)
"D
-0)
=3
CD
O)
S
C
O
Q-
BIBLIOGRAPHIE
A la Société National des Chemins de Fer (SNCF), des moyens visant à lutter
contre la fraude tarifaire sont déployés quotidiennement, pour autant ce
phénomène reste par nature difficilement mesurable et quantifiable. Cette
recherche vise à fournir une méthodologie scientifique solide pour mieux
quantifier ce phénomène à la fois en nombre (taux de fraude) et en montant
(perte financière associée). Pour cela, l'idée est de s'appuyer sur les données
issues des contrôles quotidiens effectués à bord des trains.
Une unité primaire d'échantillonnage est constituée par la donnée d'un train,
d'un tronçon et d'une date (ttd). La population Uj des unités ttd est découpée
en H strates notées Un, ..., UIH de tailles respectives M,, ..., MH. On note
également TV,, ..., NH le nombre (connu) respectif d'unités voyageur dans
chacune des strates. Lors du premier degré de tirage, un échantillon
d'unités ttd est sélectionné par sondage aléatoire simple de taille m]h dans
chaque strate Ulh. Un échantillon Sih de nih unités voyageur est ensuite
sélectionné parmi les Nih unités voyageur de chaque unité primaire uih e SIh.
La somme totale Th non réglée par les fraudeurs dans la strate UIh peut être
estimée sans biais par
fh=M2L ^ ^ (1)
m n
\h uiheS,il ih keSih
en notant tkih la somme totale non réglée par l'unité voyageur k de uih, que
l'on suppose relevée sans erreur si l'individu k est contrôlé. Comme le
nombre d'unités voyageur dans chaque strate est connu, on peut également
utiliser un estimateur par le ratio (Chandesris, Chauvet et Deville, 2010). Un
estimateur de variance sans biais pour V(Th) est donné par
/ \ 2
m \h n ih \ vt(ih)
v(fh) = Ml I - y Ni 1 (2)
Mhy m m
\h \h uiheSlh "ihj ih
l l Vy{ih)
S l - ih
v T
i h) = y{Ih) + Z Niih - MhSy(Ih) (3)
m, M h ihesh N;ih nih
1 ^ . n;ih Vy{ih)
Dl = s2ym + E Niih 1 - (4)
M h ihesh N;ih ih
h — \ mh
et
sr=imA=m w
Pour chaque allocation, on fournit le nombre de ttd attribué par strate ainsi
que la valeur obtenue pour la somme S = X/^i
BIBLIOGRAPHIE
poissoniens
2.1 Introduction
s1 H
i-
0 717
Le segment [0, 1] est ainsi divisé en deux parties (dont l'une pourrait
éventuellement être vide si tc1 est égal à 0 ou \). Si X est dans la
première partie, c'est-à-dire compris entre 0 et n\ l'unité est
sélectionnée à la première enquête, dans l'échantillon s\ et sinon
elle n'est pas sélectionnée.
- Lors de la deuxième enquête, on peut choisir de coordonner
positivement par rapport à la première, ou bien négativement. Ici
encore, on va définir une zone de sélection constituée d'un ou
plusieurs intervalles inclus dans [0, 1] et de longueur totale ti2, la
probabilité d'inclusion de l'unité à la deuxième vague. Si l'on veut
obtenir une coordination positive, il faudra choisir une zone qui ait la
plus grosse intersection possible avec la zone de sélection de la première
enquête [0, ti1 [, et au contraire, si l'on veut une coordination
négative, il faudra choisir une zone qui ait la plus petite intersection
possible avec cet intervalle. Ainsi, dans le cas de la coordination
positive, la zone de sélection de l'unité à la deuxième enquête sera
1 • • • • O
incluse dans [0, n [ si cela est possible, c'est-à-dire si n est plus
petit que ti1 (voir Figure 7.2).
s21" i
si i- 1.
m m
9 1
Si ti" est plus grand que n, la zone de sélection contiendra tout
l'intervalle [0, ti1 [, et une partie de l'intervalle [ti1, 1] (voir
Figure 7.3).
326 Pratique et méthodes de sondages
s2 [ 1
s1 i- H
4-
0 7T/1 1
h
t -J
é* 1 \ •
0 1
** t*+
1 2 . t
Si Ti+Ti est supérieur à 1, la zone de sélection sera
[tt1, 1] u [0, ti2 + tc1 - 1] (voir Figure 7.5).
7. Théorie des sondages 327
s2 j- - - -j [ -j
1
s j- — j "j :
o*—^ i *
nl + nî-\ 4 1
2.3 Propriétés
BIBLIOGRAPHIE
de la méthode JALES+
4 Institut national de la statistique et des études économiques (Insee), Unité des méthodes
statistiques ménages. Courriel : pascal.ardilly@insee.fr.
5 Insee, Unité des méthodes statistiques entreprises. Courriel : olivier.sautory@insee.fr.
7. Théorie des sondages 329
r \ n n
k,t k,t+l
rk t = P(k <£ st+l\k g stj = Max< Min —, 1
n
K k,t y 71 k,t
6 Soit un tirage classique pour un échantillon séparé, soit une mise à jour complète
(actualisation + rotation) pour un panel.
330 Pratique et méthodes de sondages
Ainsi, une fois c fixé, les imités à faible probabilité de sélection (en
pratique de petites tailles), auront un taux de rotation rk r égal à 1, donc ne
feront qu'un passage ponctuel dans le panel - ce qui n'est pas souhaitable
dans le cas d'un panel renouvelé partiellement.
Cette méthode est utile pour renouveler partiellement des panels : elle relève
donc tout autant d'un esprit de coordination positive que de coordination
négative. Elle permet aux petites unités de rester « suffisamment longtemps »
7. Théorie des sondages 331
V (B, et co2 : r^K) < ((co2) => Sic,t(®k,i) < SmK.2)- (2)
vérifie la propriété recherchée (2), a une image incluse dans [0, 1] et possède
les mêmes paliers que F (à un ensemble de mesure nulle près). On vérifie que
pour chaque j dans l'image de G, P{u\G(ii) < y} = y. Enfin, on montre que
si f n'a pas de palier, l'image de G est exactement [0, 1] et G est alors une
fonction de coordination. On conçoit facilement que F ne soit composée -
par constaiction - que de paliers. Le palier est une situation très courante
correspondant à des algorithmes sélectionnant k en fonction du positionnement
de U)k par rapport à certains seuils. Or G n'est intéressante que lorsqu'elle
constitue une fonction de coordination : donc si F a au moins un palier, il faut
transformer G en une autre fonction g de façon à ce que cette transformée ait
une image qui soit égale à [0, 1]. Des développements complexes montrent
que si que les paliers forment un ensemble de type (J/A' ^ convient de
retenir
11 ft
^■k,t ^k,t
A partir des co^. fixés une fois pour toutes, on obtient (par avance si les
paramètres exogènes sont connus) la composition exacte de tous les
échantillons s[ puisque st ={/:|co/: g AmÎ- ^ant Q1100 enchaîne des tirages
coordonnés négativement (échantillons séparés ou premier tirage d'un panel),
si yk [ ne dépend pas de l'enquête alors les charges cumulées tendent à
s'uniformiser et ,(00) se rapproche d'une fonction constante. Sur longue
période, si les tirages sont coordonnés négativement, les différences de
charges (c'est-à-dire l'amplitude des variations de la fonction F^. ^(co))
restent bornées et même petites. En effet, si à un instant donné la charge d'une
unité k est plutôt faible (relativement aux autres unités), elle sera plus
vraisemblablement tirée, et donc sa charge augmentera. Si au contraire sa
charge est élevée, il se passera plus de temps avant qu'elle ne soit retirée, ce
qui permettra aux autres unités de la rattraper. On peut vérifier que pour toute
enquête t, lorsque f = y on a | F^ f(co,) - F^ ,((02) | < y, quels que soient
avec 1/(0) = 0. Une unité k sera dite frontalière s'il existe un entier i tel que
V(k -!)</< V(k). Les unités frontalières sont notées kh i = - 1, et
pour toute unité frontalière kh on note ai = i - V{ki - 1) et /?, = V{kj) - \ .
En particulier, on a ()<«,,/?, <!. Une microstrate £/,,/ = 1, ..., n, est
l'ensemble des unités k ûq U telles que < k < kj, avec par convention
ko = 0 et k,, = N. Notons que les microstrates peuvent se chevaucher,
puisqu'une unité frontalière peut appartenir à deux microstrates adjacentes.
Pour toute microstrate U, , on note également
2. À l'étape i
(a) On génère une variable aléatoire Uj :
(i) si l'unité £,•_] a été tirée à l'étape i - 1, selon une loi uniforme sur [/?,_], 1].
(ii) si l'unité &,_| n'a pas été tirée à l'étape / - 1, selon une loi uniforme sur
et
[0, /?z_|] avec une probabilité /(I - «/_i)(l - fy-iX selon
une loi uniforme sur [0, 1] sinon.
(b) Pour toute unité k de U, on pose /, (&) = 1 si
V{k - \) < Uj + (/ - 1) < V(k), et /,(&) = 0 sinon.
2. À l'étape i
(a) On génère une variable aléatoire vy
(b) Pour toute unité k de U, on pose Jjik) = 1 si
V(k -1) < v,- + (i - 1) < V{k), et J^k) = 0 sinon.
(c) On génère une variable aléatoire Uj :
(i) si l'unité a été tirée à l'étape i - 1, selon une loi uniforme sur [/?,_!, 1].
(ii) si l'unité £,_] n'a pas été tirée à l'étape i — 1, selon une loi uniforme sur
[0, /?,_]] avec une probabilité ai_]bi_l/(1 - «,_])(! - bj_]), et en
prenant Uj = v,- sinon.
(d) Pour toute unité k de U, on pose /, (/:) = 1 si
V{k - \) < ui + (/ - 1) < V{k), et /,(/:) = 0 sinon.
On note
/=U6t/: i= \
et
1=1
v(y(î") = =tvi,
7. Théorie des sondages 337
y^)
Cl: — Y; Cl; m. -Y:
Tiiki) l/2
C2. max,- =0{n ) et max,- = 0{n-V2).
V: v;
BIBLIOGRAPHIE
5.1 Introduction
La base de sondage obtenue du BUCREP est la liste des ZD qui sont des
portions habitables du territoire national. A partir des dix régions que compte
le Cameroun, l'INS constitue douze régions d'enquête. Les deux métropoles
Douala et Yaoundé constituent des régions d'enquête à part entière et sont
considérées comme des strates urbaines. Quant aux dix autres régions
d'enquête, elles sont subdivisées en trois strates chacune, à savoir la strate
urbaine, la strate semi-urbaine et la strate rurale.
5.5 Conclusion
BIBLIOGRAPHIE
11 12
Jean-Marie DAWAGNE et Robert MILANO
Fichier initial : toutes les déclarations nationales à VImpôt sur les Personnes
Physiques (IPP) de l'année 2007 (±11 M d'individus), contenant les variables
identifiant les provinces, communes, ménages, âges, genres et revenus.
Le plan de sondage comporte deux degrés. Premier degré : par province, on
trie la base de sondage sur le revenu moyen de la commune. Ensuite, tirage
systématique - stratifié par province - de 275 communes avec remise, tirage
proportionnel à la taille (PPT) de la commune (= #ménages/commune). Pour
chacune des 11 provinces, le nombre de communes tirées est fixé a priori.
Second degré : dans chaque commune tirée, on sélectionne un groupe de 40
ménages par sondage aléatoire simple (SAS) (#ménages = 275*40 = 11 000).
Finalement : tous les membres du ménage sont interrogés.
On veut estimer la variance des estimateurs suivants : Seuil de pauvreté
(l arpt = 60 % de la médiane), Total des pauvres, Taux de pauvreté (l arpr),
Total des « actifs occupés » (BIT1), Total des « chômeurs » (BIT2), Total des
« inactifs » (BITS). POULPE est donc testé sur des totaux et proportions.
Notation : En général, la notation suit celle de Sàrndal, Swensson et
Wretman (1992). Mi =taille de l'UP i ; M = ^iMi ;m =nombre de tirages
d'UP, qui correspond à la taille d'échantillon (avec doublons) au premier
degré ; /V, = nombre de ménages dans l'UP i ; N = X, U' =40 = nombre
de ménages à tirer dans une UP sélectionnée dans un tirage v donné ;
nt = nombre total de ménages tirés dans l'UP i, étant donné que l'UP peut être
tirée plus d'une fois ; nT = X'JLi'V
a) Approche SAS
N'
^i(h-rr) - 1 - ys-
N
où Pj =Mi /M est la probabilité que TUP i soit tirée lors du tirage v. Ceci
suggère l'estimateur de la variance suivant (Sâmdal et coll., 1992, page 151) :
1
V(f) = -X -1 (1)
m(m - l)v=i
Pi.
peut calculer les probabilités d'inclusion des UP et des US. Pour les UP, on
peut facilement montrer que la probabilité d'inclusion des UP vaut
, [Mf/P si M: < P
TC • —
[ 1 sinon, constituant la strate exhaustive.
Dans cette étude, POULPE a été utilisé selon cinq approches. Il ressort que :
1. Ces cinq approches livrent des estimateurs des différentes variances
(totaux et seuils) biaisés. L'approche « SAS Groupes » est
généralement la moins biaisée (biais important pour Taux Pauvreté).
2. L'approche « SAS Groupes » a l'EQM le moins élevé pour tous les
estimateurs étudiés.
3. Pour l'estimation de totaux et de seuils, l'approche « SAS Groupes »
livre généralement les variances estimées les plus petites. Raison
pour laquelle les intervalles de confiance à 95 % dans ce cas
recouvrent moins fréquemment la « vraie valeur » des paramètres.
4. La dispersion des 500 variances estimées sur les 500 échantillons
tirés est elle aussi la plus faible dans l'approche « SAS Groupes ».
BIBLIOGRAPHIE
Canada
13
Michel A. HIDIROGLOU
7.1 Introduction
M s e
Ydir = associée à U = U/=i^/ ' ^es sont
mutuellement
exclusives et exhaustives.
Le moyen le plus simple d'effectuer l'étalonnage consiste à inclure une
variable auxiliaire supplémentaire dans zk de sorte que la somme des
estimations sur petits domaines résultantes soit égale à Y. Il s'agit d'une
procédure en une étape dont l'avantage est que la fiabilité des estimations sur
petits domaines peut être calculée directement en utilisant la procédure de
l'erreur quadratique moyenne associée au modèle. La méthodologie requise
pour ce faire a été élaborée par Wang, Fuller et Qu (2008). Cette méthodologie a
été modifiée comme il convient par Hidiroglou (2008), et son élaboration a
été poursuivie par Estevao, You, Hidiroglou et Patak (2010) afin qu'elle
satisfasse aux exigences d'un système de production. Un autre moyen consiste à
utiliser une méthode de correction de la différence, qui est une procédure en
deux étapes. A la première étape, on calcule les 0( A la deuxième étape,
on modifie les SAE en ajoutant une correction appropriée de la différence
pour effectuer l'étalonnage. L'EQM de l'estimation étalonnée O,- ^^ est
rendue égale à l'EQM de l'estimation non étalonnée 0,- SAE. Les calculs
nécessaires pour l'étalonnage respectent deux conditions afin de s'assurer que
les totaux des petits domaines s'ajoutent au total global direct. Ces conditions
et traitements qui y correspondent
A
sont :
• • • 2 •
i. Une estimation 0/ D//? et la variance correspondante af- existent pour
tous les petits domaines. L'étalonnage est respecté en augmentant le
•t * T* T ?
vecteur auxiliaire Z,- = (Z,-, g, ).
/s 'y
ii. Une estimation 0, DIR et la variance correspondante a, n'existent pas
pour tous les petits domaines. L'étalonnage est respecté en utilisant la
correction de la différence
M
®i,SAE +a
i Y DIR X ^ j.SAE pour /=l,2,...,m
j=\ y
®i,bSAE ~ ' pour i=m + l,m + 2,...,M
0./, SAE
ex
y(Pi,RAT) = ^(«i) = p{Po + Pl log(WoUI,i) + P2 log(Af,)},
7.5 Conclusions
BIBLIOGRAPHIE
Rao, J.N.K. (2003). Small Area Estimation. New York : John Wiley & Sons,
Inc.
Singh, M.P., et Tessier, R. (1975). Some estimators for domain totals. Journal
of the American Statistical Association, 71, 322-325.
Schaible, W.A. (1978). Choosing weights for composite estimators for small
area statistics. Proceedings of the Section on Survey Research Methods,
American Statistical Association, 741-746.
Wang, J., Fuller, W.A. et Qu, Y. (2008). Estimation pour petits domaines sous
une contrainte. Techniques d'enquête. Vol. 34, n0l, 33-40.
You, Y. (2008). Une approche intégrée de modélisation de l'estimation du
taux de chômage pour les régions infraprovinciales au Canada. Techniques
d'enquête. Vol. 34, n0l, 21-31.
You, Y., et Dick, P. (2004). Hierarchical Bayes small area inference to the
2001 census undercoverage estimation. Proceedings of the ASA Section on
Government Statistics, 1836-1840.
You, Y., et Rao, J.N.K. (2002) Small area estimation using unmatched
sampling and linking models. The Canadian Journal of Statistics, 30, 3-15.
Fay-Herriot
14
Éric GAGNON et Robert COURTEMANCHE
8.1 Introduction
appropriée pour l'EPLA, étant donné que les répondants de cette enquête ont
été sélectionnés à partir du recensement canadien de 2006. Pour cette enquête,
on dispose donc d'une riche source de données externes.
8.2 Modélisation
8.3 Résultats
Pour ce projet, les estimations composites ont été obtenues avec l'approche
EBLUP (Empirical Best Linear Unbiased Predictor) en utilisant la méthode
des moments de Fay-Herriot pour l'estimation des paramètres du modèle. Le
tableau 7.3 montre les estimations obtenues.
Les deux premières colonnes du tableau 7.3 donnent le taux d'emploi
calculé à l'EPLA, ainsi que son coefficient de variation (CV). Les deux
colonnes suivantes présentent le taux d'emploi obtenu à partir du modèle de
Fay-Herriot (FH), ainsi que son CV17. Les deux dernières colonnes du
tableau 7.3 fournissent respectivement la proportion du taux de FH qui
15 Estimateur qui combine une estimation d'enquête à une obtenue par modélisation.
16 Questions permettant de déterminer l'admissibilité à l'EPLA.
17 Le CV est la racine carrée de l'erreur quadratique moyenne (EQM), divisée par le taux
estimé à partir de Fay-Herriot. Les équations 7.1.26 et 7.1.29 de Rao (2003) ont été
utilisées pour ce calcul. L'EQM ne contient donc qu'un biais provenant du modèle.
7. Théorie des sondages 359
Un autre moyen d'évaluer la justesse des taux de FH a été proposé par Meng
(1994). Celui-ci suggère d'utiliser une méthode de prédiction ci posteriori
pour évaluer si la distribution des taux de FH suit la même distribution que les
taux de l'EPLA, ces derniers étant sans biais. Cette méthode nécessite le
calcul de la statistique suivante, qui suit une loi du Khi-carré :
Les résultats présentés à la section 8.3 montrent que la plupart des taux de FH
sont près des taux de l'EPLA. En présence de faibles écarts, il est facile de
faire confiance aux taux de FH. Cependant, pour certaines régions, il y a des
écarts importants. Un moyen de s'assurer de la validité des taux pour ces
régions est de les comparer à d'autres sources de données. Le recensement
canadien est la meilleure source permettant d'obtenir des données régionales
sur ce sujet.
Le tableau 7.4 présente de nouveau les taux à l'EPLA et les taux de FH. De
plus, il présente deux taux d'emploi calculés à partir du recensement de 2006.
Le premier est calculé pour les personnes de 15 à 64 ans ayant répondu
« oui » à au moins une des questions-filtres sur les limitations. On se
rappellera que ce taux est une variable explicative dans le modèle de la
section 8.2. Le second taux présenté est calculé pour l'ensemble de la
population de 15 à 64 ans (avec ou sans limitation). Ce taux s'éloigne
nettement des trois premiers étant donné que son calcul porte sur une
population très différente.
Un examen du tableau 7.4 montre que le taux de FH est très près du taux au
recensement chez les « oui », tout en restant inférieur pour 13 régions sur 15.
Ce résultat est rassurant puisque la notion de limitation au recensement est
plus large que celle de l'EPLA. Donc, des personnes plus aptes à travailler se
retrouvent dans ce groupe. Ensuite, il est intéressant d'examiner les régions
où il y a un écart important entre le taux à l'EPLA et le taux de FH. Pour la
Côte-Nord et Chaudière-Appalaches, le taux à l'EPLA semble trop élevé par
rapport au taux chez les « oui ». Pour Laval, le taux à l'EPLA semble trop bas
362 Pratique et méthodes de sondages
par rapport aux trois autres taux du tableau. Finalement, le taux à l'EPLA
pour le Bas-Saint-Laurent est nettement inférieur aux taux des autres régions.
Par contre, pour les trois autres taux, c'est la Gaspésie-lles-de-la-Madeleine
qui obtient le taux le plus bas. En résumé, pour ces quatre régions, les taux de
FH semblent plus réalistes et de meilleure qualité que les taux de l'EPLA.
8.6 Conclusion
Les estimations pour petits domaines exposées dans le présent article ont été
obtenues à l'aide du modèle de FH. Les multiples validations effectuées aux
sections précédentes montrent que le modèle est de très bonne qualité. Il n'en
demeure pas moins que les taux obtenus proviennent principalement de la
modélisation et donc qu'ils ne peuvent pas être considérés comme des
estimations directes provenant d'une enquête. Contrairement à ces estimations
qui ne comportent pas de biais, les taux de FH sont biaisés. Bien que ce biais
ne semble pas très important, il est tout de même présent, particulièrement
pour les plus petites régions. Par conséquent, ces taux doivent être utilisés en
mentionnant clairement qu'ils proviennent d'un modèle et qu'ils sont des
prédictions de ce modèle. Toutefois, ces taux peuvent être d'une grande
utilité, car ils permettent de combler le manque d'information au niveau
régional sur le statut d'emploi des personnes ayant une incapacité au Québec.
7. Théorie des sondages 363
8.7 Remerciements
BIBLIOGRAPHIE
18
Dominique PLACE
9.1 Introduction
Comme pour la plupart des enquêtes Emploi conduites dans les pays
industrialisés, l'enquête Emploi en Continu française (EEC) est une enquête
répétée avec renouvellement partiel de l'échantillon d'une période sur l'autre.
Un individu de l'échantillon est normalement interrogé six trimestres de suite
et chaque trimestre, un sixième de l'échantillon est nouveau tandis que les
cinq autres sixièmes sont en réinterrogation du trimestre précédent.
Les estimateurs trimestriels utilisés actuellement sont définis avec les seules
données de l'échantillon trimestriel courant comme on le ferait pour une
enquête unique. Mais du fait des réinterrogations, il existe des corrélations
entre les trimestres qui peuvent être mises à profit pour améliorer
l'estimation. Cela conduit à différents estimateurs, appelés composites, qui
ont en commun la possibilité de mobiliser les données de plusieurs périodes, y
compris pour fournir des estimations relatives à une seule période.
On distingue trois types d'estimateurs composites : l'estimateur linéaire à
fenêtre fixe optimal, l'estimateur AK et l'estimateur par calage composite.
Après avoir donné leurs définitions, on montrera dans une seconde partie les
résultats de ces méthodes dans TEEC pour les nombres d'actifs occupés et de
chômeurs.
y?' = 6 Z wtkytk
kss, (Ri)
>V = Z Za"yf-«-
m=0 i=\
Pour que cet estimateur soit sans biais, les coefficients doivent respecter des
contraintes. Si on suppose que les estimateurs élémentaires sont sans biais,
alors il faut avoir :
6 6
=
S i ; Xa/' =
^ Pour w
(i)
/=1 /=1
Ri • • a
E(>V ) - 0 + ^,) yr avec b\ + ••• + /76 = 0. Les contraintes (1) doivent être
alors modifiées en multipliant chaque coefficient «;0 et a" par 1 + /?,.
Les contraintes et la fenêtre / étant fixées, les coefficients sont calculés
pour minimiser la variance de y^. Cela correspond à un programme classique
d'optimisation linéaire sous contraintes, qui ne requiert que la connaissance
d'une estimation de la matrice de variance-covariance du vecteur des
estimateurs élémentaires (j^1,..., y^f+x). En pratique, on calcule une matrice
moyenne sur une période de référence.
9.2.2 L'estimateur AK
6 A
K 1 (2)
y-y = (I - *0 ?, + K[y x + à;_u) + A y? -jtyf
[ ^ i=2
9.3 Résultats
Les différents estimateurs composites ont été calculés sur la période 2004-
2008 pour les nombres de chômeurs et d'actifs occupés en France
métropolitaine. La fenêtre de l'estimateur linéaire à fenêtre fixe a été fixée à 6
trimestres. Au-delà de sept trimestres, les corrélations temporelles sont trop
faibles pour contribuer à une diminution significative de la variance. Pour les
deux premiers estimateurs décrits, la prise en compte des biais de rotation
contribue pour le nombre de chômeurs à un écart supplémentaire quasi
systématique de l'ordre de 1,5 % de l'estimation actuelle. Sont présentés dans
les figures, les estimateurs prenant en compte les biais de rotation.
On constate que les écarts par rapport à l'estimateur naturel sont limités : ils
ne dépassent pas 2 % pour le nombre de chômeurs et 0,5 % pour le nombre
d'actifs occupés. La réduction de variance est faible pour le nombre de
chômeurs, mais plus intéressante sur l'emploi, en particulier pour l'évolution
sur un an. Une méthode de linéarisation a été essayée pour l'estimation de la
variance de l'estimateur par calage composite, mais elle ne donne pas de
résultats plausibles car elle doit présenter trop de biais.
r \
., v. , . /V\ ^
Il 12 T3 T4 T1 T2 | T3 14 T1 12 | T3 T4 11 T2 | T3 T4 T1 T2 | T3 T4
2004 2005 2006 2007 2008
Linéaire optimal ♦ AK —*■ - - Par calage composite
Note : les écarts sont exprimés en proportion de l'estimateur naturel et par rapport à
celui-ci
7. Théorie des sondages 367
BIBLIOGRAPHIE
Louis-Paul RIVEST19
10.1 Introduction
Les variables {a,} et { 8i7 } sont indépendantes entre elles et de lois respectives
N(0, a";) et N(0, cT). On cherche les estimateurs du maximum de
2 2
vraisemblance de (p, aw, a ). Une façon indirecte pour construire la
vraisemblance s'appuie sur la vraisemblance pénalisée intégrée. On procède ici
en trois étapes pour la construire :
l. On traite les ai comme étant des paramètres fixes et on écrit la
vraisemblance pour p, {«,-} et a2,
N M,
1 (yg ^ - "iY log(a )
n exp^ -I
M : 12
y=i 2cr 2
.2 _2-
3. La vraisemblance marginale pour (p, a^, a") est obtenue en intégrant
par rapport aux ce qui donne
I
exp Zte - x-.)2 + Z
2
2a' ',7 ri + / o2
L(p, a , a;) -
Les intégrales dcii peuvent être évaluées, ce qui donne la forme explicite
suivante pour la pseudo-vraisemblance,
avec ra=a2a/ a2 et yis = "//.S/ / wi+. Les valeurs de (|i, o2, a2) qui
maximisent cette expression n'ont pas de forme explicite en général. De
nombreuses études ont montré que cette approche donne des estimateurs
370 Pratique et méthodes de sondages
biaisés. Pour corriger ce biais, plusieurs auteurs modifient les poids des unités
secondaires de la façon suivante, = iLw.-i,-. Le « scale method 1 » de
\y 9 une au re
Pfeffermann et coll. (1998) prend ^/= 2^/1/' t
normalisation suggérée dans ce travail pose X-,- = m, / w+^, où mi est le
nombre d'unités secondaires tirées dans l'unité primaire /, c'est le « scale
method 2 ». Aucune de ces méthodes ne permet, à coup sûr, d'obtenir des
estimations convergentes lorsque le nombre d'unités primaires tend vers
l'infini et que les tailles d'échantillon mi dans les unités primaires restent
bornées.
Cette section porte sur le cas spécial où les M, sont égaux et où la somme des
poids des unités secondaires par unité primaire est fixe {Mi = w+^ =
M = w+). On peut alors montrer que les estimateurs qui maximisent la
pseudo-vraisemblance ont une forme explicite. En effet, jî = y v la moyenne
des y/v, et, avec des poids modifiés,
J
( X-l + XM / v}_2.
E(à2) = EfE (à2) = a
(XM - 1) /
et
7. Théorie des sondages 371
X-l + XM /v
E(à2a) = ^ + l^CT + O ro
—
(kM - 1) \n)
Ainsi, les biais croissent avec k ; ces derniers sont nuls avec
v
M + v
v o2
Var
Ê,{ s2(yis)}'
Estimateur
Eiàl) E(ô2) Eiàl) E(à2)
Dans le tableau 7.5, les résultats sont plus variables lorsque la fraction de
sondage au degré 2 est faible. L'estimateur OPTI a un léger biais négatif pour
al qui est sans doute attribuable au biais négatif de l'estimateur du maximum
de vraisemblance pour les variances. L'adaptation de la méthode REML
(Restricted Maximum Likelihood) à la pseudo-vraisemblance utilisée avec
des données d'enquête permettrait sans doute de corriger ce léger biais.
10.4 Discussion
Ce travail a mis en lumière le fait qu'une bonne modification des poids pour
l'estimation des composantes de la variance fait intervenir la variabilité intra
unité primaire. Pour estimer les v,, on peut procéder par essai et erreur. Par
exemple, pour évaluer si le « scale method 2 » est approprié, on procède de la
• • • *)
façon suivante : (i) on estime à l'aide d'un modèle d'ANOVA à un facteur
fixe, (ii) on calcule des estimations de variance par rapport au plan, v(y/v),
dans chaque unité primaire échantillonnée et (iii) on fait le graphique des points
'y
[d (1 / m,- - 1 / M/),v(y/5)]. Cette modification est appropriée si
7. Théorie des sondages 373
v
(yis) ~ 62(1 / m,- - 1 / Mj) plus bruit,
c'est-à-dire si les points du graphique se répartissent autour de la droite
.V = -r-
Malheureusement l'information qui permet le calcul des variances intra
unité primaire n'est en général pas fournie avec les données d'enquête. De
plus, il n'est pas évident de tenir compte dans ce calcul de variance du
traitement de la non-réponse ou du calage des poids d'échantillonnage.
Beaucoup de travail reste à faire pour atteindre un consensus concernant
l'ajustement de modèles multiniveaux à des données d'enquête.
BIBLIOGRAPHIE
Monique G RAF 20
11.1 Introduction
Les enquêtes sont conçues d'abord pour estimer des totaux dans des sous-
groupes de population. On estime ces totaux par des sommes pondérées
d'observations où les poids d'extrapolation sont déterminés par le plan
d'échantillonnage et modifiés pour tenir compte de la non-réponse (voir, par
exemple, Sâmdal, Swensson et Wretman, 1992). Les compositions, par
exemple les parts budgétaires, l'utilisation du temps, les parts salariales, etc.
sont de nature différente à cause de la contrainte de somme.
PX + P2 + ... + PD =l
On voit qu'il n'est pas facile de travailler avec les compositions dans le
simplexe directement. On est donc amené à chercher une transformation qui
possède les propriétés suivantes :
a) Invariance : En général, la contrainte de somme K est fixée à 1. Une
transformation est invariante si elle ne dépend pas de K.
b) Cohérence sous-compositionnelle : Les corrélations entre composantes
ne changent pas, qu'on les considère dans la composition entière ou
dans une sous-composition.
alr(p) s R1*.
Dans certains cas, on peut voir un inconvénient à donner un rôle différent à
une composante. Le log-ratio centré (transformée clr, vecteur de dimension
D) permet de l'éviter en divisant chaque part par la moyenne géométrique
des parts, au lieu de la dernière. Le log-ratio isométrique (Egozcue et coll.,
2003) permet de définir une base dans le simplexe. Dans le présent article,
nous considérons la transformée air. La figure 7.10 montre pour D = 3 la
correspondance entre le simplexe et le plan des coordonnées air.
On obtient la clôture p d'un vecteur w à coordonnées positives en le
divisant par la somme de ses composantes,
p = C(w) = w/X>,-
376 Pratique et méthodes de sondages
=îr,„.
A ■: -A A ■
A;- A .
A ■ A
-f»: 4
A •: A ■ A a
A A ■
Les graphiques vont par paires. Le plan cartésien montre l'image air de la ligne dans le triangle de
gauche.
p (5) =
« V ' 777 O n KJ:*(S)]0 P,. (4)
LkeUWk^iS) keU
« - O)
5zk
_ MPk-Pa(U)) (7)
Wn
'ZizU i i
L'expression (7) est estimée par le résidu :
W
_ k(Pk - PqC'^))
Q'k = — -• (8)
• c W:I
ieS
378 Pratique et méthodes de sondages
1
alr(p (S))=— — X ^z*:(5)alr(P<:)- (9)
w
Lksu kZk(S) ksu
Q, vMalr(p,)-alr(p,))
!,■ eSWi
On en déduit par substitution dans l'équation (6) la matrice de covariance
Va,r fondée sur le plan.
V, - uvalru'.
BIBLIOGRAPHIE