THESE SALLES Adrien PDF
THESE SALLES Adrien PDF
THESE SALLES Adrien PDF
T H È S E
Le 31 Mai 2018
T H È S E
Le 31 Mai 2018
FACULTE DE MEDECINE
Doyen : Georges LEONETTI
Vice-Doyen aux Affaires Générales : Patrick DESSI
Vice-Doyen aux Professions Paramédicales : Philippe BERBIS
DOYENS HONORAIRES
M. Yvon BERLAND
M. André ALI CHERIF
M. Jean-François PELLISSIER
30/11/2017
MM PENE Pierre
PIANA Lucien
PICAUD Robert
PIGNOL Fernand
POGGI Louis
POITOUT Dominique
PONCET Michel
POUGET Jean
PRIVAT Yvan
QUILICHINI Francis
RANQUE Jacques
RANQUE Philippe
RICHAUD Christian
ROCHAT Hervé
ROHNER Jean-Jacques
ROUX Hubert
ROUX Michel
RUFO Marcel
SAHEL José
SALAMON Georges
SALDUCCI Jacques
SAN MARCO Jean-Louis
SANKALE Marc
SARACCO Jacques
SARLES Jean-Claude
SASTRE Bernard
SCHIANO Alain
SCOTTO Jean-Claude
SEBAHOUN Gérard
SERMENT Gérard
SERRATRICE Georges
SOULAYROL René
STAHL André
TAMALET Jacques
TARANGER-CHARPIN Colette
THOMASSIN Jean-Marc
UNAL Daniel
VAGUE Philippe
VAGUE/JUHAN Irène
VANUXEM Paul
VERVLOET Daniel
VIALETTES Bernard
WEILLER Pierre-Jean
30/11/2017
PROFESSEURS HONORIS CAUSA
1967
MM. les Professeurs DADI (Italie)
CID DOS SANTOS (Portugal)
1974
MM. les Professeurs MAC ILWAIN (Grande-Bretagne)
T.A. LAMBO (Suisse)
1975
MM. les Professeurs O. SWENSON (U.S.A.)
Lord J.WALTON of DETCHANT (Grande-Bretagne)
1976
MM. les Professeurs P. FRANCHIMONT (Belgique)
Z.J. BOWERS (U.S.A.)
1977
MM. les Professeurs C. GAJDUSEK-Prix Nobel (U.S.A.)
C.GIBBS (U.S.A.)
J. DACIE (Grande-Bretagne)
1978
M. le Président F. HOUPHOUET-BOIGNY (Côte d'Ivoire)
1980
MM. les Professeurs A. MARGULIS (U.S.A.)
R.D. ADAMS (U.S.A.)
1981
MM. les Professeurs H. RAPPAPORT (U.S.A.)
M. SCHOU (Danemark)
M. AMENT (U.S.A.)
Sir A. HUXLEY (Grande-Bretagne)
S. REFSUM (Norvège)
1982
M. le Professeur W.H. HENDREN (U.S.A.)
1985
MM. les Professeurs S. MASSRY (U.S.A.)
KLINSMANN (R.D.A.)
1986
MM. les Professeurs E. MIHICH (U.S.A.)
T. MUNSAT (U.S.A.)
LIANA BOLIS (Suisse)
L.P. ROWLAND (U.S.A.)
1987
M. le Professeur P.J. DYCK (U.S.A.)
1988
MM. les Professeurs R. BERGUER (U.S.A.)
W.K. ENGEL (U.S.A.)
V. ASKANAS (U.S.A.)
J. WEHSTER KIRKLIN (U.S.A.)
A. DAVIGNON (Canada)
A. BETTARELLO (Brésil)
1989
M. le Professeur P. MUSTACCHI (U.S.A.)
30/11/2017
1990
MM. les Professeurs J.G. MC LEOD (Australie)
J. PORTER (U.S.A.)
1991
MM. les Professeurs J. Edward MC DADE (U.S.A.)
W. BURGDORFER (U.S.A.)
1992
MM. les Professeurs H.G. SCHWARZACHER (Autriche)
D. CARSON (U.S.A.)
T. YAMAMURO (Japon)
1994
MM. les Professeurs G. KARPATI (Canada)
W.J. KOLFF (U.S.A.)
1995
MM. les Professeurs D. WALKER (U.S.A.)
M. MULLER (Suisse)
V. BONOMINI (Italie)
1997
MM. les Professeurs C. DINARELLO (U.S.A.)
D. STULBERG (U.S.A.)
A. MEIKLE DAVISON (Grande-Bretagne)
P.I. BRANEMARK (Suède)
1998
MM. les Professeurs O. JARDETSKY (U.S.A.)
1999
MM. les Professeurs J. BOTELLA LLUSIA (Espagne)
D. COLLEN (Belgique)
S. DIMAURO (U. S. A.)
2000
MM. les Professeurs D. SPIEGEL (U. S. A.)
C. R. CONTI (U.S.A.)
2001
MM. les Professeurs P-B. BENNET (U. S. A.)
G. HUGUES (Grande Bretagne)
J-J. O'CONNOR (Grande Bretagne)
2002
MM. les Professeurs M. ABEDI (Canada)
K. DAI (Chine)
2003
M. le Professeur T. MARRIE (Canada)
Sir G.K. RADDA (Grande Bretagne)
2004
M. le Professeur M. DAKE (U.S.A.)
2005
M. le Professeur L. CAVALLI-SFORZA (U.S.A.)
2006
M. le Professeur A. R. CASTANEDA (U.S.A.)
2007
M. le Professeur S. KAUFMANN (Allemagne)
30/11/2017
EMERITAT
2008
M. le Professeur LEVY Samuel 31/08/2011
Mme le Professeur JUHAN-VAGUE Irène 31/08/2011
M. le Professeur PONCET Michel 31/08/2011
M. le Professeur KASBARIAN Michel 31/08/2011
M. le Professeur ROBERTOUX Pierre 31/08/2011
2009
M. le Professeur DJIANE Pierre 31/08/2011
M. le Professeur VERVLOET Daniel 31/08/2012
2010
M. le Professeur MAGNAN Jacques 31/12/2014
2011
M. le Professeur DI MARINO Vincent 31/08/2015
M. le Professeur MARTIN Pierre 31/08/2015
M. le Professeur METRAS Dominique 31/08/2015
2012
M. le Professeur AUBANIAC Jean-Manuel 31/08/2015
M. le Professeur BOUVENOT Gilles 31/08/2015
M. le Professeur CAMBOULIVES Jean 31/08/2015
M. le Professeur FAVRE Roger 31/08/2015
M. le Professeur MATTEI Jean-François 31/08/2015
M. le Professeur OLIVER Charles 31/08/2015
M. le Professeur VERVLOET Daniel 31/08/2015
2013
M. le Professeur BRANCHEREAU Alain 31/08/2016
M. le Professeur CARAYON Pierre 31/08/2016
M. le Professeur COZZONE Patrick 31/08/2016
M. le Professeur DELMONT Jean 31/08/2016
M. le Professeur HENRY Jean-François 31/08/2016
M. le Professeur LE GUICHAOUA Marie-Roberte 31/08/2016
M. le Professeur RUFO Marcel 31/08/2016
M. le Professeur SEBAHOUN Gérard 31/08/2016
2014
M. le Professeur FUENTES Pierre 31/08/2017
M. le Professeur GAMERRE Marc 31/08/2017
M. le Professeur MAGALON Guy 31/08/2017
M. le Professeur PERAGUT Jean-Claude 31/08/2017
M. le Professeur WEILLER Pierre-Jean 31/08/2017
2015
M. le Professeur COULANGE Christian 31/08/2018
M. le Professeur COURAND François 31/08/2018
M. le Professeur FAVRE Roger 31/08/2016
M. le Professeur MATTEI Jean-François 31/08/2016
M. le Professeur OLIVER Charles 31/08/2016
M. le Professeur VERVLOET Daniel 31/08/2016
30/11/2017
2016
M. le Professeur BONGRAND Pierre 31/08/2019
M. le Professeur BOUVENOT Gilles 31/08/2017
M. le Professeur BRUNET Christian 31/08/2019
M. le Professeur CAU Pierre 31/08/2019
M. le Professeur COZZONE Patrick 31/08/2017
M. le Professeur FAVRE Roger 31/08/2017
M. le Professeur FONTES Michel 31/08/2019
M. le Professeur JAMMES Yves 31/08/2019
M. le Professeur NAZARIAN Serge 31/08/2019
M. le Professeur OLIVER Charles 31/08/2017
M. le Professeur POITOUT Dominique 31/08/2019
M. le Professeur SEBAHOUN Gérard 31/08/2017
M. le Professeur VIALETTES Bernard 31/08/2019
2017
M. le Professeur ALESSANDRINI Pierre 31/08/2020
M. le Professeur BOUVENOT Gilles 31/08/2018
M. le Professeur CHAUVEL Patrick 31/08/2020
M. le Professeur COZZONE Pierre 31/08/2018
M. le Professeur DELMONT Jean 31/08/2018
M. le Professeur FAVRE Roger 31/08/2018
M. le Professeur OLIVER Charles 31/08/2018
M. le Professeur SEBBAHOUN Gérard 31/08/2018
30/11/2017
PROFESSEURS DES UNIVERSITES - PRATICIENS HOSPITALIERS
30/11/2017
OUAFIK L'Houcine ROCHE Pierre-Hugues THUNY Franck
PAGANELLI Franck ROCH Antoine TREBUCHON-DA FONSECA Agnès
PANUEL Michel ROCHWERGER Richard TRIGLIA Jean-Michel
PAPAZIAN Laurent ROLL Patrice TROPIANO Patrick
PAROLA Philippe ROSSI Dominique TSIMARATOS Michel
PARRATTE Sébastien ROSSI Pascal TURRINI Olivier
PELISSIER-ALICOT Anne-Laure ROUDIER Jean VALERO René
PELLETIER Jean SALAS Sébastien VAROQUAUX Arthur Damien
PETIT Philippe SAMBUC Roland Surnombre VELLY Lionel
PHAM Thao SARLES Jacques VEY Norbert
PIERCECCHI/MARTI Marie-Dominique SARLES/PHILIP Nicole VIDAL Vincent
PIQUET Philippe SCAVARDA Didier VIENS Patrice
PIRRO Nicolas SCHLEINITZ Nicolas VILLANI Patrick
POINSO François SEBAG Frédéric VITON Jean-Michel
RACCAH Denis SEITZ Jean-François VITTON Véronique
RAOULT Didier SIELEZNEFF Igor VIEHWEGER Heide Elke
REGIS Jean SIMON Nicolas VIVIER Eric
REYNAUD/GAUBERT Martine STEIN Andréas XERRI Luc
REYNAUD Rachel TAIEB David
RICHARD/LALLEMAND Marie-Aleth THIRION Xavier
RIDINGS Bernard Surnombre THOMAS Pascal
ADALIAN Pascal
AGHABABIAN Valérie
BELIN Pascal
CHABANNON Christian
CHABRIERE Eric
FERON François
LE COZ Pierre
LEVASSEUR Anthony
RANJEVA Jean-Philippe
SOBOL Hagay
PROFESSEUR CERTIFIE
BRANDENBURGER Chantal
PRAG
TANTI-HARDOUIN Nicolas
ADNOT Sébastien
FILIPPI Simon
BURKHART Gary
30/11/2017
MAITRE DE CONFERENCES DES UNIVERSITES - PRATICIENS HOSPITALIERS
GENTILE Gaëtan
BARGIER Jacques
BONNET Pierre-André
CALVET-MONTREDON Céline
GUIDA Pierre
JANCZEWSKI Aurélie
30/11/2017
PROFESSEURS DES UNIVERSITES et MAITRES DE CONFERENCES DES UNIVERSITES - PRATICIENS HOSPITALIERS
PROFESSEURS ASSOCIES, MAITRES DE CONFERENCES DES UNIVERSITES mono-appartenants
30/11/2017
GIUSIANO Bernard (MCU-PH) DELPERO Jean-Robert (PU-PH)
MANCINI Julien (MCU-PH) MOUTARDIER Vincent (PU-PH)
SEBAG Frédéric (PU-PH)
ABU ZAINEH Mohammad (MCF) (5ème section) TURRINI Olivier (PU-PH)
BOYER Sylvie (MCF) (5ème section)
BEGE Thierry (MCU-PH)
BIRNBAUM David (MCU-PH)
CHIRURGIE ORTHOPEDIQUE ET TRAUMATOLOGIQUE 5002
30/11/2017
BERBIS Julie (MCU-PH)
LAGOUANELLE/SIMEONI Marie-Claude (MCU-PH)
ADNOT Sébastien (PR associé Méd. Gén. à mi-temps) BERLAND Yvon (PU-PH) Surnombre
FILIPPI Simon (PR associé Méd. Gén. à mi-temps) BRUNET Philippe (PU-PH)
BURTEY Stépahne (PU-PH)
DUSSOL Bertrand (PU-PH)
BARGIER Jacques (MCF associé Méd. Gén. À mi-temps) JOURDE CHICHE Noémie (PU PH)
BONNET Pierre-André (MCF associé Méd. Gén à mi-temps) MOAL Valérie (PU-PH)
CALVET-MONTREDON Céline (MCF associé Méd. Gén. à temps plein)
GUIDA Pierre (MCF associé Méd. Gén. à mi-temps)
JANCZEWSKI Aurélie (MCF associé Méd. Gén. À mi-temps)
NEUROLOGIE 4901
ONCOLOGIE 65 (BIOLOGIE CELLULAIRE)
ATTARIAN Sharham (PU PH)
CHABANNON Christian (PR) (66ème section) AUDOIN Bertrand (PU-PH)
SOBOL Hagay (PR) (65ème section) AZULAY Jean-Philippe (PU-PH)
CECCALDI Mathieu (PU-PH)
EUSEBIO Alexandre (PU-PH)
OPHTALMOLOGIE 5502 FELICIAN Olivier (PU-PH)
PELLETIER Jean (PU-PH)
DENIS Danièle (PU-PH)
HOFFART Louis (PU-PH)
MATONTI Frédéric (PU-PH)
RIDINGS Bernard (PU-PH) Surnombre PEDOPSYCHIATRIE; ADDICTOLOGIE 4904
30/11/2017
OTO-RHINO-LARYNGOLOGIE 5501
PHILOSPHIE 17
PARASITOLOGIE ET MYCOLOGIE 4502
LE COZ Pierre (PR) (17ème section)
DESSEIN Alain (PU-PH) Surnombre
PSYCHIATRIE D'ADULTES ; ADDICTOLOGIE 4903 LIMERAT/BOUDOURESQUE Françoise (MCF) (40ème section) Retraite 1/5/2018
RUEL Jérôme (MCF) (69ème section)
BAILLY Daniel (PU-PH) STEINBERG Jean-Guillaume (MCF) (66ème section)
LANCON Christophe (PU-PH) THIRION Sylvie (MCF) (66ème section)
NAUDIN Jean (PU-PH)
30/11/2017
REMERCIEMENTS
Aux twittos, les acteurs majeurs de ce travail et principalement à @koibo d’avoir initié le
mouvement et à @médecinelibre de le valoriser.
A Clémence, mon amoureuse, merci d’être venue jusqu’en Guyane.
A ma famille :
Ma maman mon papa, merci de votre soutien depuis le début, merci pour les valeurs que vous
m’avez transmises. Cette réussite et ce parcours sont les vôtres.
A Thibault, Eloise et Simon AKA mon frère, ma belle-sœur et mon neveu préférés.
A mes grands-parents Germaine Régine Gilbert et Pierre merci pour votre sagesse. Cette thèse
vous est dédiée.
A ma famille les Douroux et les Salles : les tatas, les tontons, les cousins, cousines.
A tous les médecins, toutes les patientes et tous les patients rencontrés au cours de mes études
merci de m’avoir tant apporté.
A mes amis,
Du pays ; Yvette & Barbeuk, Labrousse & Elise, Diade & Karve et vos marmots.
A Liza : Lumperaj !
Du Pontel ; LPV, les Thomas, Mouss, Marie Lisa, Godish.
De la fac ; Lucas, Alex, Albane, Toto, Beubeu, Jerem, Elisa, Loulou, Marine et tout autre
clermontois pour les soirates de l’espace.
A mes co-internes : Patoche, Martin, Benji le grand gaillard, Benoit et les autres.
Aux Corses : les grands Bruno & Jaques : Pace E Salute ! Aux pharmaciennes Steph, Emma,
Marianna, à Ange, à Antho à Carole et Louis.
Aux marseillais toujours motivés pour une sortie : Théo, Audette, Anouk, Vincent, Guillaume,
Gildas, Camille, Marie, Sami, Emeric, Sylvain.
A Ricky, félicitation pour le concours de maths en Chine.
Un énorme merci à Marie et Maëliss. N’avez-vous jamais eu faim ?
TABLE DES MATIERES
INTRODUCTION .............................................................................................................................................. 2
RESULTATS ................................................................................................................................................... 10
Collecte des données .......................................................................................................................................... 10
Traitement des données ..................................................................................................................................... 10
1. Approche sémantique ................................................................................................................................ 10
2. Approche lexicale........................................................................................................................................ 14
3. Indexation terminologique ......................................................................................................................... 16
Statistiques descriptives ..................................................................................................................................... 21
DISCUSSION ................................................................................................................................................. 22
Résultats principaux ........................................................................................................................................... 22
Prévalence de l’outil ........................................................................................................................................... 23
Comparaison à la littérature ............................................................................................................................... 23
1. Analyses antérieures................................................................................................................................... 23
2. Activité du médecin généraliste ................................................................................................................. 24
Forces et limites .................................................................................................................................................. 26
1. Collecte des données .................................................................................................................................. 26
2. Prétraitement ............................................................................................................................................. 26
3. Analyse du langage ..................................................................................................................................... 27
4. Déontologie ................................................................................................................................................ 28
5. Collaborations ............................................................................................................................................. 29
Perspectives ........................................................................................................................................................ 29
CONCLUSION ................................................................................................................................................ 31
BIBLIOGRAPHIE ............................................................................................................................................ 32
1
INTRODUCTION
Les technologies de l’information et de la communication ont permis la naissance du Web 2.0
au début des années 2000, caractérisé par la mise en place et l’utilisation de nouveaux outils
collaboratifs de communication tels que les blogs, les wikis, les fils RSS et les réseaux sociaux. Leur
contenu est produit directement par les utilisateurs, et a permis une interactivité permanente
entre les internautes et la constitution de communautés d’intérêts.(1)
Créé en 2006, Twitter est un service de microblogage qui permet à ses utilisateurs d’envoyer
gratuitement des messages brefs de 140 caractères (280 depuis fin 2017), appelés tweets, ainsi
que des liens hypertextes, des images et des vidéos.
En s’appropriant les outils proposés par le Web 2.0, une médecine participative basée sur le
partage d’informations et d’expériences entre professionnels, patients et tout acteur de la santé
s’est développée sur les réseaux sociaux(2). Aujourd’hui, la portée des réseaux sociaux est
internationale et son usage dans le domaine médical est multiple. Dans le domaine de la santé
publique notamment avec des applications en veille sanitaire en contexte épidémique (3–5), en
pharmacovigilance(6), en gestion de crise sanitaire(7), mais aussi dans le domaine de la recherche
avec le partage et la diffusion rapide d’informations et de citation d’articles, particulièrement au
cours de conférences médicales(8,9). Le domaine des soins primaires a également investi Twitter
(10,11).
1
#DocTocToc ou #DocsTocToc
2
L’objectif principal de l’étude est d’étudier les principales thématiques des demandes
effectuées via le #DocTocToc par des médecins généralistes entre juin 2012 et mars 2017.
Pour cela nous avons réalisé une analyse automatique des tweets en vue d’en explorer les
sujets. Enfin nous avons utilisé les données recueillies au cours de la collecte des tweets afin de
décrire la prévalence du hashtag sur la période étudiée.
3
MATERIELS ET METHODES
Il s’agit d’une étude descriptive rétrospective d’un corpus de tweets postés entre le 6 juin 2012
et le 31 mars 2017, comprenant le hashtag #DocTocToc et émis par des médecins francophones.
Prétraitement
Analyse
Indexation CORPUS
lexicale
ECMT IRaMuTeQ
Analyse
sémantique
Tropes
Le hashtag #DocTocToc a été entré dans le moteur de recherche par mot-clé de Twitter.
L’extension de Google Chrome Scrape Similar a permis de collecter automatiquement sur les
tweets obtenus le pseudonyme de l’auteur, le contenu du tweet, l’heure et la date de création, le
nombre de retweets, le nombre de likes et le nombre de réponses.
4
2 Echantillonnage
L’échantillonnage s’est fait par identification des profils des médecins généralistes. Une lecture
méthodique de la biographie correspondant à chaque pseudonyme a permis de classer les
auteurs de tweets inclus en trois groupes :
– Médecins généralistes (MG) : les comptes dont la biographie faisait mention de cette
profession (MG, Généraliste, médecin de campagne…), ou ceux dont la mention médecin était
inscrite sans la précision de la spécialité et dont l’activité sur Twitter faisait explicitement
référence à la médecine générale.
– Autres Professionnels de santé : les comptes dont la biographie faisait mention d’une
profession médicale (spécialiste, internes, professions paramédicales) ou dont la mention
médecin était inscrite mais dont l’activité sur Twitter ne faisait pas explicitement référence à la
médecine générale.
– Profils non médicaux, inconnus ou non précisés : les comptes dont la profession n’était
pas précisée.
Dans cette étude, seuls les tweets classés dans le groupe MG ont été conservés pour les étapes
suivantes, ce qui correspond à 7366 tweets.
Nous nous sommes inspirés d’un modèle préexistant (12) pour élaborer les étapes de
prétraitement suivantes :
5
Suppression des balises utilisateur : Toutes les balises d'utilisateur identifiées ont été
supprimées, par exemple, @name, @surname.
Suppression du hashtag #DocTocToc.
Remplacement des hyperliens et des images : Tous les liens hypertextes sont remplacés par
le terme «lien_vers» et toutes images sont remplacées par le terme «lien_image».
Lowercasing : Les lettres majuscules sont en minuscules.
Remplacement des abréviations et des fautes de frappes : Les logiciels Tropes® 2 et
IraMuTeQ® 3 ont permis l’extraction 1465 formes non reconnues, de trois types : les
abréviations du langage courant, les abréviations et acronymes du langage médical et les
termes ou expressions désignant des analyses biologiques. Ces formes ont été développées
ou corrigées manuellement par un médecin avant d’être réintroduites dans le corpus,
automatiquement pour les formes non ambiguës, manuellement pour les formes ambiguës
(Annexe 1)
Correction d'orthographe : La correction orthographique est importante pour supprimer les
redondances des données et améliorer l'étiquetage des parties du discours. Nous avons
effectué cette correction de manière simultanée avec la précédente étape.
Remplacement des données numériques par l’occurrence "NB"
2 Analyse du langage
Devant le volume important de tweets recueillis, nous nous sommes tournés vers une
procédure automatisée et accessible.
Dans l’objectif d’étudier les principales thématiques des tweets nous avons choisi une
méthodologie exploratoire à l’aide de trois outils.
Afin d’identifier les traits se dégageant du corpus nous avons fait appel à une analyse
sémantique avec le logiciel Tropes® se basant sur le sens des mots et à une analyse lexicométrique
avec le logiciel IRaMuTeQ® se basant sur des algorithmes statistiques. L’Extracteur de Concepts
6
Multiterminologiques (ECMT), a permis de réaliser une indexation de notre corpus à partir de
terminologies spécifiquement médicales.
Approche sémantique
Tropes® est un logiciel libre d’analyse sémantique créé en 1994 par Pierre Molette et Agnès
Landré, basé sur les travaux de Rodolphe Ghiglione (13) concernant l’analyse discursive et basé
sur une taxonomie générale composée de plus de 300000 classifications sémantiques.
Nous avons utilisé la version 8.4 du logiciel datant de 2014. Le corpus, enregistré sous format
texte regroupant l’ensemble des tweets a été ouvert dans le logiciel, permettant d’obtenir
instantanément l’analyse. Le seuil de détection des classes a été calculé selon un facteur de
pertinence de 5 : toutes les classes d’équivalents ayant une fréquence d’apparition inférieure à 5
pour 10000 mots (0,05%) ont été ignorées. Les résultats susceptibles d’apporter des éléments de
réponse à nos questions (classes d’équivalents, relations) ont été exportés vers un fichier tableur.
Approche lexicale
7
le logiciel de statistique R4 et sur le langage Python5(16). Il propose entre autres l’utilisation de la
méthode Alceste pour l’analyse lexicale par contexte d’un ensemble de segments de texte.(17)
Les particularités de cette technique d’analyse lexicale sont les suivantes :
- Un découpage des unités du corpus en segments de texte ;
- Une sélection des formes "pleines" sur lesquelles portera l’analyse (18). Ces formes
"pleines" (verbes, noms, adverbes, adjectifs) sont opposées aux formes supplémentaires
ou mots outils (prépositions, pronoms, adjectifs possessifs, certains verbes et adverbes
fréquents) ;
- Une lemmatisation : par défaut, les formes sont lemmatisées ;
- Une classification hiérarchique descendante : l’algorithme (17) repose sur une série de
bipartitions construites sur la base d’une analyse factorielle des correspondances menée
sur un tableau binaire (absence/présence) qui croise les segments de texte choisies avec
les formes pleines sélectionnées.
Nous avons utilisé la version 0.7 alpha 2 datant de septembre 2017. Les règles de formatage
propres au logiciel ont été suivies : dans un document texte encodé en UTF8, chaque tweet est
introduit par quatre étoiles (****) suivies d'une étoile introduisant la variable locuteur de la
manière suivante : "loc_username ". Exemple :
Nous avons par la suite utilisé principalement trois fonctions proposées par IRaMuTeQ® :
l’analyse statistique textuelle, la classification hiérarchique descendante et le nuage de mots. Le
paramétrage du logiciel pour chaque analyse est présenté en annexe 2.
Indexation terminologique
4 . http://www.r-project.org
5 . http://www.python.org
8
CHU de Rouen (19) (20). L’ECMT est conçu pour identifier les concepts de santé dans les
documents biomédicaux en utilisant les terminologies incluses dans HeTOP6. Cette indexation
automatique par l’outil ECMT a été utilisée dans d’autres études. (19) (20) (21) (22) (23)
L’extraction terminologique peut être réalisée suivant plusieurs systèmes d’organisation des
connaissances (thésaurus, ontologies, etc.)(24). Nous avons choisi le thésaurus MeSH (utilisé
notamment pour Medline) pour plusieurs raisons : d’une part c’est le thésaurus international le
plus utilisé pour indexer divers types de documents médicaux, d’autre part il couvre l’intégralité
des domaines de la santé et n’est pas limité à une spécialité ou domaine médical, et enfin il
bénéficie de nombreuses traductions dont une traduction française. Le thésaurus MeSH est
produit par la Bibliothèque Nationale Américaine De Médecine, sa traduction est réalisée par le
réseau DiscDoc de l’Institut National de la Santé et de la Recherche Médicale (INSERM). Un
enrichissement très important du lexique en français est également effectué par le D2IM du CHU
de Rouen, de manière continue depuis 1995, via l’ajout de synonymes (plus de 40000 à ce jour).
Cet enrichissement permet un rappel important autant sur du vocabulaire spécialisé que sur du
vocabulaire orienté "grand public".
Chaque concept identifié dans un tweet est accompagné de ses métadonnées (notamment :
libellé du concept, terminologie d’origine, type sémantique UMLS7, métaterme). Notre choix a
été de porter l’analyse sur les métatermes, ce sont des concepts très généraux, correspondant à
des spécialités biologiques ou médicales et regroupant des descripteurs MeSH répartis
nativement dans plusieurs branches hiérarchiques différentes (25).
6 . Health Terminology/Ontology Portal inclut les principales terminologies et ontologies de santé. Il contient plus de 2 millions de
concepts disponibles dans plusieurs langues à travers plus de 70 terminologies ou ontologieshttps://www.hetop.eu/
7
. Unified Medical Language System : https://www.nlm.nih.gov/research/umls/
9
RESULTATS
Collecte des données
Un total de 12716 tweets a été recueilli entre le 6 juin 2012 et le 31 mars 2017.
Parmi les 1487 comptes twitter identifiés, 303 (20%) appartenaient à des MG, 403 (27%) à des
professionnels de santé hors généralistes et 781 (53%) à des profils non-médicaux.
Parmi les 12716 tweets collectés, 7366 (58%) ont été émis par les MG, 2789 (22%) par les autres
professionnels de santé et 2561 (20%) par les profils non-médicaux. (Figure 1)
Figure 1: Echantillonnage
Classes d’équivalents
Nous avons observé les trois niveaux de regroupement de classes d’équivalents réalisés par
Tropes® : Les références, l’univers de référence 2, l’univers de référence 1.
Les substantifs utilisés dans le corpus (noms ou pronoms) ayant un sens voisin sont regroupés
pour constituer les « Références ». Les références significatives (>0,05%) sont triées par
fréquence décroissante. (Tableau 1)
10
Classe Fréquence Taux Substantifs Correspondants
patient 1344 1.058% Patient, patiente
année 1022 0.805% An, années
lien_image 687 0.541% lien_image
mois 514 0.405% Mois
médecin 453 0.357% Médecin, docteur, généraliste, praticien, toubib
remerciement 370 0.291% Merci
jour 333 0.262% Jours, journées
enfant 262 0.206% Enfants, gamin, gosse
traitement 249 0.196% Traitement
lien_ver 244 0.192% lien_vers
radiologie 244 0.192% Radiographie, échographie, Electrocardiogramme, IRM…
chose 232 0.183% Quelque chose, truc, machin
bilan 224 0.176% Bilan
idée 214 0.169% Idée
souffrance 199 0.157% Douleur, souffrance, myalgies
bébé 191 0.150% Nourrisson, nouveau-né, prématuré
semaine 182 0.143% Semaine
vaccination 179 0.141% Vaccin, vaccination
entreprise 173 0.136% Cabinet, société, entreprise
Tableau 1. Références
Les univers de références représentent le contexte du corpus , les références utilisées sont
regroupées de façon plus large dans les Univers de référence 2 (Tableau 2), qui à leur tour sont
regroupés dans les Univers de référence 1 (Tableau 3)
11
Classe Fréquence Taux Exemples de Substantifs Correspondants
maladie 4302 3.388% Patient, fièvre, maladie, prurit hypertension, varicelle, Affection,
thrombose, diabétique, anémie…
médecine 2067 1.628% Médecin, Syndrome, Hospitalisation, Echographie, Chirurgie,
Electrocardiogramme, Docteur, vaccin…
temps 1497 1.179% Ans, temps, semaines, matin, soir, après midi…
lésion 481 0.379% Eruption, lésion, fracture, Lésions, plaie, érythème, Morsure,
métrorragies...
jour 412 0.324% Jours, samedi, journée, lundi…
famille 277 0.218% Famille, parents, mère, père, fille, Foyer, Sœur…
12
Classe Fréquence Taux
santé 8536 6.722%
temps 2732 2.151%
corps 1549 1.220%
finance 591 0.465%
enfant 519 0.409%
sentiment 413 0.325%
communication 380 0.299%
cognition 326 0.257%
famille 292 0.230%
biologie 290 0.228%
quantité 283 0.223%
système_social 281 0.221%
télécommunication 274 0.216%
organisation 262 0.206%
jugement 226 0.178%
emploi 200 0.157%
france 199 0.157%
substance 198 0.156%
chimie 198 0.156%
sécurité 196 0.154%
Relations
Les relations indiquent quelles classes d'équivalents sont fréquemment reliées (rencontrées
côte à côte à l'intérieur d'une même proposition). En étudiant les relations construites à partir de
l’univers de référence 1 (le plus large), on observe que l’univers "santé" est le plus fréquemment
retrouvé lié avec les autres univers : "temps", "corps", "enfant", "sentiment" (Tableau 4). Son lien
avec le terme finance est une illustration des limites de la méthode puisque ce lien est déduit de
la forte occurrence du substantif "bilan" (224 occurrences).
13
Relations Fréq. Taux Exemples
communication>santé 122 32.11% Congrès>médecine générale, infos > Tamiflu, accord > patient…
biologie>santé 99 34.14% Sérologie>hépatite, Insuline>patient, vaccin>hépatite…
jugement>santé 96 42.48% Avis > orthopédiste, diagnostic > grippe…
famille>santé 90 30.82% Mère > Alzheimer, mamie > diabétique, père > AVC…
santé>france 89 44.72% Médecin > Paris, Maladie de Lyme > France, Patiente > Rennes…
organisation>santé 88 33.59% Recommandations > lésions, Conseils> syndrome…
2. Approche lexicale
Deux ensembles se distinguent. Le premier rassemble les formes liées aux demandes médico-
administratives relatives à la gestion d’un cabinet (classe 1) et celles relatives à la prise en charge
sociale du patient (classe 2). Le second ensemble regroupe trois classes. La classe 3 évoque
l’exposé du cas, rassemblant descriptions cliniques et demandes associées à une image
(interprétation d’imagerie, dermatologie) avec en tête la forme "lien_image". C’est la classe la
plus importante avec 35,6% des formes. La classe 4 comprend des formes reliées à des analyses
biologiques ou bactériologiques. Enfin, la classe 5 renvoie à la présentation des antécédents et
thérapeutiques.
14
Le résultat de l’analyse factorielle des correspondances est présenté à la figure 3, celle-ci
permet de visualiser sur les deux premiers axes l’intrication des classes 1 et 2 d’une part, et des
classes 3 et 4 d’autre part. La classe 5 est linéairement séparée des quatre autres. Les deux axes
retenus expliquent 58.22% de la variance totale.
15
Figure 3: Analyse fréquentielle des Correspondances
3. Indexation terminologique
L’ECMT a permis d’indexer 5946 tweets sur 7366 extraits soit 80%. 3277 concepts MeSH
("descripteurs") ont été utilisés pour cette indexation, ceux-ci ont été rattachés à 101 méta
termes CISMeF et à 121 types sémantiques UMLS. On constate qu’un tweet est indexé par un
nombre de concepts MeSH allant de 1 à 30.
Les dix concepts MeSH les plus fréquents sont "patients", "thérapeutique", "médecins
généralistes", "parturition", "états financiers", "nourrisson", "normes de référence", "plaies et
blessures", "orientation vers un spécialiste".
16
Les dix types sémantiques UMLS les plus fréquents sont "maladie ou syndrome", "substance
pharmacologique", "groupes de patients ou de personnes handicapées", "procédure
thérapeutique ou préventive", "activité de soins médicaux", "objet manufacturé", "discipline ou
profession biomédicale", "produit intellectuel", "chimie organique", "signe ou symptôme".
Les cinq métatermes les plus occurrents dans le corpus sont "thérapeutique", "environnement
et santé publique", "pharmacologie", "diagnostic" et "physiologie" (Figure 4, Tableau 5) Une autre
visualisation de ce résultat est proposée, sous la forme d’un nuage de mots, à la figure 5.
Parmi les métatermes les plus occurrents, ceux en lien direct avec une spécialité médicale ont
été présentés en Tableau 6.
17
Métatermes Concepts MesH Exemples de tweets
Thérapeutique Thérapeutique, prise en charge - Combien de temps au max vous prescrivez un THS ?
de la maladie, vaccination, -F53 A sous ADEPAL. aucun FDR (mère MP à 55ans) peut-on laisser
contraception, association, COP ou passage micropro? comment affirmer ménopause?
post-cure, administration par -Résultats de MAPA, H42A, diag d'HTA diastolique ? Quel traitement?
voie orale, injections, -G bcp de demande de "TRT annuel pour les vers". (ivermectine pour
hospitalisation, cathétérisme… tte la famille) On est d acc, c pas systématique?
-Betadine/Fucidine depuis 5 j pas d'amélioration.Faut inciser?ATB per
os? [lien_image]
Environnement Vaccination, urgences, -Envoyez-vous systématiquement vos courriers (paiement des cotiz)
et santé accidents du travail, pour l'URSSAF/CARMF en accusé réception ? #jeunethésée
enregistrements, risque, -Par le plus grand des hasard, qqun saurait comment vider les FSE
publique d'un vital'act3S vers axisante 4 (axial) ? #JeDésespère
causalité, documents comme
sujet, dossiers de soins - Comment paramétrer HelloDoc avec la CPS du remplaçant?”
infirmiers, caractéristiques de -#DocsTocToc - C'est quoi la ligne J de la déclaration URSSAF ? :-)
l'habitat, besoins et demandes -Vs avez des patients en EHPAS qui ne st pas en ALD ? Comment vous
faites-vs régler la part AMC ?
de services de santé…
Pharmacologie Vaccins, ordonnances, anti- -C'est possible d'écraser un comprimé de malarone ou c'est risqué?
inflammatoires non stéroïdiens, -Dîtes vous auriez une belle étude comparative d'AINS injectable vs
thé, progestines, vaccin contre non injectable? différence efficacité ou effets indésirables?
la rougeole, les oreillons et la -Recherche médecins (pas que MG) indiquant la clairance de la créat
rubéole, injections, sur leurs ordonnances de médicaments, c’est pour une thèse
administration par voie orale, -Quelle poso du Tegretol per os pour névralgies du trijumeau ? 100
Syndrome de perfusion du mg x 3/j au début ? A quel rythme augmenter ? Durée du ttt ?
- HyperK légère assez régulièrement sous Cotareg 160/25 + diabète
propofol, Inhibiteurs de
avec DFG = 46 ml/min : Vous changez le sartan ? Ou Kayexalate
l'hydroxyméthylglutaryl-CoA
réductase…
Diagnostic Échographie, diagnostic, - je dois m'acheter du matériel. Que me conseillez-vous en
électrocardiographie, imagerie tensiomètre, thermomètre, saturomètre, et site internet de
par résonance magnétique, commande ?
microscopie électronique à - F<35a, mastodynie +/- masse, on est d'accord pour écho et pas
transmission, Examen des mammo? c'est ce que dit ce truc en tous cas http://gbu.radiologie.fr/
urines, radiographie, - En cas de grosse jambe rouge type erysipèle, vous demandez encore
tomodensitométrie, force de un écho doppler ?
-TEP scan avec fixation C7 + T1 sans recul du mur posterieur dans
préhension manuelle, clairance
bilan d'adenoK biliaire => Scinti ou on dit direct méta ?
métabolique…
-une protéinurie à 0.58g/l sur échantillon ça s'explore d'après vous?
H30ans atcd légionellose, découverte fortuite, créat 13.1
Physiologie Parturition, casse-croute, -Face à un enfant 2-3 ans non vacciné, refus des parents, primo-
grossesse, thé, système rénine- vaccination incomplète, 1 seule injection
angiotensine, clairance -: Boutons de varicelle purulents. Un médecin dans un autre pays a
métabolique, numération prescrit de la gentamycine crème. EBM ou WTF ?
formule sanguine, allaitement -Pré-eclampsie avc césarienne en urg, nécessité de poursuivre ttt anti
maternel, menstruation, HTA ou arrêt si TA contrôlée >1 mois post partum ?
Vision… -Où puis-je trouver un calculateur de DEP (peak flow) en ligne qui
fonctionne ? SFMU ne marche pas chez moi.
Et vous -pratiquez-vous le dépistage de l'HTA chez l'enfant ?
Tableau 5 : Détails des cinq méta termes les plus occurrents
18
Métatermes Concepts MesH Exemples de tweets
Gynécologie Parturition, femmes - Métrorragie sur fibrome : Exacyl, Dicynone ou AINS ? Autres ?
enceintes, contraception, - Vous prescrivez des micro progestatifs après TVP sous pilule EP
grossesse, contraceptifs oraux, ?
région mammaire, infections - La thrombopenie c'est courant pendant la grossesse? Merci
urinaires, coït interrompu, - Avez-vous entendu parler de pb avec les prothèses mammaires
progestines, interruption légale Allergan ?
de grossesse… - Cotation particulière pour une pose de pessaire?
- F43a, début de grossesse, pas d'ATCD, TSH à 4 : vous traitez ?
Neurologie Douleur, anti-inflammatoires - Les migraines avec aura sont des CI à une contraception OP
non stéroïdiens, accident non?
vasculaire cérébral, douleur - Ça récidive les névromes de morton opéré?
abdominale, crises épileptiques, - Avez-vous une "arme fatale" dans les douleurs post-
maladie de Gaucher, lombalgie, zostériennes?
myalgie, Vision, migraines… - Céphalées constantes, flou visuel, photophobie. Depuis 3 jours
- Ds quels délais envoyez-vous une PFP a frigore chez l'ORL ?
Infectiologie Vaccin, gale, varicelle, zona, - Vous feriez BCG + Repevax + GenHevac B le même jour ?
infections urinaires, - comment vous traitez les syphilis ? #Thanks
mononucléose infectieuse, - Quel ATB pour une inf urinaire à Acinetobacter?
grippe humaine, maladies - C'est pas remboursé la PCR coqueluche ?
virales, infection, verrues… - En cas d'herpès génital c'est rapports sexuels protégés à vie ou
il y a d'autres solutions (TTT préventif? TTT séquentiel?)
Pédiatrie Enfant, nourrisson, - "mère infirmière" c'est une indication à faire le BCG chez le
adolescent, pédiatrie, crèches, nourrisson pour vous?
allaitement maternel, nouveau- - C'est possible d'avoir 2 fois le syndrôme pieds-mains-bouche ?
né, sevrage, Pédiatres, Services - Quel antifongique utilisez-vous pour bébés en couches?
de santé maternelle et - Laryngite dyspneisante enfant 2 ans cortico en IM ? urgences
infantile… direct?
- Vous prenez la TA chez l'enfant ? À partir de quel âge ?
Cardiologie Electrocardiographie, - Vous avez des défibrillateurs dans vos cabinets ?
hypertension artérielle, système - Dîtes, un béta bloquant dans l'HTA tachycarde, vous mettriez
rénine-angiotensine, thrombose quoi ?
veineuse, fibrillation auriculaire, - F74a HTA, pas d'autre FdR cardiovasc, très bon EG, jamais eu
Cardiologues, de bilan lipidique, vous lui feriez?
sphygmomanomètres, accident - Le Churg et Strauss ça donne des phlébites?
vasculaire cérébral, pression - Vous achetez une FA là-dessus ? [lien_image=ECG]
artérielle, phlébite…
Dermatologie Prurit, cloque, prurigo, gale, - Un vitiligo chez une gamine de 12 ans, vous bilantez? Ya un
Dermatologues, urticaire, traitement?
psoriasis, érythème, tache lie de - Ça vous parle un urticaire au sucre mais pas aux sucrettes ?
vin, acné vulgaire… - Marcheuse, 8 jours d'évolution, prurit, lésions bilatérales
[lien_image=photographie]
- Quand on a au moins 1 cas de gale par semaine depuis 2 mois,
on en parle à l'ARS?
- un herpès solaire ça vous parle ?
19
Il est intéressant de savoir, pour un métaterme donné, quels sont ses métatermes les plus co-
occurrents. Par exemple, les trois métatermes les plus co-occurrents du métaterme
"néphrologie" sont : "urologie", "gynécologie" et "diagnostic". La figure 6 illustre cet exemple et
propose un diagramme des 20 métatermes les plus cooccurrents avec le métaterme
"néphrologie". (Figure 6)
20
Statistiques descriptives
Participation
Le nombre de tweet par auteur variait de 1 à 504 (moyenne de 24,23, écart type de 53,64).
Il est mis en évidence un noyau d’utilisateurs actifs : les 30 utilisateurs les plus actifs soit 10%
étaient à l’origine de 64% des tweets alors que 81% avaient eu recours à l’outil moins de 30 fois.
Evolution
On observe depuis la création de l’outil une augmentation du nombre de tweet mensuels.
(Figure 7)
300 Géneralistes
Nombre de tweets par mois
150
100
50
0
2012 2013 2014 2015 2016 2017
21
DISCUSSION
Résultats principaux
Notre a étude a permis de répondre à notre question initiale et de déterminer les principales
thématiques des demandes effectuées via le #DocTocToc. Elles sont majoritairement
administratives et cliniques.
Parmi les questions d’ordre clinique, l’extraction terminologique a permis de révéler les
principaux domaines médicaux concernés : gynécologie, neurologie, infectiologie, pédiatrie,
cardiologie, dermatologie…
Enfin, l’analyse terminologique, par indexation MeSH et métatermes, permet quant à elle
d’identifier les thèmes des demandes à partir d’un vocabulaire médical contrôlé. Les principaux
thèmes dégagés (Thérapeutique, Environnement et santé publique, Pharmacologie, Diagnostic et
Physiologie) ne permettent pas d’approfondir l’analyse par rapport aux méthodes précédentes :
ceux-ci sont principalement liés aux demandes administratives et de gestion. C’est en
s’intéressant aux disciplines médicales présentées dans la liste des diplômes d’études
spécialisées qui peuvent être acquis dans le cadre du troisième cycle des études médicales(26) et
contenues parmi les métatermes que l’on observe les disciplines les plus pourvoyeuses de
22
demande en terme de télé expertise. On retrouve ainsi par ordre de fréquence les domaines
suivants : gynécologie, neurologie, infectiologie, allergologie, pédiatrie, psychiatrie, cardiologie,
dermatologie, rhumatologie, endocrinologie, hématologie, chirurgie.
Prévalence de l’outil
Depuis la créations du #DocTocToc en Juin 2012, on observe une croissance constante du
nombre de tweets utilisant ce hashtag, atteignant une moyenne de 200 tweets par mois.
L’évolution du nombre de tweets au cours de la journée suit les horaires d’ouverture des
cabinets et sous-entend une synchronisation de l’utilisation du #DocTocToc avec l’activité de
consultation.
Comparaison à la littérature
1. Analyses antérieures
L’analyse du discours médical sur Twitter est un domaine en pleine expansion. Dans une étude
récente sur l’utilisation des tweets en santé (27), les auteurs ont étudié 137 articles sélectionnés
à partir de 6 sources documentaires. La majorité procèdent à une analyse de contenu (56%). Le
repérage, la description ou l’établissement de thèmes sont des objectifs communs. Deux
méthodes sont généralement retrouvées dans la littérature :
-le traitement manuel par revue méthodique des tweets collectés par les investigateurs (28–30)
ou par le biais d’une plateforme de crowdsourcing (6,31).
-le traitement automatique ou la méthode de LDA (Latent Dirichlet Allocation) (4,32,33)
La méthode appliquée dans ce travail est différente. Le nombre de tweets recueilli était trop
important pour réaliser une analyse manuelle. Par ailleurs les méthodes de LDA n’étaient pas
techniquement à notre portée. L’utilisation de méthodes empruntées aux sciences humaines et
sociales ou l’analyse du langage est une pratique répandue combinée à une méthode d’indexation
de ressources médicales francophones nous a permis d’obtenir des résultats satisfaisants.
L’analyse du #DocTocToc a déjà fait l’objet de recherches, notamment dans le cadre de thèses.
23
En 2017, Serhrouchni S. a étudié l’utilisation des réseaux sociaux pour obtenir un avis sur
photographies. L’analyse de la concordance diagnostique entre les centres de télédermatologie
et les réseaux sociaux Twitter et MedPics utilisés comme outils de télémédecine, montraient que
cet outil peut être un moyen fiable de pallier les difficultés d’accès aux consultations de
dermatologie. (10)
L’apparition récente de travaux sur le sujet dans le cadre de thèses montre l’intérêt des jeunes
médecins pour le sujet. Par ailleurs les problématiques retrouvées manuellement concordent
avec les problématiques retrouvées. L’étude des réponses permet de mieux cerner le potentiel
de cette pratique.
24
critique envers ses savoirs, formation médicale continue, évaluation des pratiques
professionnelles.)
L’étude ECOGEN (Éléments de la Consultation en médecine Générale) (40), avait pour but de
décrire de façon précise le contenu de l’acte de consultation en médecine générale. Les données
concernant les motifs et résultats de 20 781 consultations entre décembre 2011 et avril 2012 ont
été saisies sous la forme de codes de la CISP-28 pour être analysées.
Les résultats de consultation les plus fréquents incluaient les situations de prévention, les
facteurs de risque cardio vasculaire (hypertension artérielle non compliquée, dyslipidémie,
diabète non insulinodépendant), les infections respiratoires aiguës (rhinites et/ou pharyngites,
bronchites ou bronchiolites), la dépression, les perturbations du sommeil et l’hypothyroïdie. Ces
résultats étaient concordants avec les données de l’Observatoire de la médecine générale. (41)
Ces différentes études sont autant de moyens d’appréhender l’activité théorique et réelle du
médecin généraliste.
8
Classification Internationale des Soins Primaires . http://www.cispclub.org
25
Les compétences en rapport avec l’activité professionnelle liées aux activités
administratives se retrouvent exprimées au travers des demandes médico-
administratives relatives à la gestion d’un cabinet et à la prise en charge sociale du
patient.
L’actualisation et le développement des connaissances lié à l’activité de formation peut
être directement liée à l’utilisation du #DocTocToc.
Forces et limites
1. Collecte des données
Le mode de recueil des tweets nous a permis d’établir un recueil exhaustif des tweets
concernés (12716) dans leur intégralité sur une longue période d’activité (juin 2012 à mars 2017)
Ce procédé est cependant long et fastidieux et ne permet pas d’envisager une analyse dynamique
du sujet.
L’échantillonnage par catégorie d’auteur a été réalisé manuellement par lecture des
biographies et des tweets. Le choix de l’étude a porté sur l’analyse des tweets postés par les
médecins généralistes, limitant grandement le nombre de tweets à analyser. Par ailleurs la
diversité de profils rencontrés au cours de cette étape était étendue : patients, diverses
spécialités médicales, paramédicaux (aides-soignants, infirmiers, diététiciens, pharmaciens, sage
femmes), internes, étudiants, sociétés savantes, syndicats, juristes…
2. Prétraitement
Dans cette étude, nous avons appliqué un ensemble de trois méthodes de traitement
automatique du langage, appliquées à des tweets générés par une communauté de Médecins
Généralistes. Ce type de documents non-structurés présente de nombreux défis techniques.
26
standard, qui évolue continuellement, restreint fortement l’application des modèles de
représentation. (42)
Bien que des logiciels dédiés existent, nous avons fait le choix d’une méthode manuelle dans
l’étape de remplacement des abréviations du fait des nombreuses spécificités du discours étudié.
Comme pour le mode de recueil, cette méthode n’est pas appropriée à une étude dynamique.
Les travaux réalisés dans ce contexte pourront servir à perfectionner des méthodes automatiques
de prétraitement sur des corpus comparables.
3. Analyse du langage
L’état de l’art en analyse de discours propose des outils plus récents que ceux utilisés
notamment la méthode de Latent Dirichlet Allocation. Les logiciels utilisés au cours de cette
méthode sont toutefois toujours utilisés en recherche. La requête " alcest software " dans la base
bibliographique Web of Science retrouve 195 articles dont 23 en 2017 et 2 en 2018. De même la
requête "logiciel Tropes" sur le portail de sciences humaines et sociales de langue française
Cairn.info retrouve 213 résultats dont 2 en 2018 et 13 en 2017.
Le logiciel Tropes® a permis de proposer une lecture sans priori à travers les différentes
classifications sémantiques. Les classifications hiérarchiques intégrées dans le logiciel sont vastes
et non spécifiques au discours médical entrainant une perte d’information : les substantifs non
reconnus car trop spécifiques. Il permet cependant d’extraire plus précisément les éléments
médico administratifs propres au système de santé français non retrouvés via l’extracteur
terminologique qui lui est basé sur une terminologie internationale.
27
des classes sont dépendants du paramétrage du logiciel et la multiplication des analyses pourrait
permettre la mise en évidence de nouvelles thématiques.
L’ECMT a rendu possible l’indexation du texte par un vocabulaire médical contrôlé permettant
de répondre à la question des thématiques les plus retrouvées au sens disciplines médicales. Seuls
80% des tweets ont été indexés, la présence de termes non recouverts par la terminologie MeSH
et notamment les termes propres au système de santé français pourrait expliquer ce défect.
L’annexion des concepts MeSH à des métatermes permet une meilleure compréhension du
sujet. Cependant, l’organisation multiaxiale du Thésaurus MeSH implique qu’un descripteur
MeSH peut être attribué à plusieurs métatermes (14 676 descripteurs MeSH sur 28 489 se
retrouvent dans au moins 2 branches de hiérarchies (soit 51,5%). Ainsi le descripteur
"Vaccination" est lié à de nombreux métatermes dont les trois plus fréquents. Par ailleurs,
l’attribution d’un descripteur à certains mots fréquents est aussi source de biais, par exemple le
terme "pris" est décrit par le concept MeSH " syndrome de perfusion du propofol " lui-même
annexé au métaterme "pharmacologie".
4. Déontologie
Afin de garantir la conformité avec les principes de déontologie médicale dans l’utilisation du
« web santé » dans l’exercice médical, le Conseil National De l’Ordre des Médecins a rendu public
en 2012 un livre blanc (43) présentant les préconisations phares en matière de déontologie
médicale sur le web.
Les médecins doivent protéger la confidentialité de leurs patients, ils doivent être
assurés que les informations les concernant resteront confidentielles, que l’accès à ces
données sera sécurisé.
L’utilisation d’un pseudonyme est soumise à la condition de le déclarer auprès de
l’Ordre, comme le prévoit le code de la santé publique.
Enfin les informations en santé échangées doivent être de qualité : consistantes et
fondées sur les preuves, avis médicaux ou conseils donnés par des praticiens qualifiés.
28
Le respect de ces principes n’a pas été exploré au cours de l’étude, il apparait cependant que
le support est un réseau ouvert à tous, limitant fortement la protection des données. L’utilisation
de pseudonymes est majoritaire. Enfin, une étude portant sur les réponses données est
nécessaire afin de valider la qualité de l’information produite.
5. Collaborations
Perspectives
L’analyse de contenus générés dans ce contexte peut présenter un fort potentiel dans de
nombreux domaines :
-Identifier les expériences réelles des praticiens et les thèmes émergents afin de guider la
formation, la recherche, l’élaboration des recommandations de bonne pratique.
-Stimuler les réseaux de connaissance en repérant les similitudes, les complémentarités, les
approfondissements, les différences et les originalités d’un sujet par rapport à d’autres,
permettant d'établir des liens entre les auteurs.
29
Le développement de pratiques telle que l’usage du #DocTocToc, aboutit à la production
d’information médicale que ce soit par des professionnels de santé, des sociétés savantes ou des
patients. Le fonctionnement intrinsèque aux réseaux sociaux et au Web 2.0 en général induit une
notion de dynamisme. L’étude de l’information en santé doit donc inclure cette notion en
étudiant l’évolution des discours au fil du temps. Par ailleurs l’indexation de ces données permet
d’en faciliter l’accès et ainsi de permettre la perte d’information. Un moteur de recherche
permettant de retrouver les tweets selon leur sujet a été réalisé avec le logiciel Excel®, le
développement d’un tel outil en ligne faciliterait l’accès à ces informations. (Exemple de requête
en Annexe 3)
D’autre part dans l’hypothèse où les demandes effectuées par les médecins présentent les
besoins en formation, l’identification des thèmes prépondérants doit pouvoir guider l’offre de
formation en médecine générale.
L’outil en lui-même est en pleine évolution. Depuis le juillet 2017, le bot @doctoctocbot codé
par Pinguet J. (@medecinelibre) retweete les #DocTocToc de médecins et multiplie les initiatives
de développement et de recherche : homologation communautaire des comptes de médecins,
diffusion des questions de santé, modération, analyse des pratiques…
30
CONCLUSION
Cette étude a confirmé que Twitter est utilisé par le médecin généraliste comme un espace de
partage informel d'informations en matière de santé mais aussi de gestion administrative et
sociale. L’identification précise des thèmes énoncés dans les tweets permet de cerner ses besoins.
Les patients de leur côté s’emparent aussi des plateformes collaboratives formant des
communautés virtuelles d’entraide, de soutien et de partage d’information, particulièrement
dans le cadre des maladies chroniques. La perspective d’une interaction via ces plateformes entre
le patient et le médecin est un enjeu essentiel dans le développement de la e-Santé, et implique
une évolution de la relation médecin–patient vers une médecine participative.
31
BIBLIOGRAPHIE
1. Boudry C. Web 2.0 Applications in Medicine: Trends and Topics in the Literature. Medicine
2.0. 2015; 4(1):e2. doi: doi.org/10.2196/med20.3628.
2. Silber D. Médecine 2.0 : les enjeux de la médecine participative. La Presse Médicale. 2009;
38(10):1456‑ 62. doi: doi.org/10.1016/j.lpm.2009.06.011
3. Signorini A, Segre AM, Polgreen PM, et Al. The Use of Twitter to Track Levels of Disease
Activity and Public Concern in the U.S. during the Influenza A H1N1 Pandemic. PLOS ONE.
2011; 6(5):e19467. doi: doi.org/10.1371/journal.pone.0019467
5. Paul MJ, Dredze M. You Are What You Tweet: Analyzing Twitter for Public Health.
Document présenté lors: Fifth International AAAI Conference on Weblogs and Social
Media (ICWSM). 2011; 265‑ 72. Barcelone, Espagne.
6. Adrover C, Bodnar T, Huang Z, Telenti A, Salathé M. Identifying Adverse Effects of HIV Drug
Treatment and Associated Sentiments Using Twitter. JMIR Public Health Surveillance.
2015; 1(2). doi: doi.org/10.2196/publichealth.4488
7. Tamura Y, Fukuda K, et Al. Earthquake in Japan. The Lancet. 2011; 377(9778):1652. doi:
doi.org/10.1016/S0140-6736(11)60672-7
8. McKendrick DR, Cumming GP, Lee AJ, et Al. Increased Use of Twitter at a Medical
Conference: A Report and a Review of the Educational Opportunities. Journal of Medical
Internet Research. 2012; 14(6):e176. doi: doi.org/ 10.2196/jmir.2144
9. Letierce J, Passant A, Breslin GJ, Decker S, et Al. Understanding how Twitter is used to
spread scientific messages. Document présenté lors : Web Science conférence 10:
Extending the Frontiers of Society On-Line. 2010; Raleigh, NC: US.
11. Brandenburg BJ, Jansen E. The Proof of the Pudding: First Results of a Primary Care
Consultation Service on Twitter. Document présenté lors : Conférence Medicine 2.0. 2010;
Maastricht, Pays Bas.
32
12. Tapi Nzali MD, Bringay S, Lavergne C, Mollevi C, Opitz T, et Al. What Patients Can Tell Us:
Topic Analysis for Social Media on Breast Cancer. JMIR Medical Informatics. 2017; doi:
doi.org/10.2196/medinform.7779.
15. Molette P. De l’APD à Tropes: comment un outil d’analyse de contenu peut évoluer en
logiciel de classification sémantique généraliste. Document présenté lors : Colloque
Psychologie et communication. 2009; Tarbes, France.
16. Ratinaud P, Loubère L. Documentation pour les analyses textuelles en français. IRaMuTeQ
0.6 alpha 3. [En ligne]. 2014 [cité le 1 mai 2018]; Disponible:
www.iramuteq.org/documentation/html
18. Marpsat M. La méthode Alceste. Sociologie [En ligne]. 2010 [cité le 1 mai 2018]; 1(1).
Disponible: journals.openedition.org/sociologie/312
19. Goeuriot L, Kelly L, Suominen H, Hanlen L, Névéol A, Grouin C, et al. Overview of the CLEF
eHealth Evaluation Lab 2015. In: Mothe J, Savoy J, Kamps J, Pinel-Sauvagnat K, Jones G,
San Juan E, et al., éditeurs. Experimental IR Meets Multilinguality, Multimodality, and
Interaction. 2015; p. 429‑ 43. doi: doi.org/10.1007/978-3-319-24027-5_44/
20. Kelly L, Goeuriot L, Suominen H, Névéol A, Palotti J, Zuccon G. Overview of the CLEF
eHealth Evaluation Lab 2016. In: Mothe J, Savoy J, Kamps J, Pinel-Sauvagnat K, Jones G,
San Juan E, et al., éditeurs. Experimental IR Meets Multilinguality, Multimodality, and
Interaction. 2016 ; p. 255‑ 66. doi: doi.org/10.1007/978-3-319-44564-9_24
21. Cabot C, Soualmia LF, Dahamna B, Darmoni SJ. Extracting Concepts in French Medical Texts
with ECMT and CIMIND. Document présenté lors : Conférence CLEF eHealth Evaluation
Lab. 2016; Evora, Portugal; p. 47–60.
22. Dupuch M, Hamon T, Grabar N. Groupement de termes basé sur des régularités
linguistiques et sémantiques dans un contexte cross-langue. Document présenté
lors : conférence TALN-RECITAL [En ligne]. 2013 [cité le 1 mai 2018]; Les Sables d’Olonne,
France p. 62‑ 75. Disponible: aclweb.org/anthology/F/F13/F13-1005.pdf
33
23. Frantz T, Fleur M, Gayo D, Vianney J, Sebastien C, Nicolas G. RAVEL: Retrieval And
Visualization in ELectronic health records. Studies in Health Technology and Informatics.
2012; (180):194‑ 8. doi: doi.org/10.3233/978-1-61499-101-4-194
25. Griffon N, Soualmia LF, Névéol A, Massari P, Thirion B, Dahamna B, et al. Evaluation of
multi-terminology super-concepts for information retrieval. Stud Health Technol Inform.
2011; 169:492‑ 6. doi: doi.org/10.3233/978-1-60750-806-9-492
27. Sinnenberg L, Buttenheim AM, Padrez K, Mancheno C, Ungar L, Merchant RM. Twitter as
a Tool for Health Research: A Systematic Review. Am J Public Health. 2016; 107(1):e1‑ 8.
doi: doi.org/10.2105/AJPH.2016.303512
28. Sugawara Y, Narimatsu H, Tsuya A, Tanaka A, Fukao A. Medical Institutions and Twitter: A
Novel Tool for Public Communication in Japan. JMIR Public Health Surveill. 2016; 2(1):e19.
doi: doi.org/10.2196/publichealth.4831
29. Chaudhry A, Glodé LM, Gillman M, Miller RS. Trends in Twitter Use by Physicians at the
American Society of Clinical Oncology Annual Meeting, 2010 and 2011. Journal of
Oncology Practice. 2012; 8(3):173‑ 8. doi: doi.org/10.1200/JOP.2011.000483
30. Bosley JC, Zhao NW, Hill S, Shofer FS, Asch DA, Becker LB, et al. Decoding twitter:
Surveillance and trends for cardiac arrest and resuscitation communication. Resuscitation.
2013; 84(2):206‑ 12. doi: doi.org/10.1016/j.resuscitation.2012.10.017
31. Harris JK. Diabetes Topics Associated With Engagement on Twitter. Preventing Chronic
Disease. 2015; 12:140402. doi : doi.org/10.5888/pcd12.140402
32. Surian D, Nguyen DQ, Kennedy G, Johnson M, Coiera E, Dunn AG. Characterizing Twitter
Discussions About HPV Vaccines Using Topic Modeling and Community Detection. Journal
of Medical Internet Research. 2016; 18(8):e232. doi: doi.org/10.2196/jmir.6045
33. Salerno J, Yang SJ, Nau D, Chai S-K. Identifying Health-Related Topics on Twitter. Social
Computing, Behavioral-Cultural Modeling and Prediction. 2011; p. 18‑ 25. doi:
doi.org/10.1007/978-3-642-19656-0_4
34. Bouarfa J, Rochoy M. #Doctoctoc / #Docstoctoc : Twitter comme outil d’entraide entre
médecins. Thèse pour le diplôme d’état de docteur en médecine. 2018.
34
35. Attali C, Bail P, Magnier A-M, Beis J-N, Ghasarossian C, Gomes J, et al. Compétences pour
le DES de médecine générale. Exercer [En ligne]. 2006 [cité le 1 mai 2018]; 76:31-32.
Disponible: https://parisouest.cnge.fr/doc/Attali_Bail.pdf
37. Jakoubovitch S, Bournot M-C, Cercier E, Tuffreau F. Les emplois du temps des médecins
généralistes. Etudes et résultats. 2012; (797):8.
38. Micheau J, Molière É. L’emploi du temps des médecins libéraux. DRESS, éditeur. Dossiers
solidarité et santé. 2010; (15).
39. Le Fur P, Bourgueil Y, Cases C. Le temps de travail des médecins généralistes. Une synthèse
des données disponibles. Institut de recherche et documentation en économie de la santé,
éditeur. Questions d’économie de la santé. 2009; (144).
40. Letrilliart L, Supper I, Schuers M, Darmon D, Boulet P, Favre M, et al. ECOGEN : étude des
Éléments de la COnsultation en médecine GENérale. Exercer. 2014; 25(114):148‑ 57.
41. Observatoire de la médecine générale. Les diagnostics les plus fréquents: Top 25 [En
linge]. 2009 [cité 1 mai 2018] ; Disponible sur: omg.sfmg.org/content/donnees/top25.php
43. Conseil National de l’Ordre des Médecins. Deontologie medicale sur le web: Le Livre blanc
du Conseil national de l’Ordre des médecins [Internet]. [cité 22 avr 2018]. Disponible sur:
www.conseil-national.medecin.fr/sites/default/files/livre_blancdeontoweb2012.pdf
44. Chen T, Dredze M. Vaccine Images on Twitter: Analysis of What Images are Shared. Journal
of Medical Internet Research. 2018; 20(4):e130. doi: doi.org/10.2196/jmir.8221
45. Haute Autorité de Santé. Les groupes d’analyse de pratiques entre pairs : Evaluation et
amélioration des pratiques [En ligne] 2006 [cité 1 mai 2018]. Disponible sur:
www.irbms.com/download/documents/HAS-groupes-analyses-pratique-entre-pairs.pdf
46. Eysenbach G. Health related virtual communities and electronic support groups:
systematic review of the effects of online peer to peer interactions. British Medical
Journal. 2004; 328(7449):1166‑ 0. doi: doi.org/10.1136/bmj.328.7449.1166
35
ANNEXES
36
IMPORTATION DU TEXTE
Encodage utf 8 - All languages
Langue Français
Marqueur de texte ****
Utiliser le dictionnaire des expressions ☒
Faire des segments de texte ☐
NETTOYAGE
Mettre le texte en minuscule ☒
Eliminer les caractères en dehors de cette liste ☒^ a-z A-Z (toutes typographies) 0-9 .:,;!?'_-
Remplacer les tirets par des espaces ☒
Conserver la ponctuation ☐
Pas d'espace entre deux formes ☐
CLASSIFICATION
Simple sur segment de textes ☒
Nombre de classes terminales de la phase 1 10
Nombre minimum de ST par classe 0 (automatique)
Nombre maximum de formes analysées 3000
Annexe 2 : Paramètres IRaMuTeQ®
Libellé du
Métaterme Résultat
concept
#DocsTocToc vous faites quoi comme examen pour diagnostic
coqueluche infectiologie coqueluche? PCR non remb, sero pas top et culture sur aspi non faite par
le labo ?
#DocsTocToc - Quand demandez-vous une recherche de coqueluche ?
coqueluche infectiologie (Toux rarement typique et > 3 sem la recherche n'a plus vraiment
d'intérêt).
coqueluche infectiologie #DocsTocToc c'est pas remboursé la PCR coqueluche ?
#DocsTocToc Suspicion de coqueluche phase toux quinteuse chez petit
coqueluche infectiologie
de 9 mois vous faites quoi?
#DocsTocToc Pour une suspicion de coqueluche chez l'adulte, on fait
coqueluche infectiologie
quoi maintenant : sérologie ? PCR ?
#docstoctoc Dans la coqueluche il y a un intérêt à mettre un ttt ATB
coqueluche infectiologie
jusqu'à quel délai? (Dans les 15j non?)
Annexe 3 : Requête du Concept « coqueluche » dans le moteur de recherche
37
SERMENT D'HIPPOCRATE
Admis(e) dans l’intimité des personnes, je tairai les secrets qui me seront
confiés. Reçu(e) à l’intérieur des maisons, je respecterai les secrets des
foyers et ma conduite ne servira pas à corrompre les moeurs.
J’apporterai mon aide à mes confrères ainsi qu’à leurs familles dans
l’adversité.
Que les hommes et mes confrères m’accordent leur estime si je suis fidèle
à mes promesses ; que je sois déshonoré(e) et méprisé(e) si j’y manque.
AUTEUR : Nom : SALLES Prénom : Adrien
Date de soutenance : 31/05/2018
Titre de la thèse : Analyse du discours médical sur Twitter® : Etude d’un corpus
de tweets émis par des médecins généralistes entre juin 2012 et mars 2017 et
contenant le #DocTocToc.
Thèse - Médecine - Marseille 2018
Cadre de classement : D.E.S. de Médecine Générale
Mots-clés : #doctoctoc, e-santé, entraide, réseaux sociaux, Twitter
Résumé
Introduction : Depuis Juin 2012 une communauté médicale échange sur twitter avec un Hashtag :
#DocTocToc.
L’objectif de l’étude est d’étudier les principales thématiques des demandes effectuées via le
#DocTocToc par des médecins généralistes entre juin 2012 et mars 2017.
Matériel et méthode : Une collecte de donnée a permis de constituer un corpus de tweets émis par
des médecins généralistes. Une étape de prétraitement a permis transformer les formes
potentiellement non reconnues par les logiciels de traitement du langage naturel. Le corpus a été
appréhendé à l’aide de trois approches : une approche sémantique via le logiciel Tropes®, une
approche lexicale via le logiciel Iramuteq® et une indexation terminologique par l’extracteur de
concepts multi-terminologiques (ECMT) du Catalogue et Index des Sites Médicaux Francophones
(CISMEF).
Résultats : Sur les 12716 tweets recueillis, 7366 étaient rédigés par un médecin généraliste et ont été
analysés.
Les univers de référence les plus fréquents identifiés par l’approche sémantique sont la santé, le
temps, corps, la finance, l’enfance.
L’approche lexicale détermine deux grands mondes lexicaux l’un en lien avec les demandes médico
administratives relatives à la gestion du cabinet et à la prise en charge sociale du patient, l’autre en
lien avec les demandes d’ordre purement médicales.
Conclusion : Sur Twitter®, le hashtag Doc(s)TocToc est utilisé par le médecin généraliste comme un
espace de partage informel d'informations en matière de santé mais aussi de gestion administrative
et sociale. L’identification précise des thèmes énoncés dans les tweets permet de cerner ses besoins
et pourrait guider la formation médicale en médecine générale.
Composition du Jury :
Président : Monsieur le Professeur Burtey Stéphane
Assesseurs : Monsieur le Professeur Gorincour Guillaume
Monsieur le Docteur Dufour Jean Charles
Directeur de thèse : Madame le Docteur Cibois-Honnorat Isabelle