Academia.eduAcademia.edu

TD11 Documents électroniques M1 Linguistique informatique

M1SOL041 - Documents électroniques 2021-2022 Master Langue et Informatique TD11 Documents Structurés en LATEX(II) Gaël Lejeune, Sorbonne Université cours partagé avec Vincent Lully Exercice 1 : Préparer le rapport de Méthodo Récupérez sur Moodle le modèle (Template) de Rapport. Vous n’avez aucune obligation de l’utiliser le jour J, il s’agit encore une fois d’un exercice applicatif. Savoir vous servir de Latex vous permettra de produire des documents de qualité sans effort et d’interfacer facilement avec des résultats générés automatquement (tableaux, courbes . . . ) • Editez la page de titre • Ajoutez des ”label” au début de chaque section \label{intro} \dots \label{donnees}\dots \label{methodes}\dots \label{resultats} \dots • A la fin de l’introduction, annoncez le plan Dans la section \ref{donnees} nous présentons le corpus utilisé pour cette étude puis dans la section \ref{methodes} nous décrivons \dots Exercice 2 : Décrire les données Créez (automatiquement ou non), un tableau latex décrivant le corpus utilisé en Méthodo. Vous devrez faire apparaı̂tre pour chaque classe et au global : • Le nombre de textes • La taille en mots: total, moyenne et écart-type • La taille en phrases: total, moyenne et écart-type • La taille en caractères: total, moyenne et écart-type Exercice 3 : Ajouter des références Allez chercher quelques références sur l’apprentissage automatique et la classification de textes. Trouvez les au format bibtex (.bib) afin de les copier-coller dans votre fichier biblio.bib et de pouvoir les citer. A noter que le fichier de bibliographie est appelé dans le fichier base rapport par la commande suivante : \bibliography{biblio} 1 Voici à quoi ressemble une entrée bibtex : @InProceedings{IDENTIFIANT, --> permet de citer avec \cite{IDENTIFIANT} author = {Delphine Bernhard},--> L’auteur -->Les autres informations sont aussi de la forme : NOM = {valeur} : title = {Apprentissage non supervis\’e de familles morphologiques par classification ascendante hi\’erarchique}, pages = {367--376}, year = {2007}, booktitle = {Livre de toto} }-->Ferme la structure entamée avec "{" Détails sur le format bibtex ”@InProceedings” représente le type d’entrée, ce n’est pas très important pour démarrer. Ça détermine seulement le type d’informations qui sont censées être présents pour une entrée. Plus de détails ici : https://fr. wikipedia.org/wiki/BibTeX. On observe une séquence étrange: \’e C’est une manière (pas spécifique à bibtex) de représenter les caractères accentués en restant compatible ascii, rappelez vous le paramètre ensure ascii quand on sauvegarde en Json. Différentes manières existent pour trouver au format bibtex : • via CiteSeerX: https://citeseerx.ist.psu.edu/ • en tapant ”NOM DE L’ARTICLE bibtex” dans un moteur de recherche • via HAL archives ouvertes : https://hal.archives-ouvertes.fr/ On peut aussi chercher sur la page personnelle d’un des auteurs, sur des sites tels qu’ACL Anthology pour les articles de TAL, enfin de nombreux éditeurs proposent les références en différents formats dont bibtex NB: On peut aussi créer des entrées ”à la main” en modifiant une entrée existante. Une fois la référence récupérée vous pouvez la copier coller Votre travail Ajoutez quelques références à votre tableau de stats, par exemple : Dans leur article de 2020 (\cite{toto}) les auteurs disent que .... NB: peu importe que vous écrviez quelque chose de correct scientifiquement, le but est d’utiliser la commande cite en liaison avec votre fichier bib 2