Bienvenue sur Scribd !

0% ont trouvé ce document utile (0 vote)

29 vues

TD2 Rim1

Transféré par

Ce document contient plusieurs exercices sur les techniques d'indexation et de recherche d'information. Il aborde des sujets comme l'évaluation de rappel et précision, le processus d'indexation, les index inverses, les modèles de recherche booléen et probabiliste.

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

TD2 Rim1

Transféré par

lobnabakir123

0% ont trouvé ce document utile (0 vote)

29 vues2 pages

Titre original

TD2_RIM1

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

0% ont trouvé ce document utile (0 vote)

29 vues2 pages

TD2 Rim1

Transféré par

lobnabakir123

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

Techniques d’indexation et RI

ISIMM

Exercice 1 : Evaluation: Rappel et précision

un système de recherche d’information retourne 3 documents pertinents et 2 documents non
pertinents. Il existe au total 8 documents pertinents dans la collection. Quelle est la précision
de ce système pour cette recherche, et quel est son rappel ?

Exercice 2 : Processus d’indexation

Un moteur de recherche collecte des documents et les envoie à un indexeur, qui emploie les
modules suivants:
(A) un stemmer;
(B) un détecteur de langue pour détecter le langage de chaque document
(C) un éliminateur de mots (stop-word)
(D) un filtre qui détecte le format du document (pdf, word, etc )

Donner l’ordre dans lequel ces modules doivent être exécutés par l’indexeur d’un document

Exercice 3 : Index inverse

On dispose d’une requête sur deux mots. Pour l’un des termes le Posting List est formé par les
16 entrées suivantes :

[4,6,10,12,14,16,18,20,22,32,47,81,120,122,157,180]

Et le second terme est formé par un Posting List à entrée unique [47]. Calculez le nombre de
comparaisons nécessaires pour trouver l’intersection des deux Posting List.

Exercice 4 :

On suppose que seuls les termes de « fréquence de poids » sont utilisés (pas de facteur
inverse de fréquence), et les seuls mots ignorés « stopwords » sont “is” et are. Calculez le
cosinus de similarités des deux documents suivant :

a) “precision is very very high”

b) “high precision is very very very important”
Exercice 5 :

Soient les ensembles des termes obtenus de l'indexation des documents D1 et D2 suivants :

D1 = {efficacité, recherche, mesurée, précision, moyenne}

D2 = {modèles, recherche, efficaces, langage, vectoriel}

1. Donner la table des fréquences : terme, document;

2. Calculer TF*IDF de chaque terme où

où Nt est le nombre de documents contenant le terme ti et N est le

nombre de documents.

Exercice 6 : Modèles de recherche

Supposons qu’on dispose d’une collection constituée de 4 documents donnés dans la table
suivante. Nous allons considérer la recherche en utilisant 2 modèles de recherches :

DocID Document texte

1 click go the shears boys click click click
2 click click
3 metal here
4 metal shears click here

a. Recherche par un modèle Booléen.

b. Recherche tronquée par un modèle probabiliste.

Question 1 Selon le modèle Booléen, quels sont les résultats retournés pour la requête
suivante « metal OR click »

Question 2 Dans le cas d’un modèle probabiliste, donner dans un tableau les probabilités
calculées par les requêtes « click », « shears » et « click shears » pour chaque document, puis
classer ces documents pour chaque requête.

• Donner Le score final pour la requête “click shears” ?

Vous aimerez peut-être aussi

Tuto Map Edc15
Document29 pages
Tuto Map Edc15
yvanimohamad
Pas encore d'évaluation
Série 1-RI-ISIL
Document4 pages
Série 1-RI-ISIL
jaik Duhamel
100% (1)
Chapitre3 Indexation
Document69 pages
Chapitre3 Indexation
Chiheb Mezrigui
Pas encore d'évaluation
TD - Recherche D'information Multimédia Exercice 1 - Modèle Booléen Pondéré
Document6 pages
TD - Recherche D'information Multimédia Exercice 1 - Modèle Booléen Pondéré
Kineba
100% (1)
Examen Corrige Type
Document6 pages
Examen Corrige Type
dona
Pas encore d'évaluation
Merise Exo
Document5 pages
Merise Exo
Jyriwu Craftaj
100% (1)
1ereNSI Controle22 4 Corrige
Document6 pages
1ereNSI Controle22 4 Corrige
Meriem Hachicha
Pas encore d'évaluation
Cours3 ReformulationRequetesRocchio OukidL
Document11 pages
Cours3 ReformulationRequetesRocchio OukidL
Sou Miaa
Pas encore d'évaluation
Efs - S1 - Poo - 2018-2019
Document1 page
Efs - S1 - Poo - 2018-2019
Fifi Fifita
Pas encore d'évaluation
Série - 6
Document2 pages
Série - 6
hamrarasyakoub9
Pas encore d'évaluation
TD Tme SQL3 2007
Document4 pages
TD Tme SQL3 2007
achrefov
100% (1)
Cours 3 - Modèles de Recherches Dinformations - 2022 1 1
Document23 pages
Cours 3 - Modèles de Recherches Dinformations - 2022 1 1
werghemifahd19
Pas encore d'évaluation
Examen - Recherche D'information - 2018-Corrigé
Document3 pages
Examen - Recherche D'information - 2018-Corrigé
Yas M
86% (14)
MUT112131
Document2 pages
MUT112131
Ousa Ma
Pas encore d'évaluation
Cours 3 ModÃles de Recherches Dinformations 2024
Document23 pages
Cours 3 ModÃles de Recherches Dinformations 2024
selminarjes07
Pas encore d'évaluation
2022 MP Informatique
Document19 pages
2022 MP Informatique
chaymamri2020
Pas encore d'évaluation
Rital 2019-TD1
Document2 pages
Rital 2019-TD1
saadi chourouk
Pas encore d'évaluation
Terminale 2022 Centres Etrangers Jour 1
Document14 pages
Terminale 2022 Centres Etrangers Jour 1
nobodythepeanut
Pas encore d'évaluation
TD1 2
Document4 pages
TD1 2
Ķőőķie Šâm
100% (5)
Series Algo 2,3,4 (TD + TP)
Document3 pages
Series Algo 2,3,4 (TD + TP)
aniswastaken12
Pas encore d'évaluation
Examen Python
Document5 pages
Examen Python
hala kammoun
100% (1)
Diapo2 RI PDF
Document61 pages
Diapo2 RI PDF
me
Pas encore d'évaluation
Exam2014 s1-1 1
Document1 page
Exam2014 s1-1 1
wissemcherifi
Pas encore d'évaluation
TPs
Document6 pages
TPs
karim mansoura
Pas encore d'évaluation
FasciculeASDII LM
Document9 pages
FasciculeASDII LM
Salah Gouja
Pas encore d'évaluation
02 - TD 01 - AlgÃ Bre Relationnelle - 2021 - 2022 - 1
Document5 pages
02 - TD 01 - AlgÃ Bre Relationnelle - 2021 - 2022 - 1
Modou Diagne
Pas encore d'évaluation
Algorithme Et Structure de Données
Document4 pages
Algorithme Et Structure de Données
monnah.yans
Pas encore d'évaluation
Exam 2016
Document4 pages
Exam 2016
Jihed Hmila
Pas encore d'évaluation
3.3 - Représentation des nombres réels
Document4 pages
3.3 - Représentation des nombres réels
waterearjames
Pas encore d'évaluation
Evaluation de Recherche D
Document5 pages
Evaluation de Recherche D
Wilfried Dabiré
Pas encore d'évaluation
Examen ANALYSE DES DONNEES
Document2 pages
Examen ANALYSE DES DONNEES
ezz
100% (2)
3.1 - Représentation des entiers
Document3 pages
3.1 - Représentation des entiers
waterearjames
Pas encore d'évaluation
Chap2 Indexation OL
Document28 pages
Chap2 Indexation OL
Sou Miaa
Pas encore d'évaluation
Exam Juin 2014
Document6 pages
Exam Juin 2014
Saad Bel
Pas encore d'évaluation
Contrôle Rech 2020
Document2 pages
Contrôle Rech 2020
joud tv
Pas encore d'évaluation
Activite-Comment Organiser Ses Données
Document3 pages
Activite-Comment Organiser Ses Données
kelhetter
Pas encore d'évaluation
Série TD2
Document3 pages
Série TD2
Entertainment world
100% (1)
02 - TD 01 - Algèbre Relationnelle
Document7 pages
02 - TD 01 - Algèbre Relationnelle
Modou Diagne
Pas encore d'évaluation
Corr PCD Seq4 Sujet1
Document3 pages
Corr PCD Seq4 Sujet1
MAIKE ÉRICK TAGNI NGOH
Pas encore d'évaluation
2024 - PBT FIG-GSI Théorique
Document3 pages
2024 - PBT FIG-GSI Théorique
patricdongmo
100% (1)
TD N°1: Modèle Vectoriel
Document2 pages
TD N°1: Modèle Vectoriel
benyellesnesrine0
Pas encore d'évaluation
Exercices
Document10 pages
Exercices
deogratias davo
Pas encore d'évaluation
FSCI1003 Biblio TP Consignes Automne 2023
Document5 pages
FSCI1003 Biblio TP Consignes Automne 2023
Ny Hery Ambinintsoa RABEANTOANDRO
Pas encore d'évaluation
TD-TP Ict106 16 Mai 2024
Document3 pages
TD-TP Ict106 16 Mai 2024
djangourialifadel
Pas encore d'évaluation
RAPPORT Tp groupe g2_1
Document22 pages
RAPPORT Tp groupe g2_1
stcoulibaly026
Pas encore d'évaluation
Chapitre 3
Document35 pages
Chapitre 3
mo7sen single
Pas encore d'évaluation
F Python1 Ariana
Document38 pages
F Python1 Ariana
janvierhz
Pas encore d'évaluation
Projet Partiel
Document5 pages
Projet Partiel
dung
Pas encore d'évaluation
03 ElasticSearch ELK-IP
Document122 pages
03 ElasticSearch ELK-IP
helmi.sassi.hs
Pas encore d'évaluation
M1idsm Bda Ex1
Document5 pages
M1idsm Bda Ex1
jeannico
Pas encore d'évaluation
Doc10 - FinalExamSujet2 - Ennoncé
Document1 page
Doc10 - FinalExamSujet2 - Ennoncé
Wilfreed MINFOUNDI
Pas encore d'évaluation
Modeles RI 1
Document58 pages
Modeles RI 1
Rihab BEN LAMINE
Pas encore d'évaluation
TD Analyse de Document Stat MG
Document3 pages
TD Analyse de Document Stat MG
emacf0119
Pas encore d'évaluation
Chapitre 3 Vector Space Model
Document32 pages
Chapitre 3 Vector Space Model
Cyrine Ouesleti
Pas encore d'évaluation
EXAMEN
Document3 pages
EXAMEN
Ayachi Emna
Pas encore d'évaluation
NDQxNDIwMjQtMDYtMjkgMjM6MjI6MTI=
Document3 pages
NDQxNDIwMjQtMDYtMjkgMjM6MjI6MTI=
Dounia Chahid
Pas encore d'évaluation
Ouargla PSIBD Nov2011
Document4 pages
Ouargla PSIBD Nov2011
ammar
Pas encore d'évaluation
Formation Python 2019
Document56 pages
Formation Python 2019
abirkhmir
Pas encore d'évaluation
Devoir dc1 Algo Programmation 4eme Informatique
Document2 pages
Devoir dc1 Algo Programmation 4eme Informatique
ramlienis80
Pas encore d'évaluation
Les tableaux croisés dynamiques avec Excel: Pour aller plus loin dans votre utilisation d'Excel
D'Everand
Les tableaux croisés dynamiques avec Excel: Pour aller plus loin dans votre utilisation d'Excel
Rémy Lentzner
Pas encore d'évaluation
Bien débuter avec SQL: Exercices dans l'interface PhpMyAdmin et MySQL
D'Everand
Bien débuter avec SQL: Exercices dans l'interface PhpMyAdmin et MySQL
Rémy Lentzner
Pas encore d'évaluation
Denombrement
Document7 pages
Denombrement
lobnabakir123
Pas encore d'évaluation
Exam C
Document20 pages
Exam C
Fradi Essil
Pas encore d'évaluation
TP05 Tech&Prog LI2
Document2 pages
TP05 Tech&Prog LI2
lobnabakir123
Pas encore d'évaluation
TP3-Intents: Objectif
Document4 pages
TP3-Intents: Objectif
lobnabakir123
Pas encore d'évaluation
Support - Chapitre I
Document79 pages
Support - Chapitre I
lobnabakir123
Pas encore d'évaluation
ExerciesIA LI2
Document6 pages
ExerciesIA LI2
lobnabakir123
Pas encore d'évaluation
QCM Scrum
Document7 pages
QCM Scrum
lobnabakir123
Pas encore d'évaluation
QCM Devops
Document6 pages
QCM Devops
lobnabakir123
100% (2)
Ouils de Diagnostic Stratégique
Document27 pages
Ouils de Diagnostic Stratégique
lobnabakir123
Pas encore d'évaluation
TP1 Partie 2 - Tableau Kanban
Document1 page
TP1 Partie 2 - Tableau Kanban
lobnabakir123
Pas encore d'évaluation
Console D'administration (Admin) - Wiki1000
Document167 pages
Console D'administration (Admin) - Wiki1000
ZahiraElGhandour
Pas encore d'évaluation
Module 01-Introduction
Document23 pages
Module 01-Introduction
Mahamadou Diallo
Pas encore d'évaluation
Liste Des Processus
Document2 pages
Liste Des Processus
Cherif Lilia
100% (1)
Installer Et Configurer Git Et GitHub - OpenClassrooms
Document6 pages
Installer Et Configurer Git Et GitHub - OpenClassrooms
waad
Pas encore d'évaluation
Chapitre 2
Document15 pages
Chapitre 2
thisisnicette04
Pas encore d'évaluation
SDR À Conversion Numérique Directe: Comment Fonctionne Ce Qui Est Dans La Boite Noire Et Comment Évaluer Les Performances
Document83 pages
SDR À Conversion Numérique Directe: Comment Fonctionne Ce Qui Est Dans La Boite Noire Et Comment Évaluer Les Performances
mallet
Pas encore d'évaluation
CV - Ihsane - El Hendouzi-1
Document1 page
CV - Ihsane - El Hendouzi-1
Omayma Gdira
Pas encore d'évaluation
Notice - Prise de Note ObjectifDEC
Document6 pages
Notice - Prise de Note ObjectifDEC
Joaquim De Oliveira
Pas encore d'évaluation
Cours III Techniques Rédaction Du Mémoire de Master
Document15 pages
Cours III Techniques Rédaction Du Mémoire de Master
Ismail Bendjemaa
Pas encore d'évaluation
Cours Informatique - Suite - 4e AEP
Document4 pages
Cours Informatique - Suite - 4e AEP
Hafid CHAMI
Pas encore d'évaluation
User Manual - Acer - 1.0 - A - A
Document53 pages
User Manual - Acer - 1.0 - A - A
Slim killer
Pas encore d'évaluation
Décrire Un Objet, Une Personne - Allemand - Fiches de Cours Pour Collège - Révisions Pour Les Vacances Des Enfants & Ados
Document1 page
Décrire Un Objet, Une Personne - Allemand - Fiches de Cours Pour Collège - Révisions Pour Les Vacances Des Enfants & Ados
Léossé Quaudzo AGAMAH
Pas encore d'évaluation
Rapport Du TPs Électronique Embarqué
Document42 pages
Rapport Du TPs Électronique Embarqué
Khadija El Amoury
Pas encore d'évaluation
Formation Installer Et Configurer Windows Server 2019
Document1 page
Formation Installer Et Configurer Windows Server 2019
Hassan Abdikarim ismael
Pas encore d'évaluation
PA 56 Basse Def
Document52 pages
PA 56 Basse Def
ogibinet
Pas encore d'évaluation
Aménager Sa Voiture en Van Pour Un Road Trip - Objectif Vie en Van
Document12 pages
Aménager Sa Voiture en Van Pour Un Road Trip - Objectif Vie en Van
C-Lee-O -
Pas encore d'évaluation
Devoir Authentification
Document31 pages
Devoir Authentification
fjerome57
Pas encore d'évaluation
Avoir Un Téléphone Anonyme
Document11 pages
Avoir Un Téléphone Anonyme
herve.paris104
Pas encore d'évaluation
IT Technicien Informatique, Administrateur Junior - 7ac4e134
Document4 pages
IT Technicien Informatique, Administrateur Junior - 7ac4e134
park
Pas encore d'évaluation
Programmation Linéaire en Nombres Entiers-Première - Partie PDF
Document13 pages
Programmation Linéaire en Nombres Entiers-Première - Partie PDF
Mohamed Selmani
Pas encore d'évaluation
Assembleur Basex3 Et Avancerx3
Document41 pages
Assembleur Basex3 Et Avancerx3
Nixon
Pas encore d'évaluation
Efm Poo DD101
Document2 pages
Efm Poo DD101
bahaj zouhair
Pas encore d'évaluation
CV Mariam LAGUIDE CA
Document2 pages
CV Mariam LAGUIDE CA
Cheou Alao
Pas encore d'évaluation
Bonne Copie Zaineb Ayachi
Document43 pages
Bonne Copie Zaineb Ayachi
omaimahbibi009
Pas encore d'évaluation
Base de Données Sous Microsoft Acces
Document19 pages
Base de Données Sous Microsoft Acces
Oudach hafsa
Pas encore d'évaluation
CV 1810 2023
Document1 page
CV 1810 2023
Nabil Ahmed
Pas encore d'évaluation
Oracle TP
Document15 pages
Oracle TP
Anas RAOUF
Pas encore d'évaluation
Azure DevOps For Teenagers
Document34 pages
Azure DevOps For Teenagers
Antony Kervazo-Canut
Pas encore d'évaluation
Faire Une Analyse Thématique
Document11 pages
Faire Une Analyse Thématique
Tiziri World
Pas encore d'évaluation