TD2 Rim1
TD2 Rim1
TD2 Rim1
ISIMM
Donner l’ordre dans lequel ces modules doivent être exécutés par l’indexeur d’un document
[4,6,10,12,14,16,18,20,22,32,47,81,120,122,157,180]
Et le second terme est formé par un Posting List à entrée unique [47]. Calculez le nombre de
comparaisons nécessaires pour trouver l’intersection des deux Posting List.
Exercice 4 :
On suppose que seuls les termes de « fréquence de poids » sont utilisés (pas de facteur
inverse de fréquence), et les seuls mots ignorés « stopwords » sont “is” et are. Calculez le
cosinus de similarités des deux documents suivant :
Soient les ensembles des termes obtenus de l'indexation des documents D1 et D2 suivants :
Question 1 Selon le modèle Booléen, quels sont les résultats retournés pour la requête
suivante « metal OR click »
Question 2 Dans le cas d’un modèle probabiliste, donner dans un tableau les probabilités
calculées par les requêtes « click », « shears » et « click shears » pour chaque document, puis
classer ces documents pour chaque requête.