Typologie des moteurs de recherche sur le WEB, Rapport tâche T1.1 du projet SIIRI

Jean-Pierre Chevallet 1
1 MRIM - Modélisation et Recherche d’Information Multimédia [Grenoble]
LIG - Laboratoire d'Informatique de Grenoble, Inria - Institut National de Recherche en Informatique et en Automatique
Résumé : L'état des lieux des moteurs de recherche sur le WEB, nous permet de dire que pour l'instant les systèmes proposés sont basés sur des technologie très basiques sans aucun traitement de l'information (langue, termes). Ces systèmes sont plus proches des données brutes que du besoin de l'utilisateur. Ce dernier doit alors faire de gros effort pour trouver une requête capable d'approcher son besoin. Seul les systèmes EuroFerret et Google proposent une approche légèrement plus élevée que les autres systèmes. Nous avons constaté que lorsqu'une version simplifiée de la syntaxe des requêtes était fournie, sa sémantique n'était pas évidente. Nous en concluons que pour réaliser une application frontale à ces systèmes, il est plus sur, quand c'est possible, d'utiliser la syntaxe complète du langage de l'algèbre de Boole. Il est frappant également de constater que la technologie mise en œuvre dans des systèmes date en faite des années 50, c'est à dire des tous débuts des recherches dans le domaine de la recherche d'information. La raison est probablement technique car pour couvrir la masse d'information colossale que représente le Web, ces techniques frustres sont faciles à implanter. Mais c'est aussi un choix technologique car l'exemple du système Google montre que l'on peut s'écarter du système basique booléen et fournir out de même des bons résultats avec une syntaxe des requêtes réduite à une séquence de mots. Notre proposition dans le projet SIRII d'utiliser ces moteurs de recherche comme élément basique à travers une interface d'analyse de la requête prend alors tous son sens : le moteur de recherche est vu comme une simple mais très vaste base de données d'indexation plein texte simple. Le rôle de cette interface sera alors de tirer au mieux partie des spécificités des moteurs que nous avons étudiés dans ce projet.
Type de document :
Rapport
[Research Report] 1999
Liste complète des métadonnées

Littérature citée [3 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00954156
Contributeur : Marie-Christine Fauvet <>
Soumis le : lundi 3 mars 2014 - 13:21:23
Dernière modification le : jeudi 11 octobre 2018 - 08:48:04
Document(s) archivé(s) le : samedi 31 mai 2014 - 10:54:49

Fichier

chevallet99a_SIIRI_T11.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00954156, version 1

Collections

Citation

Jean-Pierre Chevallet. Typologie des moteurs de recherche sur le WEB, Rapport tâche T1.1 du projet SIIRI. [Research Report] 1999. 〈hal-00954156〉

Partager

Métriques

Consultations de la notice

259

Téléchargements de fichiers

428