Intégration de connaissances syntaxiques dans les modèles de langue pour la RI

Loic Maisonnasse 1
1 MRIM - Modélisation et Recherche d’Information Multimédia [Grenoble]
LIG - Laboratoire d'Informatique de Grenoble, Inria - Institut National de Recherche en Informatique et en Automatique
Résumé : En Recherche d'Information (RI) les méthodes purement statistiques basées sur des distributions de mots-clef ont actuellement atteint une limite. Cette limite n'est franchissable que par l'apport massif de connaissances extérieures au sein du système de RI. Nos travaux portent sur l'utilisation en RI des liens de niveaux syntaxiques entre les termes. Nous considérons ainsi les dépendances syntaxiques contenues dans l'arbre de dépendance produit par des analyseurs syntaxiques de surface. Pour intégrer ces informations en RI, le contexte des modèles de langue nous semble favorable. En effet, l'aspect théorique des modèles de langue est très intéressant, il est adaptable et permet l'intégration de nouvelles connaissances. Nous présentons ici, l'intégration des liens syntaxiques au sein d'un modèle de langue. Ce modèle est évalué sur une partie de la collection de CLEF. Les résultats montrent que l'intégration des dépendances syntaxiques abaisse les performances du système de RI. Face à ces résultats, nous souhaitons pour la suite de ces travaux nous orienter vers l'apport d'information de niveau plus sémantique.
Type de document :
Communication dans un congrès
RJCRI, 2006, Lyon, France. 2006
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00954051
Contributeur : Marie-Christine Fauvet <>
Soumis le : lundi 3 mars 2014 - 11:36:56
Dernière modification le : mardi 24 avril 2018 - 13:29:25
Document(s) archivé(s) le : samedi 31 mai 2014 - 10:53:17

Fichier

RJCRI2006vf.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00954051, version 1

Collections

Citation

Loic Maisonnasse. Intégration de connaissances syntaxiques dans les modèles de langue pour la RI. RJCRI, 2006, Lyon, France. 2006. 〈hal-00954051〉

Partager

Métriques

Consultations de la notice

129

Téléchargements de fichiers

71