Intégration de connaissances syntaxiques dans les modèles de langue pour la RI
Résumé
En Recherche d'Information (RI) les méthodes purement statistiques basées sur des distributions de mots-clef ont actuellement atteint une limite. Cette limite n'est franchissable que par l'apport massif de connaissances extérieures au sein du système de RI. Nos travaux portent sur l'utilisation en RI des liens de niveaux syntaxiques entre les termes. Nous considérons ainsi les dépendances syntaxiques contenues dans l'arbre de dépendance produit par des analyseurs syntaxiques de surface. Pour intégrer ces informations en RI, le contexte des modèles de langue nous semble favorable. En effet, l'aspect théorique des modèles de langue est très intéressant, il est adaptable et permet l'intégration de nouvelles connaissances. Nous présentons ici, l'intégration des liens syntaxiques au sein d'un modèle de langue. Ce modèle est évalué sur une partie de la collection de CLEF. Les résultats montrent que l'intégration des dépendances syntaxiques abaisse les performances du système de RI. Face à ces résultats, nous souhaitons pour la suite de ces travaux nous orienter vers l'apport d'information de niveau plus sémantique.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...