Construction d'un wordnet libre du français à partir de ressources multilingues

Résumé : Cet article décrit la construction d'un Wordnet Libre du Français (WOLF) à partir du Princeton WordNet et de diverses ressources multilingues. Les lexèmes polysémiques ont été traités au moyen d'une approche reposant sur l'alignement en mots d'un corpus parallèle en cinq langues. Le lexique multilingue extrait a été désambiguïsé sémantiquement à l'aide des wordnets des langues concernées. Par ailleurs, une approche bilingue a été suffisante pour construire de nouvelles entrées à partir des lexèmes monosémiques. Nous avons pour cela extrait des lexiques bilingues à partir de Wikipédia et de thésaurus. Le wordnet obtenu a été évalué par rapport au wordnet français issu du projet EuroWordNet. Les résultats sont encourageants, et des applications sont d'ores et déjà envisagées.
Type de document :
Communication dans un congrès
TALN 2008 -Traitement Automatique des Langues Naturelles, Jun 2008, Avignon, France. 2008
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00614707
Contributeur : Benoît Sagot <>
Soumis le : lundi 15 août 2011 - 11:28:47
Dernière modification le : jeudi 15 novembre 2018 - 20:27:26
Document(s) archivé(s) le : lundi 12 novembre 2012 - 15:25:44

Fichier

TALN08.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00614707, version 1

Collections

Citation

Benoît Sagot, Darja Fišer. Construction d'un wordnet libre du français à partir de ressources multilingues. TALN 2008 -Traitement Automatique des Langues Naturelles, Jun 2008, Avignon, France. 2008. 〈inria-00614707〉

Partager

Métriques

Consultations de la notice

409

Téléchargements de fichiers

757