Construction d'un wordnet libre du français à partir de ressources multilingues - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Construction d'un wordnet libre du français à partir de ressources multilingues

Résumé

Cet article décrit la construction d'un Wordnet Libre du Français (WOLF) à partir du Princeton WordNet et de diverses ressources multilingues. Les lexèmes polysémiques ont été traités au moyen d'une approche reposant sur l'alignement en mots d'un corpus parallèle en cinq langues. Le lexique multilingue extrait a été désambiguïsé sémantiquement à l'aide des wordnets des langues concernées. Par ailleurs, une approche bilingue a été suffisante pour construire de nouvelles entrées à partir des lexèmes monosémiques. Nous avons pour cela extrait des lexiques bilingues à partir de Wikipédia et de thésaurus. Le wordnet obtenu a été évalué par rapport au wordnet français issu du projet EuroWordNet. Les résultats sont encourageants, et des applications sont d'ores et déjà envisagées.
Fichier principal
Vignette du fichier
TALN08.pdf (95.92 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00614707 , version 1 (15-08-2011)

Identifiants

  • HAL Id : inria-00614707 , version 1

Citer

Benoît Sagot, Darja Fišer. Construction d'un wordnet libre du français à partir de ressources multilingues. TALN 2008 -Traitement Automatique des Langues Naturelles, Jun 2008, Avignon, France. ⟨inria-00614707⟩
322 Consultations
1645 Téléchargements

Partager

Gmail Facebook X LinkedIn More