Construction d'un wordnet libre du français à partir de ressources multilingues - Inria - Institut national de recherche en sciences et technologies du numérique Access content directly
Conference Papers Year : 2008

Construction d'un wordnet libre du français à partir de ressources multilingues

Abstract

Cet article décrit la construction d'un Wordnet Libre du Français (WOLF) à partir du Princeton WordNet et de diverses ressources multilingues. Les lexèmes polysémiques ont été traités au moyen d'une approche reposant sur l'alignement en mots d'un corpus parallèle en cinq langues. Le lexique multilingue extrait a été désambiguïsé sémantiquement à l'aide des wordnets des langues concernées. Par ailleurs, une approche bilingue a été suffisante pour construire de nouvelles entrées à partir des lexèmes monosémiques. Nous avons pour cela extrait des lexiques bilingues à partir de Wikipédia et de thésaurus. Le wordnet obtenu a été évalué par rapport au wordnet français issu du projet EuroWordNet. Les résultats sont encourageants, et des applications sont d'ores et déjà envisagées.
Fichier principal
Vignette du fichier
TALN08.pdf (95.92 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

inria-00614707 , version 1 (15-08-2011)

Identifiers

  • HAL Id : inria-00614707 , version 1

Cite

Benoît Sagot, Darja Fišer. Construction d'un wordnet libre du français à partir de ressources multilingues. TALN 2008 -Traitement Automatique des Langues Naturelles, Jun 2008, Avignon, France. ⟨inria-00614707⟩
323 View
1661 Download

Share

Gmail Facebook X LinkedIn More