Améliorer un lexique syntaxique à l'aide des tables du lexique-grammaire — Constructions impersonnelles et expressions verbales figées - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Article Dans Une Revue Cahiers du Cental Année : 2008

Améliorer un lexique syntaxique à l'aide des tables du lexique-grammaire — Constructions impersonnelles et expressions verbales figées

Résumé

We intend to develop a large-coverage morphological and syntactic lexicon for French which can be directly used in Natural Langage Processing (NLP) applications, in particular in those involving deep parsing, regardless of the underlying grammatical framework. This lexicon, named Lefff (Lexique des Formes Fléchies du Français — Lexicon of French inFlected Forms), has been under development since 2004. At the beginning, this lexicon contained only verbal morphological information, mostly automatically induced from corpora. It now covers all parts of speech, and is progressively enriched with syntactic information. In this paper, we show how we used the lexicon-grammar tables, whose development has been initiated by M. Gross, to enrich the Lefff. These tables are a valuable starting point. However, it is necessary to achieve both a linguistic and formal modeling work, in order to exploit their content in a NLP lexicon such as the Lefff. We illustrate this approach on two kinds of non-standard verbal and adjectival entries : impersonal structures and verbal idiomatic expressions.
Nous avons le projet de développer un lexique morphologique et syntaxique du français à large couverture qui soit directement utilisable dans des applications de Traitement Automatique du Langage (TAL), en particulier celles nécessitant une analyse syntaxique profonde, et ce, quel que soit le cadre théorique utilisé. Ce lexique, baptisé Lefff (Lexique des Formes Fléchies du Français), est en cours de développement depuis 2004. Au départ, ce lexique ne comportait que des informations morphologiques verbales, principalement induites automatiquement à partir de corpus. Il couvre maintenant toutes les catégories, et est progressivement enrichi d'informations syntaxiques. Nous montrons ici comment nous l'avons enrichi à partir des tables du lexique-grammaire, initialement développées autour de M. Gross. Celles-ci constituent un point de départ d'une valeur inestimable. Il est néanmoins nécessaire de procéder à un double travail de linguistique et de modélisation, afin d'exploiter leur contenu dans un lexique TAL tel que le Lefff. Nous illustrons cette approche sur deux types d'entrées verbales et adjectivales non standard : les constructions impersonnelles et les expressions verbales figées.
Fichier principal
Vignette du fichier
CCental-SagotDanlos06.pdf (522.85 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00515460 , version 1 (07-09-2010)

Identifiants

  • HAL Id : inria-00515460 , version 1

Citer

Benoît Sagot, Laurence Danlos. Améliorer un lexique syntaxique à l'aide des tables du lexique-grammaire — Constructions impersonnelles et expressions verbales figées. Cahiers du Cental, 2008, Description linguistique pour le traitement automatique du français, 5, pp.107-126. ⟨inria-00515460⟩
264 Consultations
564 Téléchargements

Partager

Gmail Facebook X LinkedIn More