Améliorer un lexique syntaxique à l'aide des tables du lexique-grammaire — Constructions impersonnelles et expressions verbales figées

Benoît Sagot 1 Laurence Danlos 2
1 SIGNES - Linguistic signs, grammar and meaning: computational logic for natural language
INRIA Futurs, Université Sciences et Technologies - Bordeaux 1, École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB), Université Bordeaux Montaigne, CNRS - Centre National de la Recherche Scientifique : UMR5800
Résumé : Nous avons le projet de développer un lexique morphologique et syntaxique du français à large couverture qui soit directement utilisable dans des applications de Traitement Automatique du Langage (TAL), en particulier celles nécessitant une analyse syntaxique profonde, et ce, quel que soit le cadre théorique utilisé. Ce lexique, baptisé Lefff (Lexique des Formes Fléchies du Français), est en cours de développement depuis 2004. Au départ, ce lexique ne comportait que des informations morphologiques verbales, principalement induites automatiquement à partir de corpus. Il couvre maintenant toutes les catégories, et est progressivement enrichi d'informations syntaxiques. Nous montrons ici comment nous l'avons enrichi à partir des tables du lexique-grammaire, initialement développées autour de M. Gross. Celles-ci constituent un point de départ d'une valeur inestimable. Il est néanmoins nécessaire de procéder à un double travail de linguistique et de modélisation, afin d'exploiter leur contenu dans un lexique TAL tel que le Lefff. Nous illustrons cette approche sur deux types d'entrées verbales et adjectivales non standard : les constructions impersonnelles et les expressions verbales figées.
Type de document :
Article dans une revue
Cahiers du Cental, Presses universitaires de Louvain, 2008, Description linguistique pour le traitement automatique du français, 5, pp.107-126
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00515460
Contributeur : Benoît Sagot <>
Soumis le : mardi 7 septembre 2010 - 09:10:32
Dernière modification le : jeudi 11 janvier 2018 - 06:19:48
Document(s) archivé(s) le : mercredi 8 décembre 2010 - 02:34:05

Fichier

CCental-SagotDanlos06.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00515460, version 1

Citation

Benoît Sagot, Laurence Danlos. Améliorer un lexique syntaxique à l'aide des tables du lexique-grammaire — Constructions impersonnelles et expressions verbales figées. Cahiers du Cental, Presses universitaires de Louvain, 2008, Description linguistique pour le traitement automatique du français, 5, pp.107-126. 〈inria-00515460〉

Partager

Métriques

Consultations de la notice

329

Téléchargements de fichiers

364