Traitement des inconnus : une approche systématique de l'incomplétude lexicale

Résumé : Cet article aborde le phénomène de l'incomplétude des ressources lexicales, c'est-à-dire la problématique des inconnus, dans un contexte de traitement automatique. Nous proposons tout d'abord une définition opérationnelle de la notion d'inconnu. Nous décrivons ensuite une typologie des différentes classes d'inconnus, motivée par des considérations linguistiques et applicatives ainsi que par l'annotation des inconnus d'un petit corpus selon notre typologie. Cette typologie sera mise en œuvre et validée par l'annotation d'un corpus important de l'Agence France-Presse dans le cadre du projet EDyLex.
Document type :
Conference papers
Complete list of metadatas

Cited literature [7 references]  Display  Hide  Download

https://hal.inria.fr/inria-00521237
Contributor : Benoît Sagot <>
Submitted on : Sunday, September 26, 2010 - 10:25:16 PM
Last modification on : Thursday, August 29, 2019 - 2:24:09 PM
Long-term archiving on : Monday, December 27, 2010 - 2:43:46 AM

File

TALN10uwtypo.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00521237, version 1

Collections

Citation

Helena Blancafort San José, Gaëlle Recourcé, Javier Couto, Benoît Sagot, Rosa Stern, et al.. Traitement des inconnus : une approche systématique de l'incomplétude lexicale. Traitement Automatique des Langues Naturelles : TALN 2010, Jul 2010, Montréal, Canada. ⟨inria-00521237⟩

Share

Metrics

Record views

229

Files downloads

149