Fouille d'erreurs sur des sorties d'analyseurs syntaxiques - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2008

Fouille d'erreurs sur des sorties d'analyseurs syntaxiques

Résumé

Nous présentons une méthode de fouille d'erreurs pour détecter automatiquement des erreurs dans les ressources utilisées par les systèmes d'analyse syntaxique. Nous avons mis en œuvre cette méthode sur le résultat de l'analyse de plusieurs millions de mots par deux systèmes d'analyse différents qui ont toutefois en commun le lexique syntaxique et la chaîne de traitement présyntaxique. Nous pouvons ainsi identifier des inexactitudes et des incomplétudes dans les ressources utilisées. En particulier, la comparaison des résultats obtenus sur les sorties des deux analyseurs sur un même corpus nous permet d'isoler les problèmes issus des ressources partagées de ceux issus des grammaires.
Fichier principal
Vignette du fichier
TALem.pdf (263.27 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00515492 , version 1 (07-09-2010)

Identifiants

  • HAL Id : inria-00515492 , version 1

Citer

Benoît Sagot, Éric Villemonte de La Clergerie. Fouille d'erreurs sur des sorties d'analyseurs syntaxiques. Revue TAL : traitement automatique des langues, 2008, 49 (1), pp.41-60. ⟨inria-00515492⟩
135 Consultations
107 Téléchargements

Partager

Gmail Facebook X LinkedIn More