Fouille d'erreurs sur des sorties d'analyseurs syntaxiques

Résumé : Nous présentons une méthode de fouille d'erreurs pour détecter automatiquement des erreurs dans les ressources utilisées par les systèmes d'analyse syntaxique. Nous avons mis en œuvre cette méthode sur le résultat de l'analyse de plusieurs millions de mots par deux systèmes d'analyse différents qui ont toutefois en commun le lexique syntaxique et la chaîne de traitement présyntaxique. Nous pouvons ainsi identifier des inexactitudes et des incomplétudes dans les ressources utilisées. En particulier, la comparaison des résultats obtenus sur les sorties des deux analyseurs sur un même corpus nous permet d'isoler les problèmes issus des ressources partagées de ceux issus des grammaires.
Type de document :
Article dans une revue
Traitement Automatique des Langues, ATALA, 2008, 49 (1), pp.41-60
Liste complète des métadonnées

Littérature citée [14 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00515492
Contributeur : Benoît Sagot <>
Soumis le : mardi 7 septembre 2010 - 10:36:46
Dernière modification le : mardi 11 octobre 2016 - 14:41:48
Document(s) archivé(s) le : mercredi 8 décembre 2010 - 02:38:08

Fichier

TALem.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00515492, version 1

Collections

Citation

Benoît Sagot, Eric De La Clergerie. Fouille d'erreurs sur des sorties d'analyseurs syntaxiques. Traitement Automatique des Langues, ATALA, 2008, 49 (1), pp.41-60. 〈inria-00515492〉

Partager

Métriques

Consultations de la notice

191

Téléchargements de fichiers

117