Coopération de méthodes statistiques et symboliques pour l'adaptation non-supervisée d'un système d'étiquetage en entités nommées

Résumé : La détection et le typage des entités nommées sont des tâches pour lesquelles ont étéd éveloppés à la fois des systèmes symboliques et probabilistes. Nous présentons les résultats d'une expérience visant à faire interagir le système à base de règles NP, développé sur des corpus provenant de l'AFP, intégrant la base d'entités Aleda et qui a une bonne précision, et le système LIANE, entraîné sur des transcriptions de l'oral provenant du corpus ESTER et qui a un bon rappel. Nous montrons qu'on peut adapter à un nouveau type de corpus, de manière non supervisée, un système probabiliste tel que LIANE grâce à des corpus volumineux annotés automatiquement par NP. Cette adaptation ne nécessite aucune annotation manuelle supplémentaire et illustre la complémentarité des méthodes numériques et symboliques pour la résolution de tâches linguistiques.
Type de document :
Communication dans un congrès
TALN'2011 - Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France. 2011
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00617068
Contributeur : Benoît Sagot <>
Soumis le : jeudi 25 août 2011 - 22:40:32
Dernière modification le : samedi 9 juin 2018 - 10:30:06
Document(s) archivé(s) le : dimanche 4 décembre 2016 - 18:21:52

Fichier

taln11entnom.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00617068, version 1

Collections

Citation

Frédéric Béchet, Benoît Sagot, Rosa Stern. Coopération de méthodes statistiques et symboliques pour l'adaptation non-supervisée d'un système d'étiquetage en entités nommées. TALN'2011 - Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France. 2011. 〈inria-00617068〉

Partager

Métriques

Consultations de la notice

587

Téléchargements de fichiers

623