Identifier les relations discursives implicites en combinant données naturelles et données artificielles

Chloé Braud 1 Pascal Denis 2
1 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing
Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7
2 MAGNET - Machine Learning in Information Networks
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe
Résumé : Cet article présente les premières expériences sur le français d'identification automatique des relations discursives implicites (i.e., non marquées par un connecteur). Nos systèmes exploitent des exemples implicites annotés, ainsi que des exemples implicites artificiels obtenus à partir d'exemples explicites par suppression du connecteur, une méthode introduite par Marcu et Echihabi (2002). Les précédentes études sur l'anglais montrent que l'utilisation à l'entraînement des données artificielles dégrade largement les performances sur les données naturelles, ce qui reflète des différences importantes en termes de distribution. Ce constat, qui tient aussi pour le français, nous a amenés à envisager différentes méthodes, inspirées de l'adaptation de domaine, visant à combiner plus efficacement les données. Nous évaluons ces méthodes sur le corpus ANNODIS : notre meilleur système obtient 41,7 % d'exactitude, soit un gain significatif de 4,4 % par rapport à un modèle n'utilisant que les données naturelles.
Type de document :
Article dans une revue
Traitement Automatique des Langues, Lavoisier (Hermes Science Publications), 2014, 55 (1), pp.31. 〈http://www.atala.org/-Volume-55-〉
Liste complète des métadonnées

Littérature citée [30 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01094346
Contributeur : Chloé Braud <>
Soumis le : vendredi 12 décembre 2014 - 10:40:00
Dernière modification le : mardi 17 avril 2018 - 11:24:19
Document(s) archivé(s) le : vendredi 13 mars 2015 - 10:31:16

Fichier

braud_denis_TAL55.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01094346, version 1

Citation

Chloé Braud, Pascal Denis. Identifier les relations discursives implicites en combinant données naturelles et données artificielles. Traitement Automatique des Langues, Lavoisier (Hermes Science Publications), 2014, 55 (1), pp.31. 〈http://www.atala.org/-Volume-55-〉. 〈hal-01094346〉

Partager

Métriques

Consultations de la notice

340

Téléchargements de fichiers

207