Analysing Data-To-Text Generation Benchmarks

Abstract : A generation system can only be as good as the data it is trained on. In this short paper , we propose a methodology for analysing data-to-text corpora used for training micro-planner i.e., systems which given some input must produce a text verbalising exactly this input. We apply this methodology to three existing benchmarks and we elicite a set of criteria for the creation of a data-to-text benchmark which could help better support the development , evaluation and comparison of linguistically sophisticated data-to-text generators.
Type de document :
Communication dans un congrès
The 10th International Natural Language Generation conference., Sep 2017, Santiago de Compostelle, Spain
Liste complète des métadonnées

Littérature citée [14 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01623832
Contributeur : Claire Gardent <>
Soumis le : mercredi 25 octobre 2017 - 17:01:35
Dernière modification le : mardi 24 avril 2018 - 13:30:47
Document(s) archivé(s) le : vendredi 26 janvier 2018 - 15:13:02

Fichier

d2tDatasetAnalysis.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01623832, version 1

Citation

Laura Perez-Beltrachini, Claire Gardent. Analysing Data-To-Text Generation Benchmarks. The 10th International Natural Language Generation conference., Sep 2017, Santiago de Compostelle, Spain. 〈hal-01623832〉

Partager

Métriques

Consultations de la notice

117

Téléchargements de fichiers

17