3543 articles – 5276 Notices  [english version]

hal-00683433, version 1

Leveraging study of robustness and portability of spoken language understanding systems across languages and domains: the PORTMEDIA corpora

Fabrice Lefevre 1, Djamel Mostefa a2, Laurent Besacier b3, Yannick Estève 4, Matthieu Quignard 5, Nathalie Camelin c4, Benoit Favre d6, Bassam Jabaian e13, Lina Maria Rojas Barahona (, http://www.loria.fr/~rojasbar/) 5

The International Conference on Language Resources and Evaluation (2012)

Résumé : The PORTMEDIA project is intended to develop new corpora for the evaluation of spoken language understanding systems. The newly collected data are in the field of human-machine dialogue systems for tourist information in French in line with the MEDIA corpus. Transcriptions and semantic annotations, obtained by low-cost procedures, are provided to allow a thorough evaluation of the systems' capabilities in terms of robustness and portability across languages and domains. A new test set with some adaptation data is prepared for each case: in Italian as an example of a new language, for ticket reservation as an example of a new domain. Finally the work is complemented by the proposition of a new high level semantic annotation scheme well-suited to dialogue data.

  • a –  Evaluation and Language resources Distribution Agency
  • b –  LIG, Grenoble, France
  • c –  LIUM
  • d –  LIF, Marseille, France
  • e –  LIG
  • 1 :  Laboratoire Informatique d'Avignon (LIA)
  • Université d'Avignon – Centre d'Enseignement et de Recherche en Informatique - CERI
  • 2 :  Evaluations and Language resources Distribution Agency (ELDA)
  • ELDA
  • 3 :  Laboratoire d'Informatique de Grenoble (LIG)
  • Université Joseph Fourier - Grenoble I – Institut polytechnique de Grenoble (Grenoble INP) – Université Pierre-Mendès-France - Grenoble II – CNRS : UMR5217
  • 4 :  Laboratoire d'Informatique de l'Université du Maine (LIUM)
  • Université du Maine : EA4023
  • 5 :  SYNALP (LORIA)
  • Université de Lorraine – CNRS : UMR7503 – INRIA
  • 6 :  Laboratoire d'informatique Fondamentale de Marseille (LIF)
  • CNRS : UMR6166 – Université de la Méditerranée - Aix-Marseille II – Université de Provence - Aix-Marseille I
  • Domaine : Informatique/Informatique et langage
  • Mots-clés : spoken language understanding system – human-machine dialogue corpus – portability
 
  • hal-00683433, version 1
  • oai:hal.inria.fr:hal-00683433
  • Contributeur : 
  • Soumis le : Mercredi 28 Mars 2012, 16:53:42
  • Dernière modification le : Mercredi 18 Avril 2012, 08:35:39