Annotations de particules de discours en français sur une large variété de corpus

Katarina Bartkova 1 Mathilde Dargnat 1 Denis Jouvet 2 Lou Lee 1
2 MULTISPEECH - Speech Modeling for Facilitating Oral-Based Communication
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : En français, certains mots et expressions sont fréquemment utilisés en tant que particules de discours dans le langage parlé, en particulier en parole spontanée. Comme la signification sémantique de tels mots varie selon qu'ils sont utilisés en tant que particule de discours ou non, l'identification correcte de leur fonction discursive est importante. Pour étudier les particules de discours, ainsi que leurs corrélats prosodiques, une large variété de corpus de parole correspondant à différents degrés de spontanéité sont considérés. Cela va de la parole préparée (e.g., contes et journaux d'information radiodiffusés) à la parole spontanée (e.g., interviews et interactions entre personnes). Ce papier présente les corpus considérés, la sélection d'occurrences des mots, l'annotation de leur fonction discursive, les paramètres prosodiques calculés, ainsi que la fréquence d'utilisation de quelques mots en tant que particule de discours sur les divers corpus.
Type de document :
Communication dans un congrès
ACor4French - Les corpus annotés du français, TALN'2017 - Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France. 2017
Liste complète des métadonnées

Littérature citée [33 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01585540
Contributeur : Denis Jouvet <>
Soumis le : lundi 11 septembre 2017 - 16:07:25
Dernière modification le : jeudi 11 janvier 2018 - 06:27:31

Fichier

ParticulesDeDiscours-v1.2-uplo...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01585540, version 1

Citation

Katarina Bartkova, Mathilde Dargnat, Denis Jouvet, Lou Lee. Annotations de particules de discours en français sur une large variété de corpus . ACor4French - Les corpus annotés du français, TALN'2017 - Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France. 2017. 〈hal-01585540〉

Partager

Métriques

Consultations de la notice

197

Téléchargements de fichiers

54