Annotations de particules de discours en français sur une large variété de corpus - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Annotation of discourse particles in French over a large variety of speech corpora

Annotations de particules de discours en français sur une large variété de corpus

Résumé

In French, some words and expressions are frequently used as discourse particles in spoken language, especially in spontaneous speech. As the semantic meaning of such words differ whether they are used as discourse particles or not, the correct identification of their discourse function is of great importance. To study such discourse particles, as well as their prosodic correlates, a large variety of speech corpora exhibiting various degrees of spontaneity are considered. They range from prepared speech (e.g., storytelling and broadcast news) to spontaneous speech (e.g., interviews and interactions between people). This paper presents the speech corpora considered, the selection of word occurrences, the annotation of their discourse particle function, the computed prosodic features, as well as the frequency of usage of a few selected words as discourse particle on the various corpora.
En français, certains mots et expressions sont fréquemment utilisés en tant que particules de discours dans le langage parlé, en particulier en parole spontanée. Comme la signification sémantique de tels mots varie selon qu'ils sont utilisés en tant que particule de discours ou non, l'identification correcte de leur fonction discursive est importante. Pour étudier les particules de discours, ainsi que leurs corrélats prosodiques, une large variété de corpus de parole correspondant à différents degrés de spontanéité sont considérés. Cela va de la parole préparée (e.g., contes et journaux d'information radiodiffusés) à la parole spontanée (e.g., interviews et interactions entre personnes). Ce papier présente les corpus considérés, la sélection d'occurrences des mots, l'annotation de leur fonction discursive, les paramètres prosodiques calculés, ainsi que la fréquence d'utilisation de quelques mots en tant que particule de discours sur les divers corpus.
Fichier principal
Vignette du fichier
ParticulesDeDiscours-v1.2-uploaded-02juin2017.pdf (726.58 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01585540 , version 1 (11-09-2017)

Identifiants

  • HAL Id : hal-01585540 , version 1

Citer

Katarina Bartkova, Mathilde Dargnat, Denis Jouvet, Lou Lee. Annotations de particules de discours en français sur une large variété de corpus . ACor4French - Les corpus annotés du français, TALN'2017 - Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France. ⟨hal-01585540⟩
293 Consultations
452 Téléchargements

Partager

Gmail Facebook X LinkedIn More