Make text look like speech: disfluency generation using sequence-to-sequence neural networks Domain

Henri Lasselin 1
1 EXPRESSION - Expressiveness in Human Centered Data/Media
UBS - Université de Bretagne Sud, IRISA-D6 - MEDIA ET INTERACTIONS
Résumé : La synthèse de discours spontanés naturels est un défi à relever. Une manière de s'en approcher est de produire des discours disfluents. Dans ce document, nous présentons le travail réalisé lors d'un stage de master. Nous expérimentons plusieurs modèles neuronaux séquence-à-séquence ayant pour but de transformer un texte fluide en texte disfluent. Nous proposons également plusieurs métriques évaluant cette tâche. Les résultats obtenus tendent à montrer que cette tâche n'est pas aisée pour des modèles neuronaux.
Complete list of metadatas

Cited literature [26 references]  Display  Hide  Download

https://hal.inria.fr/hal-02002541
Contributor : Gwénolé Lecorvé <>
Submitted on : Thursday, January 31, 2019 - 5:19:54 PM
Last modification on : Saturday, February 2, 2019 - 1:22:14 AM
Long-term archiving on : Wednesday, May 1, 2019 - 8:07:55 PM

File

rapport_de_stage.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-02002541, version 1

Citation

Henri Lasselin. Make text look like speech: disfluency generation using sequence-to-sequence neural networks Domain. Intelligence artificielle [cs.AI]. 2018. ⟨hal-02002541⟩

Share

Metrics

Record views

60

Files downloads

38