Conception itérative et semi-supervisée d'assistants conversationnels par regroupement interactif des questions - Archive ouverte HAL Access content directly
Conference Papers Year :

Conception itérative et semi-supervisée d'assistants conversationnels par regroupement interactif des questions

(1, 2) , (1) , (2) , (1)
1
2

Abstract

The design of a dataset needed to train a chatbot is most often the result of manual and tedious step. To guarantee the efficiency and objectivity of the annotation, we propose an active learning method based on constraints annotation. It’s an iterative approach, relying on a clustering algorithm to segment data and using annotator knowledge to lead clustering from unlabeled question to relevant intents structure. In this paper, we study the optimal modeling parameters to get an exploitable dataset with a minimum of annotations, and show that this approach allows to make a coherent structure for the training of a chatbot.
La création d’un jeu de données pour l’entrainement d’un chatbot repose sur un a priori de connaissance du domaine. En conséquence, cette étape est le plus souvent manuelle, fastidieuse et soumise aux biais. Pour garantir l’efficacité et l’objectivité de l’annotation, nous proposons une méthodologie d’apprentissage actif par annotation de contraintes. Il s’agit d’une approche itérative, reposant sur un algorithme de clustering pour segmenter les données et tirant parti de la connaissance de l’annotateur pour guider le regroupement des questions en une structure d’intentions. Dans cet article, nous étudions les paramètres optimaux de modélisation pour réaliser une segmentation exploitable en un minimum d’annotations, et montrons que cette approche permet d’aboutir à une structure cohérente pour l’entrainement d’un assistant conversationnel.
Fichier principal
Vignette du fichier
Schild et al. - 2021 - Conception itérative et semi-supervisée d’assistants conversationnels.pdf (267.73 Ko) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-03133007 , version 1 (05-02-2021)

Identifiers

  • HAL Id : hal-03133007 , version 1

Cite

Erwan Schild, Gautier Durantin, Jean-Charles Lamirel, Florian Miconi. Conception itérative et semi-supervisée d'assistants conversationnels par regroupement interactif des questions. EGC 2021 - 21èmes Journées Francophones Extraction et Gestion des Connaissances, Association EGC, Jan 2021, Montpellier / Virtual, France. ⟨hal-03133007⟩
135 View
86 Download

Share

Gmail Facebook Twitter LinkedIn More