Tâches Auxiliaires Multilingues pour le Transfert de Modèles de Détection de Discours Haineux - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Tâches Auxiliaires Multilingues pour le Transfert de Modèles de Détection de Discours Haineux

Résumé

La tâche de détection de contenus haineux est ardue, car elle nécessite des connaissances culturelles et contextuelles approfondies ; les connaissances nécessaires varient, entre autres, selon la langue du locateur ou la cible du contenu. Or, des données annotées pour des domaines et des langues spécifiques sont souvent absentes ou limitées. C’est là que les données dans d’autres langues peuvent être exploitées ; mais du fait de ces variations, le transfert cross-lingue est souvent difficile. Dans cet article, nous mettons en évidence cette limitation pour plusieurs domaines et langues et montrons l’impact positif de l’apprentissage de tâches auxiliaires multilingues - analyse de sentiments, reconnaissance des entités nommées et tâches reposant sur des informations morpho-syntaxiques - sur le transfert cross-lingue zéro-shot des modèles de détection de discours haineux, afin de combler ce fossé culturel.
Fichier principal
Vignette du fichier
9906.pdf (138.47 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03701522 , version 1 (24-06-2022)

Identifiants

  • HAL Id : hal-03701522 , version 1

Citer

Arij Riabi, Syrielle Montariol, Djamé Seddah. Tâches Auxiliaires Multilingues pour le Transfert de Modèles de Détection de Discours Haineux. Traitement Automatique des Langues Naturelles, Jun 2022, Avignon, France. pp.413-423. ⟨hal-03701522⟩
107 Consultations
31 Téléchargements

Partager

Gmail Facebook X LinkedIn More