Mining Documents and Sentiments in Cross-lingual Context

Résumé : L’objectif de cette thèse est d’étudier les sentiments dans les documents comparables. Premièrement, nous avons recueillis des corpus comparables en anglais, français et arabe de Wikipédia et d’Euronews, et nous avons aligné ces corpus au niveau document. Nous avons en plus collecté des documents d’informations des agences de presse locales et étrangères dans les langues anglaise et arabe. Les documents en anglais ont été recueillis du site de la BBC, ceux en arabe du site d’Al-Jazzera. Deuxièmement, nous avons présenté une mesure de similarité cross-linguistique des documents dans le but de récupérer et aligner automatiquement les documents comparables. Ensuite, nous avons proposé une méthode d’annotation cross-linguistique en termes de sentiments, afin d’étiqueter les documents source et cible avec des sentiments. Enfin, nous avons utilisé des mesures statistiques pour comparer l’accord des sentiments entre les documents comparables source et cible. Les méthodes présentées dans cette thèse ne dépendent pas d’une paire de langue bien déterminée, elles peuvent être appliquées sur toute autre couple de langue
Type de document :
Thèse
Other [cs.OH]. Université de Lorraine, 2015. English. 〈NNT : 2015LORR0003〉
Liste complète des métadonnées

Littérature citée [54 références]  Voir  Masquer  Télécharger

https://hal.univ-lorraine.fr/tel-01751251
Contributeur : Thèses Ul <>
Soumis le : jeudi 29 mars 2018 - 13:13:01
Dernière modification le : mercredi 16 mai 2018 - 15:15:34

Fichier

DDOC_T_2015_0003_SAAD.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01751251, version 1

Citation

Motaz Saad. Mining Documents and Sentiments in Cross-lingual Context. Other [cs.OH]. Université de Lorraine, 2015. English. 〈NNT : 2015LORR0003〉. 〈tel-01751251v1〉

Partager

Métriques

Consultations de la notice

11

Téléchargements de fichiers

7