Mining Documents and Sentiments in Cross-lingual Context

Motaz Saad 1
1 SMarT - Statistical Machine Translation and Speech Modelization and Text
LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : L'objectif de cette thèse est d'étudier les sentiments dans les documents comparables. Premièr\-ement, nous avons recueillis des corpus comparables en anglais, français et arabe de Wikipédia et d’Euronews, et nous avons aligné ces corpus au niveau document. Nous avons en plus collecté des documents d’informations des agences de presse locales et étrangères dans les langues anglaise et arabe. Les documents en anglais ont été recueillis du site de la BBC, ceux en arabe du site d’Al-Jazzera. Deuxièmement, nous avons présenté une mesure de similarité coss-linguistique des documents dans le but de récupérer et aligner automatiquement les documents comparables. Ensuite, nous avons proposé une méthode d’annotation cross-linguistique en termes de sentiments, afin d’étiqueter les documents source et cible avec des sentiments. Enfin, nous avons utilisé des mesures statistiques pour comparer l'accord des sentiments entre les documents comparables source et cible. Les méthodes présentées dans cette thèse ne dépendent pas d’une paire de langue bien déterminée, elles peuvent être appliquées sur toute autre couple de langue.
Type de document :
Thèse
Document and Text Processing. Université de Lorraine, 2015. English
Liste complète des métadonnées

https://hal.inria.fr/tel-01116858
Contributeur : Motaz Saad <>
Soumis le : dimanche 15 février 2015 - 17:17:42
Dernière modification le : jeudi 22 septembre 2016 - 14:32:57
Document(s) archivé(s) le : jeudi 28 mai 2015 - 15:10:49

Fichier

Identifiants

  • HAL Id : tel-01116858, version 1

Collections

Citation

Motaz Saad. Mining Documents and Sentiments in Cross-lingual Context. Document and Text Processing. Université de Lorraine, 2015. English. <tel-01116858>

Partager

Métriques

Consultations de
la notice

369

Téléchargements du document

353