Event detection and analysis on short text messages

Résumé : Les réseaux sociaux ont transformé le Web d'un mode lecture, où les utilisateurs pouvaient seulement consommer les informations, à un mode interactif leur permettant de les créer, partager et commenter. Un défi majeur du traitement d'information dans les médias sociaux est lié à la taille réduite des contenus, leur nature informelle et le manque d'informations contextuelles. D'un autre côté, le web contient des bases de connaissances structurées à partir de concepts d'ontologies, utilisables pour enrichir ces contenus. Cette thèse explore le potentiel d'utiliser les bases de connaissances du Web de données, afin de détecter, classifier et suivre des événements dans les médias sociaux, particulièrement Twitter. On a abordé 3 questions de recherche: i)Comment extraire et classifier les messages qui rapportent des événements? ii)Comment identifier des événements précis? iii)Étant donné un événement, comment construire un fil d'actualité représentant les différents sous-événements? Les travaux de la thèse ont contribué à élaborer des méthodes pour la généralisation des entités nommées par des concepts d'ontologies pour mitiger le sur-apprentissage dans les modèles supervisés; une adaptation de la théorie des graphes pour modéliser les relations entre les entités et les autres termes et ainsi caractériser des événements pertinents; l'utilisation des ontologies de domaines et les bases de connaissances dédiées, pour modéliser les relations entre les caractéristiques et les acteurs des événements. Nous démontrons que l'enrichissement sémantique des entités par des informations du Web de données améliore la performance des modèles d'apprentissages supervisés et non supervisés.
Type de document :
Thèse
Data Structures and Algorithms [cs.DS]. Université Côte D'Azur, 2017. English
Liste complète des métadonnées

Littérature citée [139 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01680769
Contributeur : Amosse Edouard <>
Soumis le : jeudi 11 janvier 2018 - 10:03:43
Dernière modification le : mercredi 31 janvier 2018 - 10:24:06

Fichier

Edouard_Thesis.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01680769, version 1

Collections

Citation

Amosse Edouard. Event detection and analysis on short text messages. Data Structures and Algorithms [cs.DS]. Université Côte D'Azur, 2017. English. 〈tel-01680769〉

Partager

Métriques

Consultations de la notice

145

Téléchargements de fichiers

129