Skip to Main content Skip to Navigation
Theses

Event detection and analysis on short text messages

Résumé : Les réseaux sociaux ont transformé le Web d'un mode lecture, où les utilisateurs pouvaient seulement consommer les informations, à un mode interactif leur permettant de les créer, partager et commenter. Un défi majeur du traitement d'information dans les médias sociaux est lié à la taille réduite des contenus, leur nature informelle et le manque d'informations contextuelles. D'un autre côté, le web contient des bases de connaissances structurées à partir de concepts d'ontologies, utilisables pour enrichir ces contenus. Cette thèse explore le potentiel d'utiliser les bases de connaissances du Web de données, afin de détecter, classifier et suivre des événements dans les médias sociaux, particulièrement Twitter. On a abordé 3 questions de recherche: i)Comment extraire et classifier les messages qui rapportent des événements? ii)Comment identifier des événements précis? iii)Étant donné un événement, comment construire un fil d'actualité représentant les différents sous-événements? Les travaux de la thèse ont contribué à élaborer des méthodes pour la généralisation des entités nommées par des concepts d'ontologies pour mitiger le sur-apprentissage dans les modèles supervisés; une adaptation de la théorie des graphes pour modéliser les relations entre les entités et les autres termes et ainsi caractériser des événements pertinents; l'utilisation des ontologies de domaines et les bases de connaissances dédiées, pour modéliser les relations entre les caractéristiques et les acteurs des événements. Nous démontrons que l'enrichissement sémantique des entités par des informations du Web de données améliore la performance des modèles d'apprentissages supervisés et non supervisés.
Complete list of metadatas

Cited literature [139 references]  Display  Hide  Download

https://hal.inria.fr/tel-01680769
Contributor : Amosse Edouard <>
Submitted on : Thursday, January 11, 2018 - 10:03:43 AM
Last modification on : Tuesday, May 26, 2020 - 6:50:56 PM

File

Edouard_Thesis.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-01680769, version 1

Collections

Citation

Amosse Edouard. Event detection and analysis on short text messages. Data Structures and Algorithms [cs.DS]. Université Côte D'Azur, 2017. English. ⟨tel-01680769⟩

Share

Metrics

Record views

308

Files downloads

605