Skip to Main content Skip to Navigation
Theses

Temporal and semantic analysis of richly typed social networks from user-generated content sites on the Web

Zide Meng 1
1 WIMMICS - Web-Instrumented Man-Machine Interactions, Communities and Semantics
CRISAM - Inria Sophia Antipolis - Méditerranée , Laboratoire I3S - SPARKS - Scalable and Pervasive softwARe and Knowledge Systems
Résumé : Nous proposons une approche pour détecter les sujets, les communautés d'intérêt non disjointes, l'expertise, les tendances et les activités dans des sites où le contenu est généré par les utilisateurs et en particulier dans des forums de questions-réponses tels que StackOverFlow. Nous décrivons d'abord QASM (Questions & Réponses dans des médias sociaux), un système basé sur l'analyse de réseaux sociaux pour gérer les deux principales ressources d’un site de questions-réponses: les utilisateurs et le contenu. Nous présentons également le vocabulaire QASM utilisé pour formaliser à la fois le niveau d'intérêt et l'expertise des utilisateurs. Nous proposons ensuite une approche efficace pour détecter les communautés d'intérêts. Elle repose sur une autre méthode pour enrichir les questions avec un tag plus général en cas de besoin. Nous comparons trois méthodes de détection sur un jeu de données extrait du site populaire StackOverflow. Notre méthode basée sur le se révèle être beaucoup plus simple et plus rapide, tout en préservant la qualité de la détection. Nous proposons en complément une méthode pour générer automatiquement un label pour un sujet détecté en analysant le sens et les liens de ses mots-clefs. Nous menons alors une étude pour comparer différents algorithmes pour générer ce label. Enfin, nous étendons notre modèle de graphes probabilistes pour modéliser conjointement les sujets, l'expertise, les activités et les tendances. Nous le validons sur des données du monde réel pour confirmer l'efficacité de notre modèle intégrant les comportements des utilisateurs et la dynamique des sujets.
Complete list of metadatas

https://hal.inria.fr/tel-01402612
Contributor : Zide Meng <>
Submitted on : Sunday, December 4, 2016 - 8:40:13 PM
Last modification on : Tuesday, May 26, 2020 - 6:50:41 PM
Document(s) archivé(s) le : Tuesday, March 21, 2017 - 6:20:00 AM

Identifiers

  • HAL Id : tel-01402612, version 1

Citation

Zide Meng. Temporal and semantic analysis of richly typed social networks from user-generated content sites on the Web. Computer Science [cs]. Université Nice Sophia Antipolis [UNS], 2016. English. ⟨tel-01402612v1⟩

Share

Metrics

Record views

217

Files downloads

428