Skip to Main content Skip to Navigation
Theses

Temporal and semantic analysis of richly typed social networks from user-generated content sites on the web

Zide Meng 1
1 WIMMICS - Web-Instrumented Man-Machine Interactions, Communities and Semantics
CRISAM - Inria Sophia Antipolis - Méditerranée , Laboratoire I3S - SPARKS - Scalable and Pervasive softwARe and Knowledge Systems
Résumé : Nous proposons une approche pour détecter les sujets, les communautés d'intérêt non disjointes,l'expertise, les tendances et les activités dans des sites où le contenu est généré par les utilisateurs et enparticulier dans des forums de questions-réponses tels que StackOverFlow. Nous décrivons d'abordQASM (Questions & Réponses dans des médias sociaux), un système basé sur l'analyse de réseauxsociaux pour gérer les deux principales ressources d’un site de questions-réponses: les utilisateurs et lecontenu. Nous présentons également le vocabulaire QASM utilisé pour formaliser à la fois le niveaud'intérêt et l'expertise des utilisateurs. Nous proposons ensuite une approche efficace pour détecter lescommunautés d'intérêts. Elle repose sur une autre méthode pour enrichir les questions avec un tag plusgénéral en cas de besoin. Nous comparons trois méthodes de détection sur un jeu de données extrait dusite populaire StackOverflow. Notre méthode basée sur le se révèle être beaucoup plus simple et plusrapide, tout en préservant la qualité de la détection. Nous proposons en complément une méthode pourgénérer automatiquement un label pour un sujet détecté en analysant le sens et les liens de ses mots-clefs.Nous menons alors une étude pour comparer différents algorithmes pour générer ce label. Enfin, nousétendons notre modèle de graphes probabilistes pour modéliser conjointement les sujets, l'expertise, lesactivités et les tendances. Nous le validons sur des données du monde réel pour confirmer l'efficacité denotre modèle intégrant les comportements des utilisateurs et la dynamique des sujets
Document type :
Theses
Complete list of metadatas

Cited literature [61 references]  Display  Hide  Download

https://hal.inria.fr/tel-01402612
Contributor : Abes Star :  Contact
Submitted on : Thursday, February 9, 2017 - 10:45:07 AM
Last modification on : Tuesday, May 26, 2020 - 6:50:41 PM
Document(s) archivé(s) le : Wednesday, May 10, 2017 - 1:16:01 PM

File

2016AZUR4090.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01402612, version 3

Collections

Citation

Zide Meng. Temporal and semantic analysis of richly typed social networks from user-generated content sites on the web. Other [cs.OH]. Université Côte d'Azur, 2016. English. ⟨NNT : 2016AZUR4090⟩. ⟨tel-01402612v3⟩

Share

Metrics

Record views

1138

Files downloads

600