Temporal and semantic analysis of richly typed social networks from user-generated content sites on the web

Zide Meng 1
1 WIMMICS - Web-Instrumented Man-Machine Interactions, Communities and Semantics
CRISAM - Inria Sophia Antipolis - Méditerranée , SPARKS - Scalable and Pervasive softwARe and Knowledge Systems
Résumé : Nous proposons une approche pour détecter les sujets, les communautés d'intérêt non disjointes,l'expertise, les tendances et les activités dans des sites où le contenu est généré par les utilisateurs et enparticulier dans des forums de questions-réponses tels que StackOverFlow. Nous décrivons d'abordQASM (Questions & Réponses dans des médias sociaux), un système basé sur l'analyse de réseauxsociaux pour gérer les deux principales ressources d’un site de questions-réponses: les utilisateurs et lecontenu. Nous présentons également le vocabulaire QASM utilisé pour formaliser à la fois le niveaud'intérêt et l'expertise des utilisateurs. Nous proposons ensuite une approche efficace pour détecter lescommunautés d'intérêts. Elle repose sur une autre méthode pour enrichir les questions avec un tag plusgénéral en cas de besoin. Nous comparons trois méthodes de détection sur un jeu de données extrait dusite populaire StackOverflow. Notre méthode basée sur le se révèle être beaucoup plus simple et plusrapide, tout en préservant la qualité de la détection. Nous proposons en complément une méthode pourgénérer automatiquement un label pour un sujet détecté en analysant le sens et les liens de ses mots-clefs.Nous menons alors une étude pour comparer différents algorithmes pour générer ce label. Enfin, nousétendons notre modèle de graphes probabilistes pour modéliser conjointement les sujets, l'expertise, lesactivités et les tendances. Nous le validons sur des données du monde réel pour confirmer l'efficacité denotre modèle intégrant les comportements des utilisateurs et la dynamique des sujets
Type de document :
Thèse
Other [cs.OH]. Université Côte d'Azur, 2016. English. <NNT : 2016AZUR4090>
Liste complète des métadonnées

https://hal.inria.fr/tel-01402612
Contributeur : Abes Star <>
Soumis le : jeudi 9 février 2017 - 10:45:07
Dernière modification le : vendredi 10 février 2017 - 01:06:48

Fichier

2016AZUR4090.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01402612, version 3

Collections

Citation

Zide Meng. Temporal and semantic analysis of richly typed social networks from user-generated content sites on the web. Other [cs.OH]. Université Côte d'Azur, 2016. English. <NNT : 2016AZUR4090>. <tel-01402612v3>

Partager

Métriques

Consultations de
la notice

548

Téléchargements du document

120