An Efficient Microblog Hot Topic Detection Algorithm Based on Two Stage Clustering - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

An Efficient Microblog Hot Topic Detection Algorithm Based on Two Stage Clustering

Yuexin Sun
  • Fonction : Auteur
  • PersonId : 990765
Huifang Ma
  • Fonction : Auteur
  • PersonId : 990766
Meihuizi Jia
  • Fonction : Auteur
  • PersonId : 990767

Résumé

Microblog has the characteristic of short length, complex structure and words deformation. In this paper, a two stage clustering algorithm based on probabilistic latent semantic analysis (pLSA) and K-means clustering (K-means) is proposed. Besides, this paper also presents the definition of popularity and mechanism of sorting the topics. Experiments show that our method can effectively cluster topics and be applied to microblog hot topic detection.
Fichier principal
Vignette du fichier
978-3-662-44980-6_10_Chapter.pdf (259.79 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01383320 , version 1 (18-10-2016)

Licence

Paternité

Identifiants

Citer

Yuexin Sun, Huifang Ma, Meihuizi Jia, Wang Peiqing. An Efficient Microblog Hot Topic Detection Algorithm Based on Two Stage Clustering. 8th International Conference on Intelligent Information Processing (IIP), Oct 2014, Hangzhou, China. pp.90-95, ⟨10.1007/978-3-662-44980-6_10⟩. ⟨hal-01383320⟩
84 Consultations
179 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More