Hidden Markov tree models for semantic class induction

Edouard Grave 1, 2, * Guillaume Obozinski 3 Francis Bach 1, 2
* Auteur correspondant
2 SIERRA - Statistical Machine Learning and Parsimony
DI-ENS - Département d'informatique de l'École normale supérieure, ENS Paris - École normale supérieure - Paris, Inria Paris-Rocquencourt, CNRS - Centre National de la Recherche Scientifique : UMR8548
Abstract : In this paper, we propose a new method for semantic class induction. First, we introduce a generative model of sentences, based on dependency trees and which takes into account homonymy. Our model can thus be seen as a generalization of Brown clustering. Second, we describe an efficient algorithm to perform inference and learning in this model. Third, we apply our proposed method on two large datasets ($10^8$ tokens, $10^5$ words types), and demonstrate that classes induced by our algorithm improve performance over Brown clustering on the task of semi-supervised supersense tagging and named entity recognition.
Type de document :
Communication dans un congrès
CoNLL - Seventeenth Conference on Computational Natural Language Learning, Aug 2013, Sofia, Bulgaria. 2013
Liste complète des métadonnées

Littérature citée [29 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00833288
Contributeur : Edouard Grave <>
Soumis le : mercredi 12 juin 2013 - 13:43:11
Dernière modification le : jeudi 5 juillet 2018 - 14:25:25
Document(s) archivé(s) le : mardi 4 avril 2017 - 20:06:16

Fichier

final-version.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00833288, version 1

Citation

Edouard Grave, Guillaume Obozinski, Francis Bach. Hidden Markov tree models for semantic class induction. CoNLL - Seventeenth Conference on Computational Natural Language Learning, Aug 2013, Sofia, Bulgaria. 2013. 〈hal-00833288〉

Partager

Métriques

Consultations de la notice

842

Téléchargements de fichiers

836