Weakly supervised named entity classification

Edouard Grave 1, 2, 3, *
* Auteur correspondant
2 SIERRA - Statistical Machine Learning and Parsimony
DI-ENS - Département d'informatique de l'École normale supérieure, ENS Paris - École normale supérieure - Paris, Inria Paris-Rocquencourt, CNRS - Centre National de la Recherche Scientifique : UMR8548
Abstract : In this paper, we describe a new method for the problem of named entity classifica-tion for specialized or technical domains, using distant supervision. Our approach relies on a simple observation: in some specialized domains, named entities are almost unambiguous. Thus, given a seed list of names of entities, it is cheap and easy to obtain positive examples from unlabeled texts using a simple string match. Those positive examples can then be used to train a named entity classifier, by using the PU learning paradigm, which is learning from positive and unlabeled examples. We introduce a new convex formulation to solve this problem, and apply our technique in order to extract named entities from financial reports cor-responding to healthcare companies.
Type de document :
Communication dans un congrès
Workshop on Automated Knowledge Base Construction (AKBC), Dec 2014, Montréal, Canada. 2014
Liste complète des métadonnées

Littérature citée [27 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01095596
Contributeur : Edouard Grave <>
Soumis le : lundi 15 décembre 2014 - 20:13:48
Dernière modification le : mardi 24 avril 2018 - 17:20:14
Document(s) archivé(s) le : lundi 16 mars 2015 - 12:46:29

Fichier

grave2014weakly.pdf
Fichiers produits par l'(les) auteur(s)

Licence


Copyright (Tous droits réservés)

Identifiants

  • HAL Id : hal-01095596, version 1

Collections

Citation

Edouard Grave. Weakly supervised named entity classification. Workshop on Automated Knowledge Base Construction (AKBC), Dec 2014, Montréal, Canada. 2014. 〈hal-01095596〉

Partager

Métriques

Consultations de la notice

241

Téléchargements de fichiers

210