Conquering Language: Using NLP on a Massive Scale to Build High Dimensional Language Models from the Web

Gregory Grefenstette 1, *
* Auteur correspondant
Abstract : Dictionaries only contain some of the information we need to know about a language. The growth of the Web, the maturation of linguistic process-ing tools, and the decline in price of memory storage allow us to envision de-scriptions of languages that are much larger than before. We can conceive of building a complete language model for a language using all the text that is found on the Web for this language. This article describes our current project to do just that.
Type de document :
Communication dans un congrès
CICLing, Feb 2007, Mexico, Mexico. pp.35 - 49, 2007, 〈10.1007/978-3-540-70939-8_4〉
Liste complète des métadonnées

Littérature citée [24 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01081036
Contributeur : Gregory Grefenstette <>
Soumis le : jeudi 6 novembre 2014 - 17:18:13
Dernière modification le : jeudi 9 février 2017 - 15:47:19
Document(s) archivé(s) le : samedi 7 février 2015 - 11:20:11

Fichier

GrefenstettefinalCICLING.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Collections

Citation

Gregory Grefenstette. Conquering Language: Using NLP on a Massive Scale to Build High Dimensional Language Models from the Web. CICLing, Feb 2007, Mexico, Mexico. pp.35 - 49, 2007, 〈10.1007/978-3-540-70939-8_4〉. 〈hal-01081036〉

Partager

Métriques

Consultations de la notice

81

Téléchargements de fichiers

125