Vers la correction automatique de textes bruités: Architecture générale et détermination de la langue d'un mot inconnu

Marion Baranes 1, 2, *
* Auteur correspondant
1 ALPAGE - Analyse Linguistique Profonde à Grande Echelle ; Large-scale deep linguistic processing
Inria Paris-Rocquencourt, UPD7 - Université Paris Diderot - Paris 7
Résumé : Dans ce papier, nous introduisons le problème que pose la correction orthographique sur des corpus de qualité très dégradée tels que les messages publiés sur les forums, les sites d'avis ou les réseaux sociaux. Nous proposons une première architecture de correction qui a pour objectif d'éviter au maximum la sur-correction. Nous présentons, par ailleurs l'implémentation et les résultats d'un des modules de ce système qui a pour but de détecter si un mot inconnu, dans une phrase de langue connue, est un mot qui appartient à cette langue ou non.
Type de document :
Communication dans un congrès
RECITAL'2012 - Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2012, Grenoble, France. pp.95-108, 2012
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00701400
Contributeur : Marion Baranes <>
Soumis le : vendredi 25 mai 2012 - 12:50:45
Dernière modification le : vendredi 25 mai 2018 - 12:02:05
Document(s) archivé(s) le : vendredi 30 novembre 2012 - 12:35:36

Fichier

recital12marion.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00701400, version 1

Collections

Citation

Marion Baranes. Vers la correction automatique de textes bruités: Architecture générale et détermination de la langue d'un mot inconnu. RECITAL'2012 - Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2012, Grenoble, France. pp.95-108, 2012. 〈hal-00701400〉

Partager

Métriques

Consultations de la notice

361

Téléchargements de fichiers

759