Constitution d'un corpus de la langue Arabe à partir du Web

K. Meftouh; Kamel Smaïli; Med Tayeb Laskri

Communication Dans Un Congrès Année : 2007

Constitution d'un corpus de la langue Arabe à partir du Web

(1) , (2) , (1)

1
2

K. Meftouh

Fonction : Auteur

Laboratoire de Recherche en Informatique

Kamel Smaïli

Fonction : Auteur
PersonId : 2521
IdHAL : kamel-smaili
IdRef : 034429700

Analysis, perception and recognition of speech

Med Tayeb Laskri

Fonction : Auteur

Laboratoire de Recherche en Informatique

Résumé

La toile est une source intarissable de données textuelles. Ces dernières années la communauté travaillant sur les différents aspects de la langue s'est tournée vers le web afin de bénéficier de cette masse impressionnante d'informations. Cet article décrit un outil de construction de corpus pour l'Arabe. Il permet de recueillir automatiquement une liste de sites dédiés à la langue Arabe. Ensuite le contenu de ces sites est extrait et est normalisé. Le corpus ainsi constitué peut être utilisé dans diverses applications de traitement du langage naturel et plus particulièrement dans le calcul de modèles de langage statistiques.

Mots clés

Langue Arabe Web corpus moteur de recherche modèle de langage statistique

Domaines

Informatique et langage [cs.CL]

Caroline Lavecchia : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00186536

Soumis le : vendredi 9 novembre 2007-15:50:25

Dernière modification le : lundi 12 février 2024-12:04:05

Dates et versions

inria-00186536 , version 1 (09-11-2007)

Identifiants

HAL Id : inria-00186536 , version 1

Citer

K. Meftouh, Kamel Smaïli, Med Tayeb Laskri. Constitution d'un corpus de la langue Arabe à partir du Web. Colloque International sur le Traitement Automatique de la Langue Arabe - CITALA'07, Oct 2007, Rabat, Maroc. ⟨inria-00186536⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA UNIV-LORRAINE INRIA2 LORIA

363 Consultations

0 Téléchargements

Constitution d'un corpus de la langue Arabe à partir du Web

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager