Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe

Résumé : Nous proposons dans cet article deux méthodes universelles de post-traitement pour la correction des mots arabes issus des systèmes de reconnaissance de textes et de parole arabes. Elles sont conçues à être adaptables. Ces approches corrigent les erreurs de type rejet et substitution. L'une d'elles est étroitement liée au dictionnaire elle est dite guidée par le lexique, l'autre, guidée par le contexte, est plus générale exploitant les information contextuelles. Les propriétés de la langue arabe sont très utiles en analyse morpho-lexicale et par conséquent elles sont fortement exploitées dans le développement de la deuxième méthode. Les erreurs de substitution sont réécrites sous formes de règles de production et utilisées par un système de production. Les extensions aux autres niveaux du traitement du langage sont envisagées en perspectives.
Type de document :
Article dans une revue
Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées, INRIA, 2004, 2, pp.1-18
Liste complète des métadonnées

https://hal.inria.fr/hal-01261705
Contributeur : Coordination Episciences Iam <>
Soumis le : lundi 25 janvier 2016 - 17:12:35
Dernière modification le : dimanche 8 avril 2018 - 11:48:13
Document(s) archivé(s) le : mardi 26 avril 2016 - 11:37:26

Fichier

00201.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01261705, version 1

Collections

Citation

Toufik Sari, Mokhtar Sellami. Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe. Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées, INRIA, 2004, 2, pp.1-18. 〈hal-01261705〉

Partager

Métriques

Consultations de la notice

140

Téléchargements de fichiers

208