P. Boullier and B. Sagot, « Are very large context-free grammar tractable?, Proceedings of the 8th International Workshop on Parsing Technologies (IWPT'07), 2007.
DOI : 10.3115/1621410.1621423

URL : http://acl.ldc.upenn.edu/w/w07/W07-2213.pdf

L. Clément and E. De-la-clergerie, « Terminology and other language resources ? Morpho- Syntactic Annotation Framework (MAF), 2004.

H. Cunningham, D. Maynard, K. Bontcheva, V. Tablan, and «. Gate, A framework and graphical development environment for robust NLP tools and applications, Proceedings of the 40th Anniversary Meeting of the Association for Computational Linguistics, 2002.

L. Danlos and «. Ilimp, Outil pour repérer les occurences du pronom impersonnel il », Actes de TALN, 2005.

T. Heitz, « Modélisation du prétraitement des textes, Proceedings of JADT'06 (International Conference on Statistical Analysis of Textual Data), pp.499-506, 2006.

K. Kukich, Technique for automatically correcting words in text, ACM Computing Surveys, vol.24, issue.4, pp.377-439, 1992.
DOI : 10.1145/146370.146380

K. Oflazer, « Error-tolerant finite-state recognition with applications to morphological analysis and spelling correction, Comp. Ling, vol.22, pp.1-1, 1996.

S. Paumier, De la reconnaissance de formes linguistiques à l'analyse syntaxique, Thèse de doctorat, 2003.

B. Sagot and P. Boullier, « From raw corpus to word lattices: robust pre-parsing processing with SXPipe, Archives of Control Sciences, special issue on Language and Technology, pp.4-4, 2005.

B. Sagot, L. Clément, E. Villemonte-de-la-clergerie, and P. Boullier, « The Lefff 2 syntactic lexicon for French: architecture, acquisition, use, Proc. of LREC'06, 2006.

B. Sagot, L. Danlos, and A. Désir, « Traitements de surface à l'aide de graphes de transitions récursifs: de Unitex à SXPipe, 2008.

. Si, Alors Rendre $s et sortir Fin Si Si ($s peut être corrigé par correction « légère » ET $s n'a pas de majuscule) Alors Rendre $s et sortir Fin Si Si (l'équivalent en minuscules de $s, est dans le lexique) Alors Rendre $s et sortir Fin Si Si ($s est le premier mot de la phrase ET $n commence par une majuscule) Alors Découper l'équivalent en minuscules de $s en pré-noyau/noyau/post-noyau (voir algorithme 3) Sinon Découper $s en pré-noyau, Le noyau est vide (succès)) Alors Rendre le pré-noyau et le post-noyau, et sortir Sinon Si

S. Découper and $. En-préfixes, Le coeur obtenu est dans le lexique) Alors Rendre le pré-noyau, les préfixes, le coeur, les suffixes et le post-noyau, et sortir Fin Si Si ($n a au moins une majuscule) Alors Rendre le pré-noyau, $n et le post-noyau, et sortir Fin Si Se souvenir du coût d'une correction

$. and =. Le-mot, inconnu du lexique) dont on cherche à extraire les formes simples détachables au niveau de tirets et d'apostrophes (sous la forme pré-noyau

. Si, Alors On coupe $s juste avant en $s1 et $s2 Sinon On coupe $s juste après en $s1 et $s2 Fin Si Si ($s1 est dans le lexique en tant que mot mais pas en tant que préfixe ET Tous les découpages ont été jugés corrects jusqu'à présent) Alors On empile $s1 dans la pile représentant le pré-noyau Si ($t est une apostrophe ET $s2 commence par une majuscule) Alors $s2 est le noyau; et sortir Fin Si Sinon Ce découpage est incorrect Fin Si Si ($s2 (qui commence donc par un tiret si $t est un tiret) est dans le lexique en tant que mot mais pas en tant que suffixe) Alors On empile $s2 dans la pile représentant le post-noyau Si ($s1 est dans le lexique en tant que forme simple mais pas en tant que préfixe ET $s1 n'a pas encore été empilé) Alors On empile $

. Si-(-c-'est-un-succès, Alors Si (Tous les découpages ont été jugés corrects jusqu'à présent ET $s1 n'a pas encore été empilé) Alors On empile $s1 dans le post-noyau Fin Si Fin Si Le noyau est initialisé à la chaîne vide

. Si, $s1 n'a pas été empilé) Alors Ajouter $s1 au noyau Fin Si Si ($s2 n'a pas été empilé) Alors Ajouter $

$. and =. Le-mot, inconnu du lexique) dont on cherche à extraire les préfixes et les suffixes détachables (sous la forme préfixes

. Si, $s ne commence pas par un préfixe ET $p ne comporte pas de tiret ni de majuscule ET $s n'est pas en début de phrase) Alors Essayer une correction « légère

. Si, Cette correction à marché) Alors Sortir de BOUCLE Fin Si Fin Si Fin Pour Fait Si ($p (éventuellement corrigé) est un préfixe) Alors Sortir Fin Si Essayer d'effectuer sur le préfixe $p l'opération qui lui est associée (rien

. Si, est un échec OU le reste du mot commence par une majuscule OU $p-tiret-reste du mot est un mot du lexique) Alors Sortir Fin

. Si, de composé) Alors On supprime du sous-DAG local cet amalgame ou ce(s) composant(s) de composé(s) Fin Si On stocke la forme dans le sous-DAG local Sinon Si (Il avait fallu corriger pour faire de $s un amalgame ou un composant de composé) Alors On tente une correction complète, possiblement ambiguë) pour en faire une forme Si (On en a) Alors On les stocke Fin Si