Parsing Punctuation and Coordination Extragrammatically

Valmi Dufour-Lussier 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : La coordination est une construction syntaxique extrêmement fréquente dans les langues naturelles et néanmoins très difficile à analyser : elle est hautement ambiguë, de nombreux types de constituants ou non-constituants pouvant être coordonnés dans différents contextes, et se prête difficilement à une modélisation à l'aide des outils formels employés pour représenter la portion " basique " des langues naturelles, c'est-à-dire dépourvue de coordination. Quant à la ponctuation, objet d'étude souvent occulté par la linguistique car étant propre au langage écrit, elle peut se combiner ou se substituer aux conjonctions pour jouer un rôle coordinatif, ou encore jouer un rôle adjonctif. Certains chercheurs avancent que la coordination ne constitue pas un phénomène grammatical relevant de la compétence linguistique, mais plutôt un fait de performance qui devrait s'analyser au sein même des structures syntaxiques. Nous nous proposons de reprendre cette idée au compte du traitement automatique des langues en définissant un algorithme de traitement de la coordination et de la ponctuation qui opère un processus de transformation de graphes sur la sortie d'un analyseur basé sur un modèle de langage " basique ". La structure syntaxique d'une phrase telle que proposée par notre système prend la forme d'un graphe acyclique orienté, dans lequel apparaît clairement le phénomène de partage de constituants qui définit la nature de la coordination. Nous détaillons un algorithme dans le cadre des grammaires d'interaction, mais pouvant être étendu à d'autres formalismes (nommément les grammaires d'arbres adjoints, les grammaires de structures de phrase et la syntaxe de dépendance), qui permet d'analyser de nombreux types de constructions coordinatives et adjonctives. Nous comparons celui-ci à une approche classique de modélisation de la coordination dans le formalisme des grammaires d'interaction développée par Le Roux et Perrier (2006) puis à une approche similaire à la nôtre développée dans le cadre des grammaires d'arbres adjoints par Joshi et Schabes (1991).
Type de document :
Mémoires d'étudiants -- Hal-inria+
Artificial Intelligence [cs.AI]. 2010
Liste complète des métadonnées

https://hal.inria.fr/inria-00634736
Contributeur : Valmi Dufour-Lussier <>
Soumis le : samedi 22 octobre 2011 - 20:42:49
Dernière modification le : jeudi 11 janvier 2018 - 06:19:54

Identifiants

  • HAL Id : inria-00634736, version 1

Collections

Citation

Valmi Dufour-Lussier. Parsing Punctuation and Coordination Extragrammatically. Artificial Intelligence [cs.AI]. 2010. 〈inria-00634736〉

Partager

Métriques

Consultations de la notice

89