Discourse Modeling with Abstract Categorial Grammars - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Thèse Année : 2016

Discourse Modeling with Abstract Categorial Grammars

Modélisation du Discours avec les Grammaires Catégorielles Abstraites

Résumé

This dissertation addresses the questions of discourse modeling within a grammatical framework called Abstract Categorial Grammars (ACGs). ACGs provide a unified framework for both syntax and semantics. We focus on the discourse formalisms that make use of a grammatical approach to capture structural regularities of discourse. We study several TAG-based discourse grammar formalisms, D-LTAG, G-TAG, and D-STAG. In the present work, we propose ACG encodings of G-TAG and D-STAG. G-TAG is a formalism introduced for generating natural language texts out of conceptual (semantic) representation inputs. D-STAG is a synchronous formalism for modeling the syntax-semantics interface for discourse. It was introduced for discourse analysis (parsing). The ACG encodings of G-TAG and D-STAG shed light on the problem of clause-medial connectives that TAG-based formalisms leave out of account. To deal with a discourse that contains clause-medial connectives, D-LTAG, G-TAG, and D-STAG, all make use of an extra grammatical step. In contrast, the ACG encodings of G-TAG and D-STAG offer a purely grammatical approach to discourse connectives occupying clause-medial positions. The method we propose is a generic one and can serve as a solution for encoding clause-medial connectives with the formalisms based on TAGs. The ACG encodings of G-TAG and D-STAG are second-order. Importantly, the class of second-order ACGs consists of intrinsically reversible grammars. Grammars of this class use the same polynomial algorithm to build parse structures both for strings and logical formulas. Thus, second-order ACGs can be used both for parsing and generation. Therefore, the problems of parsing and generation with the ACG encodings of G-TAG and D-STAG are of polynomial complexity.
Ce mémoire de thèse traite la modélisation du discours dans le cadre grammatical des Grammaires Catégorielles Abstraites (Abstract Categorial Grammars, ACG). Les ACG offrent un cadre unifié pour la modélisation de la syntaxe et de la sémantique. Nous nous intéressons en particulier aux formalismes discursifs qui utilisent une approche grammaticale pour rendre compte des régularités des structures discursives. Nous étudions plusieurs formalismes grammaticaux qui s’appuient sur les Grammaires d’Arbres Adjoints (Tree-Adjoining Grammars, TAG): D-LTAG, G-TAG et D-STAG. Dans notre travail, nous proposons un encodage de G-TAG et un encodage de D-STAG. G-TAG est un formalisme introduit pour la génération de textes en langue naturelle à partir de représentations conceptuelles (sémantiques). D-STAG est un formalisme synchrone pour la modélisation de l’interface syntaxe-sémantique du discours. Il a été introduit pour l’analyse et la construction des structures discursives. L’encodage en ACG de G-TAG et de D-STAG permet d’éclairer le problème des connecteurs discursifs médiaux que les formalismes s’appuyant sur TAG ne traitent pas, du moins pas par un mécanisme grammatical. En effet, pour prendre en compte ces connecteurs, D-LTAG, G-TAG et D-STAG utilisent tous une étape extra-grammaticale. Notre encodage offre au contraire une approche purement grammaticale de la prise en compte de ces connecteurs discursifs. La méthode que nous proposons est générique et peut servir de solution à tout encodage des connecteurs médiaux de formalismes fondés sur les TAG. Notre encodage de G-TAG et de D-STAG se fait avec des ACG de second ordre. Les grammaires de cette classe sont réversibles. Elles recourent aux mêmes algorithmes polynômiaux pour construire les structures d’analyse, que ce soit à partir de chaînes de caractères ou à partir de formules logiques. Ainsi, ces grammaires peuvent être utilisées aussi bien en analyse qu’en génération. Les problèmes d’analyse et de génération avec les encodages de G-TAG et de D-STAG en ACG sont donc de complexité polynômiale.
Fichier principal
Vignette du fichier
thesis.pdf (2.56 Mo) Télécharger le fichier

Dates et versions

tel-01412765 , version 1 (08-12-2016)
tel-01412765 , version 2 (26-05-2017)

Identifiants

  • HAL Id : tel-01412765 , version 1

Citer

Aleksandre Maskharashvili. Discourse Modeling with Abstract Categorial Grammars. Computation and Language [cs.CL]. University of Lorraine; Inria Nancy - Grand Est (Villers-lès-Nancy, France), 2016. English. ⟨NNT : ⟩. ⟨tel-01412765v1⟩
361 Consultations
270 Téléchargements

Partager

Gmail Facebook X LinkedIn More