Sémantique et discours - de la modélisation à l'interprétation

Maxime Amblard 1
1 SEMAGRAMME - Semantic Analysis of Natural Language
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Les travaux présentés se situent dans le champ de la linguistique computationnelle. Nous proposons des outils et méthodes informatiques pour le traitement de la langue naturelle. Nos activités de recherche se répartissent selon deux axes : 1. la modélisation sémantique par des approches formelles et logiques. Pour cela nous définissons des grammaires respectant le principe de compositionnalité de Frege, s’inscrivant dans la continuité des propositions de Montague, et inspirées par (de Groote 2006) qui propose un calcul sémantique basé sur le λ-calcul simulant la dynamicité. 2. la confrontation de ces modèles sémantiques et discursifs à des données empiriques extraites d’usages pathologiques identifiés dans des entretiens entre des patients schizophrènes et des psychologues. Dans la première partie, nous revenons sur nos travaux en modélisation sémantique. Nous avons été conduits à proposer un formalisme rendant compte de l’interface syntaxe- sémantique pour la théorie générative de Chomsky. Ces grammaires, appelées grammaires minimalistes catégorielles, sont basées sur une extension des grammaires de Lambek, (Lambek 1958), et synchronisent un calcul sémantique au calcul syntaxique par une correspondance entre les types, en s’appuyant sur le λ-calcul. Ce cadre nous a par la suite permis d’interpréter linguistiquement les propriétés de commutativité. Nous avons ensuite travaillé à la représentation sémantique, ce qui nous a conduit à encadrer deux thèses avec Philippe de Groote. Dans sa thèse, Sai Qian a cherché à modéliser les notions d’événements, de négation et de subordination modale. Une solution pour traiter ces problèmes a été de les envisager comme des problèmes d’accessibilité de variables dans un cadre dynamique. Il a pour cela profondément étendu la notion de contexte de (de Groote 2006). Nous nous sommes ensuite employés à unifier les traitements dans un unique cadre. Pour cela, Jirka Maršík a, dans sa thèse, proposé un calcul inspiré des propriétés des langages de programmation modernes, notamment les effets algébriques (effects et handlers). Ce calcul permet de simuler différents ordres d’évaluation, et donc de gérer de manière flexible la notion de contexte. Jirka Maršík a d’une part étudié les propriétés du calcul et prouvé la préservation de types, la confluence et la terminaison, et d’autre part il a montré comment rendre compte de différents phénomènes linguistiques. Dans la seconde partie, nous nous sommes interrogés sur l’adéquation de ces approches formelles et leur utilisation pour résoudre des problèmes empiriques. La modélisation d’entretiens entre des patients schizophrènes et des psychologues a été le terrain d’étude qui s’est présenté et cela a donné lieu au projet SLAM (Schizophrénie et Langage : Analyse et Modélisation). Dans ces entretiens, nous avons identifié des échanges dont l’interprétation sémantique ou pragmatique était difficile voire impossible. Le principe a été d’utiliser des formalismes logiques pour la représentation du discours afin d’interroger ces dysfonctionnements. En étudiant ces entretiens, il nous est apparu pertinent de les analyser sur d’autres niveaux que la sémantique. Nous avons mis en œuvre des outils du traitement automatique des langues sur nos données pour analyser les productions de disfluences, ainsi que la répartition des catégories morpho-syntaxiques. Nous avons ainsi pu identifier que les schizophrènes produisaient plus de disfluences que les interlocuteurs du groupe contrôle. Finalement, nous avons travaillé à l’utilisation des marqueurs explicites de relations de discours dans des tâches d’extraction d’informations. La partie finale de ce document revient sur nos perspectives de recherche qui proposent d’unifier les deux axes précédents. Il s’agit de parvenir à réconcilier la vision calculatoire de la modélisation sémantique avec ses applications dans des perspectives des sciences cognitives. Nous souhaitons principalement développer des grammaires sémantiques et la modélisation formelle des dialogues.
Type de document :
HDR
Informatique [cs]. Université de Lorraine (Nancy), 2016
Liste complète des métadonnées

Littérature citée [198 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01415967
Contributeur : Maxime Amblard <>
Soumis le : jeudi 15 décembre 2016 - 16:09:27
Dernière modification le : jeudi 11 janvier 2018 - 06:23:33

Fichier

Identifiants

  • HAL Id : tel-01415967, version 2

Collections

Citation

Maxime Amblard. Sémantique et discours - de la modélisation à l'interprétation. Informatique [cs]. Université de Lorraine (Nancy), 2016. 〈tel-01415967v2〉

Partager

Métriques

Consultations de la notice

550

Téléchargements de fichiers

361