Caractériser les discours académiques et de vulgarisation : quelles propriétés ?

Abstract : L’article présente une étude des propriétés linguistiques (lexicales, morpho-syntaxiques, syntaxiques) permettant la classification automatique de documents selon leur genre (articles scientifiques et articles de vulgarisation), dans deux domaines différentes (médecine et informatique). Notre analyse, effectuée sur des corpus comparables en genre et en thèmes disponibles en français, permet de valider certaines propriétés identifiées dans la littérature comme caractéristiques des discours académiques ou de vulgarisation scientifique. Les premières expériences de classification évaluent l’influence de ces propriétés pour l’identification automatique du genre pour le cas spécifique des textes scientifiques ou de vulgarisation.
Type de document :
Poster
TALN 2015, Jun 2015, Caen, France. TALN 2015. 〈https://taln2015.greyc.fr〉
Liste complète des métadonnées

https://hal.inria.fr/hal-01224300
Contributeur : Amalia Todirascu <>
Soumis le : mercredi 4 novembre 2015 - 14:59:23
Dernière modification le : mercredi 14 mars 2018 - 16:51:30

Identifiants

  • HAL Id : hal-01224300, version 1

Collections

Citation

Amalia Todirascu, Beatriz Sanchez Cardenas. Caractériser les discours académiques et de vulgarisation : quelles propriétés ?. TALN 2015, Jun 2015, Caen, France. TALN 2015. 〈https://taln2015.greyc.fr〉. 〈hal-01224300〉

Partager

Métriques

Consultations de la notice

198