21772 articles – 15587 Notices  [english version]

hal-00583761, version 1

La classification des textes

Cyril Labbé 1, Dominique Labbé () 2

Images des Mathématiques (2011) http://images.math.cnrs.fr/La-classification-des-textes.html

Résumé : Comment identifier l'auteur d'un texte d'origine douteuse ou inconnue ? Dans la résolution de cette question, les statistiques appliquées tiennent une place importante, notamment via un outil : la " distance " entre les textes. Présentation d'une expérience en aveugle qui illustre cette démarche. Application au théâtre français du XVIIe siècle et à la paternité des oeuvres présentées par Molière.

  • 1 :  Institut d'Informatique et de Mathématiques Appliquées de Grenoble (IMAG)
  • CNRS – Institut National Polytechnique de Grenoble (INPG) – Université Joseph Fourier - Grenoble I
  • 2 :  Politiques publiques, ACtion politique, TErritoires (PACTE)
  • Institut d'Études Politiques [IEP] - Grenoble – CNRS : UMR5194 – Université Pierre-Mendès-France - Grenoble II – Université Joseph Fourier - Grenoble I
  • Domaine : Mathématiques/Probabilités
    Mathématiques/Statistiques
    Statistiques/Théorie
  • Mots-clés : Classification – Distance intertextuelle – Attribution d'auteur – Genre littéraire – Théâtre français – Corneille – Molière
  • Référence interne : 06
 
  • hal-00583761, version 1
  • oai:hal.archives-ouvertes.fr:hal-00583761
  • Contributeur : 
  • Soumis le : Mercredi 6 Avril 2011, 15:25:37
  • Dernière modification le : Jeudi 21 Avril 2011, 10:16:15