hal-00583761, version 1
La classification des textes
Images des Mathématiques (2011) http://images.math.cnrs.fr/La-classification-des-textes.html
Résumé : Comment identifier l'auteur d'un texte d'origine douteuse ou inconnue ? Dans la résolution de cette question, les statistiques appliquées tiennent une place importante, notamment via un outil : la " distance " entre les textes. Présentation d'une expérience en aveugle qui illustre cette démarche. Application au théâtre français du XVIIe siècle et à la paternité des oeuvres présentées par Molière.
- 1 :
- CNRS – Institut National Polytechnique de Grenoble (INPG) – Université Joseph Fourier - Grenoble I
- 2 :
- Institut d'Études Politiques [IEP] - Grenoble – CNRS : UMR5194 – Université Pierre-Mendès-France - Grenoble II – Université Joseph Fourier - Grenoble I
- Domaine : Mathématiques/Probabilités
Mathématiques/Statistiques
Statistiques/Théorie - Mots-clés : Classification – Distance intertextuelle – Attribution d'auteur – Genre littéraire – Théâtre français – Corneille – Molière
- Référence interne : 06
- hal-00583761, version 1
- http://hal.archives-ouvertes.fr/hal-00583761
- oai:hal.archives-ouvertes.fr:hal-00583761
- Contributeur :
- Soumis le : Mercredi 6 Avril 2011, 15:25:37
- Dernière modification le : Jeudi 21 Avril 2011, 10:16:15



Documents associés
Exporter