Une approche entropie maximale pour le découpage en phrases des textes en français - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2009

Une approche entropie maximale pour le découpage en phrases des textes en français

Hong Phuong Le
  • Fonction : Auteur
  • PersonId : 835932

Résumé

Dans cet article, nous proposons une étude de cas de l'approche entropie maximale pour le découpage en phrases d'un texte en français. Au contraire de systèmes de découpage basés sur les règles prédéfinies comme le système INTEX, la procédure d'apprentissage de notre système ne requiert aucune règle prédéfinie manuellement, ni de lexique, ni d'informations spécifiques. Etant donné un corpus étiqueté avec les limites des phrases, le système apprend à classifier chaque occurrence de ponctuation comme étant une vraie ou fausse limite de phrase. La performance du système sur un corpus français est comparable aux résultats du système INTEX, 98, 5% pour la précision.
Fichier non déposé

Dates et versions

inria-00448841 , version 1 (20-01-2010)

Identifiants

  • HAL Id : inria-00448841 , version 1

Citer

Hong Phuong Le, Azim Roussanaly. Une approche entropie maximale pour le découpage en phrases des textes en français. [Rapport de recherche] 2009. ⟨inria-00448841⟩
76 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More