3976 articles – 5526 references  [version française]

inria-00107581, version 1

Fouille de textes par combinaison de règles d'association et d'indices statistiques

Hacène Cherfi () a1, Yannick Toussaint b1

1er Colloque International sur la Fouille de Textes - CIFT'2002 (2002) 67-80

Abstract: Nous proposons la description d'une méthodologie d'accès et de lecture des règles d'association extraites à partir de textes. Le corpus ayant servi à notre expérimentation est constitué de résumés d'articles scientifiques dans le domaine de la biologie moléculaire. Ce processus génère un trop grand nombre de règles et nous amène à chercher à les trier de la plus informative à la moins informative.Le classement est établi suivant des indices statistiques. Une discussion sur nos résultats identifie quelques points ayant un impact sur l'interprétabilité des règles d'association. || This paper aims at defining a methodology of access and reading of association rules extracted from texts. The corpus used is a set of scientific abstracts in the field of molecular biology. The mining process often generates a huge number of rules. This

  • a –  UNIVERSITE HENRI POINCARE
  • b –  INRIA
  • 1:  ORPAILLEUR (INRIA Lorraine - LORIA)
  • INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
  • Domain : Computer Science/Other
  • Keywords : association rules – text mining – statistical indices – interpretation – terminology || règles d'association – fouille de textes – indices statistiques – interprétation – terminologie
  • Internal note : A02-R-194 || cherfi02d
  • Comment : Colloque avec actes et comité de lecture. internationale.
 
  • inria-00107581, version 1
  • oai:hal.inria.fr:inria-00107581
  • From: 
  • Submitted on: Thursday, 19 October 2006 09:02:08
  • Updated on: Friday, 20 October 2006 15:32:31