Towards a Text Mining Methodology Using Frequent Itemsets and Association Rule Extraction

Hacène Cherfi 1 Amedeo Napoli 1 Yannick Toussaint 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Abstract : This paper proposes a methodology for text mining relying on the classical knowledge discovery loop, with a number of adaptations. First, texts are indexed and prepared to be processed by frequent itemset levelwise search. Association rules are then extracted and interpreted, with respect to a set of quality measures and domain knowledge, under the control of an analyst. The article includes an experimentation on a real-world text corpus holding on molecular biology.
Type de document :
Communication dans un congrès
M. Nadif, A. Napoli, E. SanJuan, A. Sigayret. Journées d'informatique Messine - JIM'03, Sep 2003, Metz, France, INRIA Lorraine, pp.285--294, 2003
Liste complète des métadonnées

Littérature citée [15 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00107723
Contributeur : Publications Loria <>
Soumis le : jeudi 19 octobre 2006 - 09:07:02
Dernière modification le : jeudi 11 janvier 2018 - 06:19:53
Document(s) archivé(s) le : mercredi 29 mars 2017 - 12:52:44

Identifiants

  • HAL Id : inria-00107723, version 1

Collections

Citation

Hacène Cherfi, Amedeo Napoli, Yannick Toussaint. Towards a Text Mining Methodology Using Frequent Itemsets and Association Rule Extraction. M. Nadif, A. Napoli, E. SanJuan, A. Sigayret. Journées d'informatique Messine - JIM'03, Sep 2003, Metz, France, INRIA Lorraine, pp.285--294, 2003. 〈inria-00107723〉

Partager

Métriques

Consultations de la notice

165

Téléchargements de fichiers

89