Deux méthodologies de classification de règles d'association pour la fouille de textes

Hacène Cherfi 1 Amedeo Napoli 1 Yannick Toussaint 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Parmi les inconvénients d'un processus de fouille de données textuelles fondé sur l'extraction de règles d'association figurent le grand nombre de règles extraites et la difficulté d'affecter à une règle un critère de qualité fiable par rapport aux connaissances de l'analyste (i.e., l'expert du domaine). La plupart des approches pour la classification des règles d'association utilisent des méthodes statistiques pour juger de la qualité d'une règle et ne s'appuient pas sur les connaissances du domaine des données disponibles a priori pour classer les règles extraites. Dans cet article nous définissons la notion de qualité d'une règle d'association. Nous étudions en premier lieu les mesure statistiques permettant de classer les règles et nous proposons un algorithme combinant ces différentes mesures. Nous introduisons ensuite une nouvelle méthodologie de classification des règles exploitant un modèle de connaissances. Nous expérimentons cette mesure sur un exemple formel puis nous l'évaluons sur des données réelles.
Complete list of metadatas

https://hal.inria.fr/inria-00000466
Contributor : Hacène Cherfi <>
Submitted on : Thursday, October 20, 2005 - 3:51:03 PM
Last modification on : Thursday, January 11, 2018 - 6:19:53 AM

Identifiers

  • HAL Id : inria-00000466, version 1

Collections

Citation

Hacène Cherfi, Amedeo Napoli, Yannick Toussaint. Deux méthodologies de classification de règles d'association pour la fouille de textes. Revue des Nouvelles Technologies de l'Information, Hermann, 2005, Fouilles de données complexes., E-4, pp.211--234. ⟨inria-00000466⟩

Share

Metrics

Record views

213