Deux méthodologies de classification de règles d'association pour la fouille de textes - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Article Dans Une Revue Revue des Nouvelles Technologies de l'Information Année : 2005

Deux méthodologies de classification de règles d'association pour la fouille de textes

Résumé

Parmi les inconvénients d'un processus de fouille de données textuelles fondé sur l'extraction de règles d'association figurent le grand nombre de règles extraites et la difficulté d'affecter à une règle un critère de qualité fiable par rapport aux connaissances de l'analyste (i.e., l'expert du domaine). La plupart des approches pour la classification des règles d'association utilisent des méthodes statistiques pour juger de la qualité d'une règle et ne s'appuient pas sur les connaissances du domaine des données disponibles a priori pour classer les règles extraites. Dans cet article nous définissons la notion de qualité d'une règle d'association. Nous étudions en premier lieu les mesure statistiques permettant de classer les règles et nous proposons un algorithme combinant ces différentes mesures. Nous introduisons ensuite une nouvelle méthodologie de classification des règles exploitant un modèle de connaissances. Nous expérimentons cette mesure sur un exemple formel puis nous l'évaluons sur des données réelles.
Fichier non déposé

Dates et versions

inria-00000466 , version 1 (20-10-2005)

Identifiants

  • HAL Id : inria-00000466 , version 1

Citer

Hacène Cherfi, Amedeo Napoli, Yannick Toussaint. Deux méthodologies de classification de règles d'association pour la fouille de textes. Revue des Nouvelles Technologies de l'Information, 2005, Fouilles de données complexes., E-4, pp.211--234. ⟨inria-00000466⟩
82 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More