Une optimisation de l'extraction d'un jeu de règles s'appuyant sur les caractéristiques statistiques des données

Martine Cadot 1 Amedeo Napoli 1
1 ORPAILLEUR - Knowledge representation, reasonning
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Cet article présente un essai d'optimisation du jeu de règles extrait par la technique des motifs fréquents. Partant d'un tableau de données tiré d'un corpus de résumés d'articles scientifiques dans le domaine de la biologie moléculaire, on utilise les techniques usuelles d'extraction de règles d'association pour construire le jeu de règles associé aux données. On définit ensuite des règles « douteuses » par des techniques de simulation. On discute alors du choix de celles qu'il convient de supprimer afin d'optimiser le jeu de règles de départ. Les indices associés à ds régles extraites de données s'appuient généralement sur le support et la confiance. On mentionne dans l'article les résultats obtenus avec d'autres indices de qualité des règles utilisés actuellement en fouille de données. Enfin, on se réfère aux propriétés statistiques des données afin de préparer la voie à une optimisation des jeux de règles extraits de bases de données variées, ce qui donne des pistes de prolongement de ce travail. || This paper presents a study on the optimization of the set of rules that can be extracted from a set of data using the frequent itemset search methodology. The present experiment has been applied on a set of abstracts of biological texts. The association
Type de document :
Rapport
[Interne] A02-R-162 || cadot02a, 2002
Liste complète des métadonnées

https://hal.inria.fr/inria-00101061
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 14:55:10
Dernière modification le : jeudi 11 janvier 2018 - 06:19:53

Identifiants

  • HAL Id : inria-00101061, version 1

Collections

Citation

Martine Cadot, Amedeo Napoli. Une optimisation de l'extraction d'un jeu de règles s'appuyant sur les caractéristiques statistiques des données. [Interne] A02-R-162 || cadot02a, 2002. 〈inria-00101061〉

Partager

Métriques

Consultations de la notice

131