Analyse comparative d'indices d'implication discriminants fondés sur une échelle de probabilité.

Israël-César Lerman 1, * Sylvie Guillaume 2
* Auteur correspondant
1 SYMBIOSE - Biological systems and models, bioinformatics and sequences
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Historiquement, l'élaboration d'une échelle de probabilité pour éprouver l'existence d'un lien entre deux attributs descriptifs a été établie dans l'optique des tests d'hypothèses statistiques. L'adaptation au problème de la comparaison mutuelle entre plusieurs attributs nécessite une normalisation préalable ; laquelle est indispensable pour que l'échelle de probabilité reste discriminante pour un nombre n d'observations augmentant de façon considérable (n pouvant atteindre plusieurs millions). C'est le cas de l'association symétrique traduisant un “degré d'équivalence” entre attributs qui s'est présenté en premier (méthode de l' Analyse de la Vraisemblance des Liens Relationnels). Plus récemment, il s'est agi du cas de l'association dissymétrique traduisant un “degré d'implication” entre attributs, définissant ainsi ce qu'on appelle une “règle d'association”. Ce dernier cas sera étudié de façon plus accentuée ici. Différentes techniques de normalisation ont été proposées. La première est contextuelle par rapport à un ensemble potentiel de règles d'association. Elle conduit à l'Intensité d'Implication Contextuelle (IIC). La seconde raisonne par rapport à un échantillon dont la taille serait réduite à 100 et propose une Valeur Test notée VT100 pour ce niveau considéré comme symbolique de la taille d'un échantillon. Nous découvrirons différentes variantes pour une telle réduction. La troisième technique, conduisant `a l'Intensité d'Implication Entropique (IIE), mélange - par une opération de moyenne géométrique - un indice probabiliste non normalisé et un indice d'inclusion faisant appel à l'entropie de Shannon. L'objet de ce travail est l'analyse théorique et expérimentale de ces différentes approches par rapport `a différents modèles de croissance du nombre n d'observations. Une vision nouvelle et des résultats originaux seront proposés. L'analyse comparative et expérimentale utilisera la base de données bien connue “Wages”.
Type de document :
Rapport
[Rapport de recherche] PI 1942, 2009, pp.72
Liste complète des métadonnées

Littérature citée [28 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00450129
Contributeur : Ist Rennes <>
Soumis le : lundi 25 janvier 2010 - 14:36:50
Dernière modification le : mercredi 16 mai 2018 - 11:23:05
Document(s) archivé(s) le : mercredi 30 novembre 2016 - 11:38:28

Fichier

PI-1942.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00450129, version 1

Citation

Israël-César Lerman, Sylvie Guillaume. Analyse comparative d'indices d'implication discriminants fondés sur une échelle de probabilité.. [Rapport de recherche] PI 1942, 2009, pp.72. 〈inria-00450129〉

Partager

Métriques

Consultations de la notice

331

Téléchargements de fichiers

136