Analyse comparative d'indices d'implication discriminants fondés sur une échelle de probabilité. - Inria - Institut national de recherche en sciences et technologies du numérique Access content directly
Reports (Research Report) Year : 2009

Analyse comparative d'indices d'implication discriminants fondés sur une échelle de probabilité.

Abstract

Historiquement, l'élaboration d'une échelle de probabilité pour éprouver l'existence d'un lien entre deux attributs descriptifs a été établie dans l'optique des tests d'hypothèses statistiques. L'adaptation au problème de la comparaison mutuelle entre plusieurs attributs nécessite une normalisation préalable ; laquelle est indispensable pour que l'échelle de probabilité reste discriminante pour un nombre n d'observations augmentant de façon considérable (n pouvant atteindre plusieurs millions). C'est le cas de l'association symétrique traduisant un “degré d'équivalence” entre attributs qui s'est présenté en premier (méthode de l' Analyse de la Vraisemblance des Liens Relationnels). Plus récemment, il s'est agi du cas de l'association dissymétrique traduisant un “degré d'implication” entre attributs, définissant ainsi ce qu'on appelle une “règle d'association”. Ce dernier cas sera étudié de façon plus accentuée ici. Différentes techniques de normalisation ont été proposées. La première est contextuelle par rapport à un ensemble potentiel de règles d'association. Elle conduit à l'Intensité d'Implication Contextuelle (IIC). La seconde raisonne par rapport à un échantillon dont la taille serait réduite à 100 et propose une Valeur Test notée VT100 pour ce niveau considéré comme symbolique de la taille d'un échantillon. Nous découvrirons différentes variantes pour une telle réduction. La troisième technique, conduisant `a l'Intensité d'Implication Entropique (IIE), mélange - par une opération de moyenne géométrique - un indice probabiliste non normalisé et un indice d'inclusion faisant appel à l'entropie de Shannon. L'objet de ce travail est l'analyse théorique et expérimentale de ces différentes approches par rapport `a différents modèles de croissance du nombre n d'observations. Une vision nouvelle et des résultats originaux seront proposés. L'analyse comparative et expérimentale utilisera la base de données bien connue “Wages”.
Fichier principal
Vignette du fichier
PI-1942.pdf (1.13 Mo) Télécharger le fichier
Origin Files produced by the author(s)
Loading...

Dates and versions

inria-00450129 , version 1 (25-01-2010)

Identifiers

  • HAL Id : inria-00450129 , version 1

Cite

Israël-César C. Lerman, Sylvie Guillaume. Analyse comparative d'indices d'implication discriminants fondés sur une échelle de probabilité.. [Rapport de recherche] PI 1942, 2009, pp.72. ⟨inria-00450129⟩
223 View
101 Download

Share

Gmail Mastodon Facebook X LinkedIn More