Analyse comparative d'indices d'implication discriminants fond´es sur une échelle de probabilité - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2010

Analyse comparative d'indices d'implication discriminants fond´es sur une échelle de probabilité

Résumé

Historiquement, l'élaboration d'une échelle de probabilité pour éprouver l'existence d'un lien entre deux attributs descriptifs a été établie dans l'optique des tests d'hypothèses statistiques. L'adaptation au problème de la comparaison mutuelle entre plusieurs attributs nécessite une normalisation préalable ; laquelle est indispensable pour que l'échelle de probabilité reste discriminante pour un nombre n d'observations augmentant de façon considérable (n pouvant atteindre plusieurs millions). C'est le cas de l'association symétrique traduisant un “degré d'équivalence” entre attributs qui s'est présenté en premier. Plus récemment, il s'est agi du cas de l'association dissymétrique traduisant un “degré d'implication” entre attributs, définissant ainsi ce qu'on appelle une “règle d'association”. Ce dernier cas sera étudié de façon plus accentuée ici. Différentes techniques de normalisation ont été proposées. La première est contextuelle par rapport à un ensemble potentiel de règles d'association. Elle conduit à l'Intensité d'Implication Contextuelle (IIC). La seconde raisonne par rapport à un échantillon dont la taille serait réduite à 100 et propose une Valeur Test notée VT100. Nous découvrirons différentes variantes pour une telle réduction. La troisième technique, conduisant à l'Intensité d'Implication Entropique (IIE), mélange un indice probabiliste non normalisé et un indice d'inclusion faisant appel à l'entropie de Shannon. L'objet de ce travail est l'analyse théorique et expérimentale de ces différentes approches par rapport à différents modèles de croisance du nombre n d'observations. Une vision nouvelle et des résultats originaux seront proposés. L'analyse comparative et expérimentale utilisera la base de données bien connues “Wages”.
Fichier principal
Vignette du fichier
RR-7187.pdf (862.01 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

inria-00451952 , version 1 (04-02-2010)

Identifiants

  • HAL Id : inria-00451952 , version 1

Citer

Israël-César C. Lerman, Sylvie Guillaume. Analyse comparative d'indices d'implication discriminants fond´es sur une échelle de probabilité. [Rapport de recherche] RR-7187, INRIA. 2010, pp.88. ⟨inria-00451952⟩
151 Consultations
62 Téléchargements

Partager

Gmail Facebook X LinkedIn More