Estimation du paramétre de distribution de la distribution binomiale négative: A priori, effort d'échantillonnage, et information

Lise Vaudor 1
Résumé : Résumé La distribution binomiale négative est fréquemment utilisée pour modéliser la distribution des données d'abondance surdispersées. De ce fait, l'ajustement de la binomiale négative aux données d'abondance et l'estimation de ses paramètres est un enjeu majeur pour de très nombreuses études en écologie, épidémiologie, actuariat, etc. qui reposent sur des données de ce type. L'estimation des paramètres de la binomiale négative, et en particulier de son paramètre de dispersion est néanmoins problématique, car les estimateurs disponibles sont biaisés et peu efficaces, notamment lorsque les échantillons sont petits, que l'espérance de l'abondance est faible, et que sa variance est forte. Dans cette étude, nous tentons d'identifier la source de ces problèmes d'estimation. Pour ce faire, nous utilisons l'entropie (Shannon, 1949) pour quantifier l'information qu'apportent les échantillons sur la dispersion, en fonction des caractéristiques de ces échantillons (taille, moyenne), et des valeurs réelles des paramètres de la binomiale négative. On montre ainsi que le nombre total d'individus observés est un facteur clé de la qualité de l'estimation, et que pour un effort d'échantillonnage donné l'estimation de la dispersion est vraisemblablement très peu fiable si la dispersion réelle se situe dans des gammes de valeurs extrêmes (notamment des valeurs fortes). Abstract The negative binomial distribiution is frequently used to model overdispersed count data. Adjusting the negative binomial and estimating its parameters is thus a major concern in ecology, epidemiology, actuaries, etc. that often deal with that type of data. However, the estimation of the parameters of the negative binomial, and the estimation of its dispersion parameter in particular, are often a problematic issue because available estimators are biased and have low efficiency. In particular, if samples are small, if the expected value of the distribution is low, or if its variance is high, the estimators are particularly unreliable. In this study, we try to identify the reasons behind these estimation problems. To do this, we use entropy (Shannon, 1949) to quantify the information about dispersion that the samples provide. Entropy depends on the characteristics of the samples (size, mean) and of the real values of the parameters of the negative binomial. We show that the total number of individuals observed in a sample is a key driver of estimation quality. We also highlight the fact that for a given sampling effort the estimation of dispersion is likely to be really unreliable if the real value of dispersion lies in extremes ranges of values (notably, high values).
Type de document :
Communication dans un congrès
42èmes Journées de Statistique, 2010, Marseille, France, France. 2010
Liste complète des métadonnées

Littérature citée [3 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00494849
Contributeur : Conférence Sfds-Hal <>
Soumis le : jeudi 24 juin 2010 - 08:59:44
Dernière modification le : jeudi 24 juin 2010 - 08:59:44
Document(s) archivé(s) le : lundi 27 septembre 2010 - 11:46:16

Fichier

p215.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00494849, version 1

Collections

Citation

Lise Vaudor. Estimation du paramétre de distribution de la distribution binomiale négative: A priori, effort d'échantillonnage, et information. 42èmes Journées de Statistique, 2010, Marseille, France, France. 2010. 〈inria-00494849〉

Partager

Métriques

Consultations de la notice

201

Téléchargements de fichiers

402