Estimation sur petits domaines de la fonction de répartition d'une variable censurée à l'aide de quantiles conditionnels
Résumé
L'estimation de la fonction de répartition (f.d.r.) en sondage est d'un grand intérêt pour déduire des estimateurs de paramètres classiques tels que la moyenne ou la médiane sur la population mais aussi sur une sous-population (domaine). Si un domaine est de taille suffisante, l'estimation des paramètres d'intérêt est basée sur les données relatives aux individus du domaine et les estimateurs produits sont de précision acceptable. Cependant, dans la plupart des applications, les tailles d'échantillons correspondant à des petits domaines ne sont pas suffisantes. L'estimation se fonde alors sur une information auxiliaire fournie par une covariable et de l'information est ``empruntée'' aux autres domaines. Dans ce contexte, nous proposons de nouveaux estimateurs non paramétriques de la f.d.r. sur un domaine dans le cas où la variable d'intérêt est censurée à droite. Pour cela, adaptant au cas censuré la technique de Casanova (2009), nous estimons les ordres quantiles des individus de l'ensemble des échantillons à l'aide de l'estimateur de Kaplan-Meier généralisé lissé (Leconte {\it al.}, 2002). Chaque domaine peut donc être décrit par les ordres quantiles des individus échantillonnés de ce domaine. Nous prédisons alors non paramétriquement la variable d'intérêt d'un individu hors échantillon par les quantiles conditionnels associés aux ordres qui décrivent son domaine. Ces prédictions nous permettent d'obtenir un nouvel estimateur de la f.d.r. du domaine. Des simulations comparent cette méthode avec l'estimateur de Kaplan-Meier calculé sur les points échantillonnés du domaine. Un exemple d'application à des données de durées de chômage illustre la méthode.
Domaines
Statistiques [math.ST]
Origine : Fichiers produits par l'(les) auteur(s)
Loading...