Méthodes de détection des unités atypiques:Cas des enquêtes structurelles ukrainiennes
Résumé
Le problème de la détection d'unités atypiques ou de valeurs extrêmes est général et très ancien. Il se pose à tous ceux qui ont à analyser des données réelles. De nombreuses méthodes algébriques, graphiques ou probabilistes existent pour détecter les valeurs extrêmes (« outliers ») sur une variable. Dans cette présentation, deux nouvelles méthodes non paramétriques simples de détection des unités atypiques dans le cadre univarié sont proposées. La première dans le domaine de la V-robustesse permet de tenir compte de l'éloignement de l'observation par rapport au centre de la distribution et de la forme de la fin de la distribution. Et la seconde, basée sur une statistique du coefficient de variation, permet d'accentuer le caractère atypique des unités et de mesurer l'effet d'une unité atypique sur la qualité de l'information. De plus, une troisième méthode, obtenue comme combinaison convexe de deux techniques de la théorie des valeurs extrêmes, en minimisant la variance, est également proposée, permettant ainsi de décider entre différentes stratégies. Ces différentes méthodes sont comparées sur des données des enquêtes structurelles ukrainiennes. Il n'existe pas de méthodes universelles. Les différentes méthodes paramétriques ou non paramétriques ne permettent pas toujours de trancher sur le nombre d'unités atypiques à retenir, mais elles peuvent déterminer très rapidement une stratégie haute (très peu d'entreprises atypiques) et une stratégie basse de détection des unités atypiques. Il est nécessaire d'utiliser une technique facile à mettre en production.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...