A Comparative study of sample selection methods for classification

Résumé : L’échantillonnage pour le minage de large ensemble de données est important pour au moins deux raisons. Le traitement de grande quantité de données a pour résultat une augmentation de la complexité informatique. Le coût de cette complexité additionnelle pourrait être non justifiable. D’autre part, l’utilisation de petits échantillons a pour résultat des calculs rapides et efficaces pour les algorithmes de minage de données. Les méthodes de statistique pour obtenir des échantillons d’ensemble de donnés satisfaisants pour les problèmes de classification sont discutées dans ce papier. Des résultats sont présentés pour une étude empirique basée sur l’utilisation d’échantillonnage aléatoire séquentiel et l’évaluation d’échantillon utilisant le test d’hypothèse univariée et une mesure théorétique de l’information. Des comparaisons sont faites entre des estimations théoriques et empiriques
Type de document :
Article dans une revue
Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées, INRIA, 2007, 6, pp.69--85
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01262348
Contributeur : Coordination Episciences Iam <>
Soumis le : mardi 26 janvier 2016 - 16:05:10
Dernière modification le : lundi 18 avril 2016 - 16:39:57
Document(s) archivé(s) le : mercredi 27 avril 2016 - 13:20:57

Fichier

arima00606.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01262348, version 1

Collections

Citation

Patricia E.N. Lutu, Andries P. Engelbrecht. A Comparative study of sample selection methods for classification. Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées, INRIA, 2007, 6, pp.69--85. 〈hal-01262348〉

Partager

Métriques

Consultations de la notice

103

Téléchargements de fichiers

197