Skip to Main content Skip to Navigation
Conference papers

Évolution de la stabilité de la sélection de variables en fonction de la taille d'échantillon et de la dimension

Résumé : La sélection de variables est une étape importante lors de la construction d'un classificateur sur des données de grande dimension. Lorsque le nombre d'obser- vations est faible, cette sélection a tendance à être instable, au point qu'il est courant d'observer que sur deux jeux de données différents mais traitant d'un problème simi- laire, les variables sélectionnées ne se recoupent presque pas. Pourtant, ce problème de la stabilité semble encore peu étudié. Dans cet article, nous présentons des méthodes de quantification de la stabilité, puis nous en étudions les variations en fonction de divers paramètres (dimensionalité, nombre d'observations, distribution des variables, seuil de sélection) sur des données artificielles, avant de réaliser ces mesures sur des données réelles d'expression génique (données puces).
Document type :
Conference papers
Complete list of metadata

Cited literature [12 references]  Display  Hide  Download

https://hal.inria.fr/hal-00745462
Contributor : Laurent Bougrain <>
Submitted on : Thursday, October 25, 2012 - 3:21:57 PM
Last modification on : Wednesday, December 9, 2020 - 3:16:29 PM
Long-term archiving on: : Saturday, January 26, 2013 - 4:30:11 AM

File

cap2012_submission_9.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00745462, version 1

Citation

David Dernoncourt, Blaise Hanczar, Jean-Daniel Zucker. Évolution de la stabilité de la sélection de variables en fonction de la taille d'échantillon et de la dimension. Conférence Francophone sur l'Apprentissage Automatique - CAp 2012, Laurent Bougrain, May 2012, Nancy, France. 16 p. ⟨hal-00745462⟩

Share

Metrics

Record views

852

Files downloads

276