Skip to Main content Skip to Navigation
Conference papers

Apport de l'ACP probabiliste pour la gestion des données manquantes en ACP

Résumé : Dans cette présentation, nous nous intéressons à la gestion des données manquantes en Analyse en Composantes Principales (ACP). Une solution classique pour réaliser une ACP sur données incomplètes consiste à chercher les axes et les composantes qui minimisent l'erreur de reconstitution sur les données présentes. Pour ce faire, différents algorithmes ont été proposés dans la littérature dont une approche par moindres carrés alternés pondérés et une approche par ACP itérative. Cette dernière consiste en une imputation itérative des données au cours du processus d'estimation et s'apparente à un algorithme EM d'un modèle particulier. Nous détaillons dans un premier temps ces deux algorithmes et donnons leurs propriétés. Nous évoquons ensuite les difficultés rencontrées par ces algorithmes pour nous focaliser sur le problème de surajustement. Puis nous montrons comment la formulation probabiliste de l'ACP (Bishop et Tipping, 1997) offre un terme de régularisation adapté pour pallier au surajustement. Enfin, les performances de ces algorithmes sont évaluées à partir de simulations et d'exemples réels.
Complete list of metadata

Cited literature [13 references]  Display  Hide  Download

https://hal.inria.fr/inria-00386758
Contributor : Conférence Jds2009 <>
Submitted on : Friday, May 22, 2009 - 9:18:42 AM
Last modification on : Thursday, January 7, 2021 - 4:20:32 PM
Long-term archiving on: : Monday, October 15, 2012 - 10:56:32 AM

File

p198.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00386758, version 1

Citation

Julie Josse, François Husson, Jérome Pagès. Apport de l'ACP probabiliste pour la gestion des données manquantes en ACP. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. ⟨inria-00386758⟩

Share

Metrics

Record views

779

Files downloads

1136