Nonparametric methods for learning and detecting multivariate statistical dissimilarity

Alix Lhéritier 1
1 ABS - Algorithms, Biology, Structure
CRISAM - Inria Sophia Antipolis - Méditerranée
Résumé : Cette thèse présente trois contributions en lien avec l'apprentissage et la détection de dissimilarité statistique multivariée, problématique d'importance primordiale pour de nombreuses méthodes d'apprentissage utilisées dans un nombre croissant de domaines. La première contribution introduit la notion de taille d'effet multivariée non-paramétrique, éclairant la nature de la dissimilarité détectée entre deux jeux de données, en deux étapes. La première consiste en une décomposition d'une mesure de dissimilarité (divergence de Jensen-Shannon) visant à la localiser dans l'espace ambiant, tandis que la seconde génère un résultat facilement interprétable en termes de grappes de points de forte discrépance et en proximité spatiale. La seconde contribution présente le premier test non-paramétrique d'homogénéité séquentiel, traitant les données issues de deux jeux une à une--au lieu de considérer ceux-ci- in extenso. Le test peut ainsi être arrêté dès qu'une évidence suffisamment forte est observée, offrant une flexibilité accrue tout en garantissant un contrôle del'erreur de type I. Sous certaines conditions, nous établissons aussi que le test a asymptotiquement une probabilité d'erreur de type II tendant vers zéro. La troisième contribution consiste en un test de détection de changement séquentiel basé sur deux fenêtres glissantes sur lesquelles un test d'homogénéité est effectué, avec des garanties sur l'erreur de type I. Notre test a une empreinte mémoire contrôlée et, contrairement à des méthodes de l'état de l'art qui ont aussi un contrôle sur l'erreur de type I, a une complexité en temps constante par observation, le rendant adapté aux flux de données.
Type de document :
Thèse
Other [cs.OH]. Université Nice Sophia Antipolis, 2015. English. 〈NNT : 2015NICE4072〉
Liste complète des métadonnées

Littérature citée [135 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01245946
Contributeur : Abes Star <>
Soumis le : vendredi 25 mars 2016 - 12:28:09
Dernière modification le : jeudi 11 janvier 2018 - 16:47:56

Fichier

2015NICE4072.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01245946, version 2

Collections

Citation

Alix Lhéritier. Nonparametric methods for learning and detecting multivariate statistical dissimilarity. Other [cs.OH]. Université Nice Sophia Antipolis, 2015. English. 〈NNT : 2015NICE4072〉. 〈tel-01245946v2〉

Partager

Métriques

Consultations de la notice

226

Téléchargements de fichiers

247