PAC-Bayesian High Dimensional Bipartite Ranking

Benjamin Guedj 1, * Sylvain Robbiano 2
* Auteur correspondant
1 MODAL - MOdel for Data Analysis and Learning
Inria Lille - Nord Europe, LPP - Laboratoire Paul Painlevé - UMR 8524, CERIM - Santé publique : épidémiologie et qualité des soins-EA 2694, Polytech Lille, Université de Lille 1, IUT’A
Abstract : This paper is devoted to the bipartite ranking problem, a classical statistical learning task, in a high dimensional setting. We propose a scoring and ranking strategy based on the PAC-Bayesian approach. We consider nonlinear additive scoring functions, and we derive non-asymptotic risk bounds under a sparsity assumption. In particular, oracle inequalities in probability holding under a margin condition assess the performance of our procedure, and prove its minimax optimality. An MCMC-flavored algorithm is proposed to implement our method, along with its behavior on synthetic and real-life datasets.
Type de document :
Pré-publication, Document de travail
2015
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01226472
Contributeur : Benjamin Guedj <>
Soumis le : mardi 10 novembre 2015 - 13:23:58
Dernière modification le : mercredi 14 février 2018 - 02:58:02
Document(s) archivé(s) le : vendredi 12 février 2016 - 17:15:02

Fichier

GuedjRobbiano2015.pdf
Fichiers produits par l'(les) auteur(s)

Licence


Distributed under a Creative Commons Paternité - Pas d'utilisation commerciale - Pas de modification 4.0 International License

Identifiants

  • HAL Id : hal-01226472, version 1

Collections

Citation

Benjamin Guedj, Sylvain Robbiano. PAC-Bayesian High Dimensional Bipartite Ranking. 2015. 〈hal-01226472〉

Partager

Métriques

Consultations de la notice

327

Téléchargements de fichiers

50