PAC-Bayesian High Dimensional Bipartite Ranking

Benjamin Guedj 1, * Sylvain Robbiano 2
* Auteur correspondant
1 MODAL - MOdel for Data Analysis and Learning
Inria Lille - Nord Europe, LPP - Laboratoire Paul Painlevé - UMR 8524, CERIM - Santé publique : épidémiologie et qualité des soins-EA 2694, Polytech Lille, Université de Lille 1, IUT’A
Abstract : This paper is devoted to the bipartite ranking problem, a classical statistical learning task, in a high dimensional setting. We propose a scoring and ranking strategy based on the PAC-Bayesian approach. We consider nonlinear additive scoring functions, and we derive non-asymptotic risk bounds under a sparsity assumption. In particular, oracle inequalities in probability holding under a margin condition assess the performance of our procedure, and prove its minimax optimality. An MCMC-flavored algorithm is proposed to implement our method, along with its behavior on synthetic and real-life datasets.
Type de document :
Article dans une revue
Journal of Statistical Planning and Inference, Elsevier, 2018, 〈10.1016/j.jspi.2017.10.010〉
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01226472
Contributeur : Benjamin Guedj <>
Soumis le : mardi 10 novembre 2015 - 13:23:58
Dernière modification le : vendredi 21 septembre 2018 - 14:24:07
Document(s) archivé(s) le : vendredi 12 février 2016 - 17:15:02

Fichier

GuedjRobbiano2015.pdf
Fichiers produits par l'(les) auteur(s)

Licence


Distributed under a Creative Commons Paternité - Pas d'utilisation commerciale - Pas de modification 4.0 International License

Identifiants

Collections

Citation

Benjamin Guedj, Sylvain Robbiano. PAC-Bayesian High Dimensional Bipartite Ranking. Journal of Statistical Planning and Inference, Elsevier, 2018, 〈10.1016/j.jspi.2017.10.010〉. 〈hal-01226472〉

Partager

Métriques

Consultations de la notice

501

Téléchargements de fichiers

62