Bandits Warm-up Cold Recommender Systems - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2014

Bandits Warm-up Cold Recommender Systems

Résumé

We address the cold start problem in recommendation systems assuming no contextual information is available neither about users, nor items. We consider the case in which we only have access to a set of ratings of items by users. Most of the existing works consider a batch setting, and use cross-validation to tune parameters. The classical method consists in minimizing the root mean square error over a training subset of the ratings which provides a factorization of the matrix of ratings, interpreted as a latent representation of items and users. Our contribution in this paper is 5-fold. First, we explicit the issues raised by this kind of batch setting for users or items with very few ratings. Then, we propose an online setting closer to the actual use of recommender systems; this setting is inspired by the bandit framework. The proposed methodology can be used to turn any recommender system dataset (such as Netflix, MovieLens,...) into a sequential dataset. Then, we explicit a strong and insightful link between contextual bandit algorithms and matrix factorization; this leads us to a new algorithm that tackles the exploration/exploitation dilemma associated to the cold start problem in a strikingly new perspective. Finally, experimental evidence confirm that our algorithm is effective in dealing with the cold start problem on publicly available datasets. Overall, the goal of this paper is to bridge the gap between recommender systems based on matrix factorizations and those based on contextual bandits.
Nous nous intéressons au problème du démarrage à froid dans les systèmes de recommendation. Nous supposons ne disposer d'aucune information, que ce soit à propos des utilisateurs ou des produits. Nous considérons le cas où nous n'avons accès qu'à un ensemble de notes données à des produits par des utilisateurs. La plupart des travaux concernant ce problème considèrent une approche par lôts et utilisent la validation croisée pour régler les paramètres. La méthode classique consiste à réaliser une décomposition de faible rang de la matrice des notes en minimisant l'erreur quadratique moyenne sur un sous-ensemble des notes disponibles. Cette factorisation est interprêtée comme exhibant des facteurs latents décrivant les produits et les utilisateurs. Dans ce rapport, notre contribution concerne 5 points. Tout d'abord, nous explicitons les problèmes posés par ce type d'approches par lôt pour des utilisateurs ou des produits ayant très peu de notes qui leur sont associées (utilisateurs et produits froids). Ensuite, nous proposons une approche séquentielle qui se rapproche fortement du mode d'utilisation réelle des systèmes de recommendation. Cette approche est inspirée par le problème du bandit multi-bras. Cette méthodologie permet de transformer tout jeu de données issu d'un système de recommendation (tels Netflix, MovieLens, ...) en un jeu de données séquentiel. Alors, nous explicitons une forte connexion entre les bandits contextuels et la factorisation de matrices~; nous pensons que la mise à jour de cette relation est la contribution conceptuelle essentielle de ce rapport~; cette relation éclaire cette problématique d'un jour nouveau. Cela nous amène à un nouvel algorithme qui prend en charge le dilemme exploration/exploitation existant dans le problème du démarrage à froid. Finalement, une étude expérimentale de cet algorithme montre que l'approche fonctionne efficacement pour gérer le démarrage à froid sur des jeux de données disponibles publiquement. Pour résumer nos contributions en une phrase, l'objectif de ce rapport est de mettre à jour un pont entre les systèmes de recommendation basés sur la factorisation de matrices d'une part, les bandits contextuels d'autre part.
Fichier principal
Vignette du fichier
RR-8563.pdf (1.52 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01022628 , version 1 (10-07-2014)

Identifiants

Citer

Jérémie Mary, Romaric Gaudel, Philippe Preux. Bandits Warm-up Cold Recommender Systems. [Research Report] RR-8563, INRIA Lille; INRIA. 2014, pp.18. ⟨hal-01022628⟩
281 Consultations
291 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More