28623 articles – 22140 Notices  [english version]

hal-00633629, version 1

A sparse version of the ridge logistic regression for large-scale text categorization

Sujeevan Aseervatham () 1, Anestis Antoniadis () 2, Éric Gaussier (Auteur à contacter de préférence) 3, Michel Burlet () 45, Yves Denneulin () 6

Pattern Recognition Letters 32, 2 (2011) 101-106

Résumé : The ridge logistic regression has successfully been used in text categorization problems and it has been shown to reach the same performance as the Support Vector Machine but with the main advantage of computing a probability value rather than a score. However, the dense solution of the ridge makes its use unpractical for large scale categorization. On the other side, LASSO regularization is able to produce sparse solutions but its performance is dominated by the ridge when the number of features is larger than the number of observations and/or when the features are highly correlated. In this paper, we propose a new model selection method which tries to approach the ridge solution by a sparse solution. The method first computes the ridge solution and then performs feature selection. The experimental evaluations show that our method gives a solution which is a good trade-off between the ridge and LASSO solutions.

  • 1 :  Laboratoire d'informatique de Paris-nord (LIPN)
  • CNRS : UMR7030 – Université Paris XIII - Paris Nord
  • 2 :  Laboratoire Jean Kuntzmann (LJK)
  • CNRS : UMR5224 – Université Joseph Fourier - Grenoble I – Université Pierre-Mendès-France - Grenoble II – Institut Polytechnique de Grenoble - Grenoble Institute of Technology
  • 3 :  Laboratoire d'Informatique de Grenoble (LIG)
  • Université Joseph Fourier - Grenoble I – Institut Polytechnique de Grenoble - Grenoble Institute of Technology – Université Pierre-Mendès-France - Grenoble II – CNRS : UMR5217
  • 4 :  Laboratoire Leibniz (Leibniz - IMAG)
  • CNRS : UMR5522 – Université Joseph Fourier - Grenoble I – Institut National Polytechnique de Grenoble (INPG)
  • 5 :  Laboratoire des sciences pour la conception, l'optimisation et la production (G-SCOP)
  • CNRS : UMR5272 – Institut National Polytechnique de Grenoble (INPG) – Université Joseph Fourier - Grenoble I
  • 6 :  MESCAL (INRIA Grenoble Rhône-Alpes / LIG laboratoire d'Informatique de Grenoble)
  • CNRS : UMR5217 – INRIA – Université Joseph Fourier - Grenoble I – Université Pierre-Mendès-France - Grenoble II – Institut polytechnique de Grenoble (Grenoble INP)
  • Domaine : Informatique/Apprentissage
    Informatique/Intelligence artificielle
  • Mots-clés : Logistic regression – Model selection – Text categorization – Large scale categorization
  • Référence interne : OSP
 
  • hal-00633629, version 1
  • oai:hal.archives-ouvertes.fr:hal-00633629
  • Contributeur : 
  • Soumis le : Lundi 15 Octobre 2012, 18:21:33
  • Dernière modification le : Mercredi 19 Décembre 2012, 14:26:43