Fast imbalanced binary classification: a moment-based approach - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2014

Fast imbalanced binary classification: a moment-based approach

Résumé

In this paper, we consider the problem of imbalanced binary classification in which the number of negative examples is much larger than the number of positive examples. The two mainstream methods to deal with such problems are to assign different weights to negative and positive points or to subsample points from the negative class. In this paper, we propose a different approach: we represent the negative class by the two first moments of its probability distribution (the mean and the covariance), while still modeling the positive class by individual examples. Therefore, our formulation does not depend on the number of negative examples, making it suitable to highly imbalanced problems and scalable to large datasets. We demonstrate empirically, on a protein classification task and a text classification task, that our approach achieves similar statistical performance than the two mainstream approaches to imbalanced classification problems, while being more computationally efficient.
Fichier principal
Vignette du fichier
tech_report.pdf (285.25 Ko) Télécharger le fichier
geom.pdf (8.42 Ko) Télécharger le fichier
phost.pdf (18.95 Ko) Télécharger le fichier
phosy.pdf (19.46 Ko) Télécharger le fichier
topic2.pdf (19.3 Ko) Télécharger le fichier
topic25.pdf (18.89 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01087452 , version 1 (26-11-2014)

Identifiants

  • HAL Id : hal-01087452 , version 1

Citer

Edouard Grave, Laurent El Ghaoui. Fast imbalanced binary classification: a moment-based approach. 2014. ⟨hal-01087452⟩
353 Consultations
3662 Téléchargements

Partager

Gmail Facebook X LinkedIn More