Intrinsic Dimensionality Estimation within Tight Localities

Laurent Amsaleg; Oussama Chelly; Michael E Houle; Ken-Ichi Kawarabayashi; Miloš Radovanović; Weeris Treeratanajaru

doi:10.1137/1.9781611975673.21

Communication Dans Un Congrès Année : 2019

Intrinsic Dimensionality Estimation within Tight Localities

(1) , (2) , (3) , (3) , (4) , (5)

1
2
3
4
5

Laurent Amsaleg

Fonction : Auteur
PersonId : 15318
IdHAL : laurent-amsaleg
ORCID : 0000-0003-0204-0930
IdRef : 154720879

Creating and exploiting explicit links between multimedia fragments

Oussama Chelly

Fonction : Auteur

Microsoft IoT & AI Insider Lab

Michael E Houle

Fonction : Auteur

National Institute of Informatics

Ken-Ichi Kawarabayashi

Fonction : Auteur

National Institute of Informatics

Miloš Radovanović

Fonction : Auteur

University of Novi Sad

Weeris Treeratanajaru

Fonction : Auteur

Chulalongkorn University [Bangkok]

Résumé

Accurate estimation of Intrinsic Dimensionality (ID) is of crucial importance in many data mining and machine learning tasks, including dimensionality reduction, outlier detection, similarity search and subspace clustering. However, since their convergence generally requires sample sizes (that is, neighborhood sizes) on the order of hundreds of points, existing ID estimation methods may have only limited usefulness for applications in which the data consists of many natural groups of small size. In this paper, we propose a local ID estimation strategy stable even for ‘tight’ localities consisting of as few as 20 sample points. The estimator applies MLE techniques over all available pairwise distances among the members of the sample, based on a recent extreme-value-theoretic model of intrinsic dimensionality, the Local Intrinsic Dimension (LID). Our experimental results show that our proposed estimation technique can achieve notably smaller variance, while maintaining comparable levels of bias, at much smaller sample sizes than state-of-the-art estimators.

Domaines

Informatique [cs] Multimédia [cs.MM]

Fichier principal

tight.pdf (1.1 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Laurent Amsaleg : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-02125331

Soumis le : mardi 8 décembre 2020-10:11:24

Dernière modification le : mardi 6 juin 2023-16:26:14

Archivage à long terme le : mardi 9 mars 2021-18:45:38

Dates et versions

hal-02125331 , version 1 (08-12-2020)

Licence

Paternité

Identifiants

HAL Id : hal-02125331 , version 1
DOI : 10.1137/1.9781611975673.21

Citer

Laurent Amsaleg, Oussama Chelly, Michael E Houle, Ken-Ichi Kawarabayashi, Miloš Radovanović, et al.. Intrinsic Dimensionality Estimation within Tight Localities. 2019 SIAM International conference on Data Mining, May 2019, Calgary (Alberta), Canada. pp.181-189, ⟨10.1137/1.9781611975673.21⟩. ⟨hal-02125331⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA CENTRALESUPELEC INRIA2 UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES SILECS FIT UR1-MATH-NUM

143 Consultations

130 Téléchargements

Intrinsic Dimensionality Estimation within Tight Localities

Résumé

Domaines

Dates et versions

Licence

Identifiants

Citer

Exporter

Collections

Altmetric

Partager