Transfert de connaissance pour la compréhension des images

Praveen Kulkarni

Thèse Année : 2017

Knowledge transfer for image understanding

Transfert de connaissance pour la compréhension des images

(1)

Praveen Kulkarni

Fonction : Auteur

Equipe Image - Laboratoire GREYC - UMR6072

Résumé

Knowledge transfer is a promising solution for the difficult problem of training deep convolutional neural nets (CNNs) using only small size training datasets with a high intra-class visual variability. In this thesis work, we explore this paradigm to extend the ability of state-of-the-art CNNs for image classification.First, we propose several effective techniques to reduce the training and test-time computational burden associated to CNNs:(i) Using a hybrid method to combine conventional, unsupervised aggregators such as Bag-of-Words (BoW) with CNNs;(ii) Introducing a novel pooling methods within a CNN framework along with non-linear part-based models. The key contribution lies in a technique able to discover useful regions per image involved in the pooling of local representations;In addition, we also propose a novel method to learn the structure of weights in deep neural networks. Experiments are run on challenging datasets with comparisons against state-of-the-art methods. The methods proposed are shown to generalize to different visual recognition tasks, such as object, scene or action classification.

Le Transfert de Connaissance (Knowledge Transfer or Transfer Learning) est une solution prometteuse au difficile problème de l’apprentissage des réseaux profonds au moyen de bases d’apprentissage de petite taille, en présence d’une grande variabilité visuelle intra-classe. Dans ce travail, nous reprenons ce paradigme, dans le but d’étendre les capacités des CNN les plus récents au problème de la classification. Dans un premier temps, nous proposons plusieurs techniques permettant, lors de l’apprentissage et de la prédiction, une réduction des ressources nécessaires – une limitation connue des CNN. (i) En utilisant une méthode hybride combinant des techniques classiques comme des Bag-Of-Words (BoW) avec des CNN. (iv) En introduisant une nouvelle méthode d’agrégation intégrée à une structure de type CNN ainsi qu’un modèle non-linéaire s’appuyant sur des parties de l’image. La contribution clé est, finalement, une technique capable d’isoler les régions des images utiles pour une représentation locale. De plus, nous proposons une méthode nouvelle pour apprendre une représentation structurée des coefficients des réseaux de neurones. Nous présentons des résultats sur des jeux de données difficiles, ainsi que des comparaisons avec des méthodes concurrentes récentes. Nous prouvons que les méthodes proposées s’étendent à d’autres tâches de reconnaissance visuelles comme la classification d’objets, de scènes ou d’actions.

Mots clés

Computer Vision Machine Learning Image Classification Transfer Learning Part-Based Models

Apprentissage Machine Classification d’Images Transfer de connaissances Modèles à Parties

Domaines

Traitement des images [eess.IV]

Fichier principal

2017-KULKARNI-PRAVEEN-VAC.pdf (5.31 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-01565857

Soumis le : jeudi 20 juillet 2017-12:35:05

Dernière modification le : mercredi 20 mars 2024-16:20:04

Dates et versions

tel-01565857 , version 1 (20-07-2017)

Identifiants

HAL Id : tel-01565857 , version 1

Citer

Praveen Kulkarni. Transfert de connaissance pour la compréhension des images. Traitement des images [eess.IV]. Normandie Université, 2017. Français. ⟨NNT : 2017NORMC207⟩. ⟨tel-01565857⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS STAR GREYC GREYC-IMAGE COMUE-NORMANDIE THESES-NU ENSICAEN UNICAEN

920 Consultations

321 Téléchargements

Knowledge transfer for image understanding

Transfert de connaissance pour la compréhension des images

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager