Attention Network for 3D Object Detection in Point Clouds

Anshul Paigwar

Mémoires D'étudiants -- Hal-Inria+ Année : 2018

Attention Network for 3D Object Detection in Point Clouds

(1, 2, 3)

1
2
3

Anshul Paigwar

Fonction : Auteur
PersonId : 175930
IdHAL : anshul-paigwar
ORCID : 0000-0003-4312-5893

Robots coopératifs et adaptés à la présence humaine en environnements dynamiques

Inria Grenoble - Rhône-Alpes

Université Grenoble Alpes [2016-2019]

Résumé

Accurate detection of objects in 3D point clouds is a central problem for autonomous navigation. Most existing methods use techniques of handcrafted features representation or multi-modal approaches prone to sensor failure. Approaches like PointNet that directly operate on sparse point data have shown good accuracy in the classification of single 3D objects. However, LiDAR sensors on Autonomous vehicles generate a large scale pointcloud. Real-time object detection in such a cluttered environment still remains a challenge. In this thesis, we propose Attentional PointNet, a novel end-toend trainable deep architecture for object detection in point clouds. We extend the theory of visual attention mechanism to 3D point clouds and introduce a new recurrent 3D Spatial Transformer Network module. Rather than processing whole point cloud, the network learns "where to look" (find regions of interest), thus significantly reducing the number of points and hence, inference time. Evaluation on KITTI car detection benchmark shows that our Attentional PointNet is notably faster and achieves comparable results with state-of-the-art LiDAR-based 3D detection methods.

La détection précise d’objets dans un nuage de points 3D est un problème central pour la navigation autonome. La plupart des méthodes existantes utilisent des caractéristiques sélectionnées à la main ou des approches multimodèles sujettes à une défaillance du capteur. Des approches, telles que PointNet fonctionnant directement sur des données ponctuelles éparses, classifient précisément un nuage de points associé à un unique objet. Cependant, les capteurs Lidars sur les véhicules autonomes génèrent un nuage de points contenant de nombreux objets. Leurs détections en temps réel dans un environnement aussi encombré restent un défi. Dans cette thèse, nous proposons une méthode appelée Attentional PointNet, une architecture profonde complète, formable de bout en bout, destinée à la détection d’objets dans le nuage de points. Nous étendons la théorie du mécanisme d’attention visuelle au nuage de points 3D et introduisons un nouveau module récurrent de réseau de transformateur spatial 3D. Plutôt que de traiter le nuage de points dans sont ensemble, il apprend à reconnaître des régions potentiellement intéressantes. Ensuite, localiser des objets dans ces régions réduit considérablement le nombre de points à traiter et réduit le temps de calcul. L’évaluation avec les données du jeu de données KITTI montre que notre méthode est plus rapide et permet d’obtenir des résultats comparables avec les méthodes classiques de détection 3D utilisant des nuages de points générés par des Lidars.

Domaines

Intelligence artificielle [cs.AI] Apprentissage [cs.LG] Robotique [cs.RO] Traitement des images [eess.IV]

Fichier principal

Anshul_master_thesis_submited.pdf (15.56 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Anshul Paigwar : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-02396962

Soumis le : vendredi 6 décembre 2019-11:57:14

Dernière modification le : jeudi 4 avril 2024-21:27:59

Archivage à long terme le : samedi 7 mars 2020-14:33:54

Dates et versions

hal-02396962 , version 1 (06-12-2019)

Identifiants

HAL Id : hal-02396962 , version 1

Citer

Anshul Paigwar. Attention Network for 3D Object Detection in Point Clouds. Artificial Intelligence [cs.AI]. 2018. ⟨hal-02396962⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA INRIA INSA-LYON INRIA2 CITI INSA-GROUPE UDL

82 Consultations

408 Téléchargements

Attention Network for 3D Object Detection in Point Clouds

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager