Contribution to Panoptic Segmentation - Archive ouverte HAL Access content directly
Reports (Technical Report) Year : 2019

Contribution to Panoptic Segmentation

Contribution au Segmentation Panoptique

Abstract

Full visual scene understanding has always been one of the main goals of machine perception. The ability to describe the components of a scene using only information taken by a digital camera has been the main focus of computer vision tasks such as semantic segmentation and instance segmentation. Where by using Deep Learning techniques, a neural network is capable to assign a label to each pixel of an image (semantic segmentation) or define the boundaries of an instance or object with more precision than a bounding box (instance segmentation). The task of Panoptic Segmentation tries to achieve a full scene description by merging semantic and instance segmentation information and leveraging the strengths of these two tasks. On this report it is shown a possible alternative to solve this merging problem by using Convolutional Neural Networks (CNNs) to refine the boundaries between each class.
La compréhension visuelle complète de la scène a toujours été l’un des objectifs principaux de la perception de la machine. La capacité à décrire les composants d’une scène en utilisant uniquement les informations prises par un appareil photo numérique a été le principal objectif des tâches de vision par ordinateur telles que la segmentation sémantique et la segmentation d’instances. En utilisant des techniques d’apprentissage en profondeur, un réseau de neurones est capable d’attribuer une étiquette à chaque pixel d’une image (segmentation sémantique) ou de définir les limites d’une instance ou d’un objet avec plus de précision que le cadre de sélection (segmentation d’instance). La tâche de segmentation panoptique proposée par Kirillov et. al tente d’obtenir une description complète de la scène en fusionnant les informations de segmentation sémantique et par instance et en exploitant les points forts de ces deux tâches. Ce rapport indique une alternative possible pour résoudre ce problème de fusion en utilisant des réseaux de neurones à convolution (CNN) pour affiner les limites entre chaque classe.
Fichier principal
Vignette du fichier
RT_0506_v1.1.pdf (1.36 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-02300774 , version 1 (03-10-2019)
hal-02300774 , version 2 (09-02-2021)

Identifiers

  • HAL Id : hal-02300774 , version 2

Cite

Manuel Alejandro Diaz-Zapata. Contribution to Panoptic Segmentation. [Technical Report] RT-0506, Inria; Universidad Autónoma de Occidente. 2019. ⟨hal-02300774v2⟩
360 View
307 Download

Share

Gmail Facebook Twitter LinkedIn More