Cameras, Shapes, and Contours: Geometric Models in Computer Vision - Archive ouverte HAL Access content directly
Theses Year : 2018

Cameras, Shapes, and Contours: Geometric Models in Computer Vision

Caméras, formes et contours: modèles géométriques en vision par ordinateur

(1)
1

Abstract

This thesis studies mathematical models for describing the geometry of imaging processes in computer vision. Our approach is rooted in the language of projective geometry, which provides the most general setting for studying properties of lines and incidences that are at the heart of geometric vision. We also apply some tools from algebraic geometry, since many of the objects that we encounter are described by polynomial equations. For example, the multi-view geometry of $n$ pinhole cameras (or in fact any type of cameras) can be encoded in the "joint image", that is an algebraic variety in $(\mathbb P^2)^n$ formed by all point correspondences. The Grassmannian of lines ${\rm Gr}(1,\mathbb P^3)$ also plays a central role in our study. In particular, surfaces in the Grassmannian (or "line congruences") can be used to represent abstract cameras, that are mappings from points to viewing lines. In addition to modeling cameras, we investigate the relationship between 3D shapes and their images. For arbitrary sets projecting onto opaque silhouettes, the image is determined by the set of viewing lines that meet the observed object; for smooth surfaces, the "image contour" is determined by the set viewing lines that are tangent to the surface. This perspective is applied to the study of "visual hulls" and "visual events".
Cette thèse étudie les modèles mathématiques destinés à décrire la géométrie des processus d’imagerie en vision par ordinateur. Notre approche est enracinée dans le langage de la géométrie projective, qui fournit le cadre le plus général pour l’étude des propriétés des lignes et des incidences qui sont au cœur de la vision géométrique. Nous appliquons également des outils de la géométrie algébrique, car la plupart des objets que nous rencontrons sont décrits par des équations polynomiales. Par exemple, la géométrie de n caméras peut être encodée dans une variété algébrique en $(\mathbb P^2)^n$ formée par les correspondances de points. La Grassmannienne des lignes ${\rm Gr}(1,\mathbb P^3)$ joue également un rôle central dans notre étude. Les surfaces en ${\rm Gr}(1,\mathbb P^3)$ (ou “congruences”) peuvent par example être utilisées pour représenter des caméras abstraites, qui associent des points à des lignes. Nous étudions aussi la relation entre les formes 3D et leurs images. En particulier, pour les ensembles arbitraires se projetant sur des silhouettes, l’image est déterminée par l’ensemble des lignes qui rencontrent l’objet observé ; pour les surfaces lisses, le “contour visuel” est déterminé par les lignes qui sont tangentes à la surface. Cette perspective est appliquée dans l’étude des "coques visuelles" et des "événements visuels".
Fichier principal
Vignette du fichier
main.pdf (15.18 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

tel-01856415 , version 1 (11-08-2018)
tel-01856415 , version 2 (03-09-2018)

Identifiers

  • HAL Id : tel-01856415 , version 2

Cite

Matthew Trager. Cameras, Shapes, and Contours: Geometric Models in Computer Vision. Computer Vision and Pattern Recognition [cs.CV]. Ecole Normale Superieure de Paris - ENS Paris, 2018. English. ⟨NNT : ⟩. ⟨tel-01856415v2⟩
552 View
378 Download

Share

Gmail Facebook Twitter LinkedIn More