Cameras, Shapes, and Contours: Geometric Models in Computer Vision

Matthew Trager

Thèse Année : 2018

Cameras, Shapes, and Contours: Geometric Models in Computer Vision

Caméras, formes et contours: modèles géométriques en vision par ordinateur

(1)

Matthew Trager

Fonction : Auteur
PersonId : 966520

Models of visual object recognition and scene understanding

Résumé

This thesis studies mathematical models for describing the geometry of imaging processes in computer vision. Our approach is rooted in the language of projective geometry, which provides the most general setting for studying properties of lines and incidences that are at the heart of geometric vision. We also apply some tools from algebraic geometry, since many of the objects that we encounter are described by polynomial equations. For example, the multi-view geometry of $n$ pinhole cameras (or in fact any type of cameras) can be encoded in the "joint image", that is an algebraic variety in $(\mathbb P^2)^n$ formed by all point correspondences. The Grassmannian of lines ${\rm Gr}(1,\mathbb P^3)$ also plays a central role in our study. In particular, surfaces in the Grassmannian (or "line congruences") can be used to represent abstract cameras, that are mappings from points to viewing lines. In addition to modeling cameras, we investigate the relationship between 3D shapes and their images. For arbitrary sets projecting onto opaque silhouettes, the image is determined by the set of viewing lines that meet the observed object; for smooth surfaces, the "image contour" is determined by the set viewing lines that are tangent to the surface. This perspective is applied to the study of "visual hulls" and "visual events".

Cette thèse étudie les modèles mathématiques destinés à décrire la géométrie des processus d’imagerie en vision par ordinateur. Notre approche est enracinée dans le langage de la géométrie projective, qui fournit le cadre le plus général pour l’étude des propriétés des lignes et des incidences qui sont au cœur de la vision géométrique. Nous appliquons également des outils de la géométrie algébrique, car la plupart des objets que nous rencontrons sont décrits par des équations polynomiales. Par exemple, la géométrie de n caméras peut être encodée dans une variété algébrique en $(\mathbb P^2)^n$ formée par les correspondances de points. La Grassmannienne des lignes ${\rm Gr}(1,\mathbb P^3)$ joue également un rôle central dans notre étude. Les surfaces en ${\rm Gr}(1,\mathbb P^3)$ (ou “congruences”) peuvent par example être utilisées pour représenter des caméras abstraites, qui associent des points à des lignes. Nous étudions aussi la relation entre les formes 3D et leurs images. En particulier, pour les ensembles arbitraires se projetant sur des silhouettes, l’image est déterminée par l’ensemble des lignes qui rencontrent l’objet observé ; pour les surfaces lisses, le “contour visuel” est déterminé par les lignes qui sont tangentes à la surface. Cette perspective est appliquée dans l’étude des "coques visuelles" et des "événements visuels".

Mots clés

Projective geometry Geometric models

Modèles géométriques Silhouettes Géométrie projective Caméras Contours visuels

Domaines

Vision par ordinateur et reconnaissance de formes [cs.CV] Géométrie algébrique [math.AG]

Fichier principal

main.pdf (15.18 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Matthew Trager : Connectez-vous pour contacter le contributeur

https://inria.hal.science/tel-01856415

Soumis le : lundi 3 septembre 2018-17:29:50

Dernière modification le : lundi 11 décembre 2023-11:31:17

Archivage à long terme le : mardi 4 décembre 2018-18:25:45

Dates et versions

tel-01856415 , version 1 (11-08-2018)

tel-01856415 , version 2 (03-09-2018)

Identifiants

HAL Id : tel-01856415 , version 2

Citer

Matthew Trager. Cameras, Shapes, and Contours: Geometric Models in Computer Vision. Computer Vision and Pattern Recognition [cs.CV]. Ecole Normale Superieure de Paris - ENS Paris, 2018. English. ⟨NNT : ⟩. ⟨tel-01856415v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENS-PARIS CNRS INRIA INSMI THESES-ENS INRIA2 PSL

621 Consultations

450 Téléchargements

Cameras, Shapes, and Contours: Geometric Models in Computer Vision

Caméras, formes et contours: modèles géométriques en vision par ordinateur

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager