Détection de logos pour l'annotation d'images de presse

Pierre Tirilly; Vincent Claveau; Patrick Gros

Communication Dans Un Congrès Année : 2010

Détection de logos pour l'annotation d'images de presse

(1) , (1) , (1)

Pierre Tirilly

Fonction : Auteur
PersonId : 5896
IdHAL : pierretirilly
ORCID : 0000-0003-2675-8023
IdRef : 133245497

Multimedia content-based indexing

Vincent Claveau

Fonction : Auteur correspondant
PersonId : 5270
IdHAL : vincent-claveau
ORCID : 0000-0002-3459-0550
IdRef : 075988216

Connectez-vous pour contacter l'auteur

Multimedia content-based indexing

Patrick Gros

Fonction : Auteur
PersonId : 894
IdHAL : patrick-gros
IdRef : 075986604

Multimedia content-based indexing

Résumé

In this paper, we propose a new method to annotate news images. To avoid the semantic gap problem due to the use of low-level visual features, we associate high-level visual features (presence of logos and panels) and high-level textual features (a subset of named entities). In one part, we propose a logo and panel detector based on the bag of visual words model as it was proposed by Sivic and Zisserman [1]. The descriptors provided by this model are well suited to the detection of this kind of objects. Our detector requires only a simple learning stage (training data obtained easily, little computation time) and detects logos quickly with a good precision. We evaluate the detector on 413 images from a news corpus. In a second part, we present our annotation method. We associate images that contain logos or panels and some named entities extracted from the news text coming with the images. This annotation method is very fast and is fitted to large-scale applications. We evaluate it on a news corpus that contains more than 40,000 images.

Dans cet article, nous proposons une méthode d'annotation d'images tirées d'un corpus d'articles de presse. Pour contourner le problème du fossé sémantique posé par l'utilisation de descripteurs de bas-niveau, nous mettons en relation des indices visuels de haut-niveau extraits des images (présence de logos ou de panneaux) et des indices textuels issus de l'analyse du texte des articles (un sousensemble des entités nommées – noms d'entreprises. . .–). Dans un premier temps, nous proposons un détecteur de logos et de panneaux reposant sur le modèle des mots visuels proposé par Sivic et Zisserman [1], dont les descripteurs sont particulièrement adaptés à la détection de ce type d'objets. Notre détecteur ne nécessite qu'une phase d'apprentissage légère (données faciles à obtenir, peu de temps de calcul), et permet de détecter les logos de manière rapide et avec une bonne précision. Nous l'évaluons sur 413 images extraites du corpus initial d'articles de presse. Dans un second temps, nous présentons la méthode d'annotation d'images. Nous associons aux images où sont détectés des logos les entités nommées extraites de l'article accompagnant l'image et susceptibles de décrire ces logos. Nous montrons que cette méthode d'annotation est rapide et ne pose pas de problèmes de passage à l'échelle. Nous l'évaluons sur le corpus d'articles de presse complet, qui contient plus de 40000 images.

Mots clés

Logo detection board detection visual words image annotation named entities text-image indexing

Domaines

Vision par ordinateur et reconnaissance de formes [cs.CV]

Fichier principal

Tirilly-et-al-RFIA2010.pdf (320.83 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Patrick Gros : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00561796

Soumis le : mardi 1 février 2011-19:18:40

Dernière modification le : vendredi 24 mars 2023-14:52:54

Archivage à long terme le : mardi 6 novembre 2012-13:10:32

Dates et versions

inria-00561796 , version 1 (01-02-2011)

Identifiants

HAL Id : inria-00561796 , version 1

Citer

Pierre Tirilly, Vincent Claveau, Patrick Gros. Détection de logos pour l'annotation d'images de presse. Congrès francophone AFRIF-AFIA de reconnaissance de formes et d'intelligence artificielle, RFIA'10, AFRIF - AFIA, Jan 2010, Caen, France. ⟨inria-00561796⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

EC-PARIS UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA AFIA IRISA-D6 INRIA2 UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES INSA-GROUPE UR1-MATH-NUM

243 Consultations

223 Téléchargements

Détection de logos pour l'annotation d'images de presse

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager