Détection de logos pour l'annotation d'images de presse - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Détection de logos pour l'annotation d'images de presse

Pierre Tirilly
Patrick Gros

Résumé

In this paper, we propose a new method to annotate news images. To avoid the semantic gap problem due to the use of low-level visual features, we associate high-level visual features (presence of logos and panels) and high-level textual features (a subset of named entities). In one part, we propose a logo and panel detector based on the bag of visual words model as it was proposed by Sivic and Zisserman [1]. The descriptors provided by this model are well suited to the detection of this kind of objects. Our detector requires only a simple learning stage (training data obtained easily, little computation time) and detects logos quickly with a good precision. We evaluate the detector on 413 images from a news corpus. In a second part, we present our annotation method. We associate images that contain logos or panels and some named entities extracted from the news text coming with the images. This annotation method is very fast and is fitted to large-scale applications. We evaluate it on a news corpus that contains more than 40,000 images.
Dans cet article, nous proposons une méthode d'annotation d'images tirées d'un corpus d'articles de presse. Pour contourner le problème du fossé sémantique posé par l'utilisation de descripteurs de bas-niveau, nous mettons en relation des indices visuels de haut-niveau extraits des images (présence de logos ou de panneaux) et des indices textuels issus de l'analyse du texte des articles (un sousensemble des entités nommées – noms d'entreprises. . .–). Dans un premier temps, nous proposons un détecteur de logos et de panneaux reposant sur le modèle des mots visuels proposé par Sivic et Zisserman [1], dont les descripteurs sont particulièrement adaptés à la détection de ce type d'objets. Notre détecteur ne nécessite qu'une phase d'apprentissage légère (données faciles à obtenir, peu de temps de calcul), et permet de détecter les logos de manière rapide et avec une bonne précision. Nous l'évaluons sur 413 images extraites du corpus initial d'articles de presse. Dans un second temps, nous présentons la méthode d'annotation d'images. Nous associons aux images où sont détectés des logos les entités nommées extraites de l'article accompagnant l'image et susceptibles de décrire ces logos. Nous montrons que cette méthode d'annotation est rapide et ne pose pas de problèmes de passage à l'échelle. Nous l'évaluons sur le corpus d'articles de presse complet, qui contient plus de 40000 images.
Fichier principal
Vignette du fichier
Tirilly-et-al-RFIA2010.pdf (320.83 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00561796 , version 1 (01-02-2011)

Identifiants

  • HAL Id : inria-00561796 , version 1

Citer

Pierre Tirilly, Vincent Claveau, Patrick Gros. Détection de logos pour l'annotation d'images de presse. Congrès francophone AFRIF-AFIA de reconnaissance de formes et d'intelligence artificielle, RFIA'10, AFRIF - AFIA, Jan 2010, Caen, France. ⟨inria-00561796⟩
243 Consultations
223 Téléchargements

Partager

Gmail Facebook X LinkedIn More