Annotation de vidéos par paires rares de concepts

Abdelkader Hamadi; Philippe Mulhem; Georges Quénot

Communication Dans Un Congrès Année : 2014

Annotation de vidéos par paires rares de concepts

(1) , (1) , (1)

Abdelkader Hamadi

Fonction : Auteur

Laboratoire d'Informatique de Grenoble

Philippe Mulhem

Fonction : Auteur
PersonId : 9330
IdHAL : philippe-mulhem
ORCID : 0000-0002-3245-6462
IdRef : 086873083

Laboratoire d'Informatique de Grenoble

Georges Quénot

Fonction : Auteur
PersonId : 3114
IdHAL : georges-quenot
ORCID : 0000-0003-2117-247X
IdRef : 034104518

Laboratoire d'Informatique de Grenoble

Résumé

La détection d'un concept visuel dans les vidéos est une tâche difficile, spécialement pour les concepts rares ou pour ceux dont il est compliqué de décrire visuellement. Cette question devient encore plus difficile quand on veut détecter une paire de concepts au lieu d'un seul. En effet, plus le nombre de concepts présents dans une scène vidéo est grand, plus cette dernière est complexe visuellement, et donc la difficulté de lui trouver une description spécifique s'accroit encore plus. Deux directions principales peuvent eˆtre suivies pour tacler ce problème: 1) détecter chaque concept séparément et combiner ensuite les prédictions de leurs détecteurs correspondants d'une manière similaire à celle utilisée souvent en recherche d'information, ou 2) considérer le couple comme un nouveau concept et générer un classifieur supervisé pour ce nouveau concept en inférant de nouvelles annotations à partir de celles des deux concepts formant la paire. Chacune de ces approches a ses avantages et ses inconvénients. Le problème majeur de la deuxième méthode est la nécessité d'un ensemble de données annotées, surtout pour la classe positive. S'il y a des concepts rares, cette rareté s'accroit encore plus pour les paires formées de leurs combinaisons. D'une autre part, il peut y avoir deux concepts assez fréquents mais il est très rare qu'ils occurrent conjointement dans un meˆme document. Certains travaux de l'état de l'art ont proposé de palier ce problème en récoltant des exemples représentatifs des classes étudiées du web, mais cette tâche reste couˆteuse en temps et argent. Nous avons comparé les deux types d'approches sans recourir à des ressources externes. Notre évaluation a été réalisée dans le cadre de la sous-tâche "détection de paire de concepts" de la tâche d'indexation sémantique (SIN) de TRECVID 2013, et les résultats ont révélé que pour le cas des vidéos, si on n'utilise pas de ressources d'information externes, les approches qui fusionnent les résultats des deux détecteurs sont plus performantes, contrairement à ce qui a été montré dans des travaux antérieurs pour le cas des images fixes. La performance des méthodes décrites dépasse celle du meilleur résultat officiel de la campagne d'évaluation précédemment citée, de 9% en termes de gain relatif sur la précision moyenne (MAP).

Domaines

Recherche d'information [cs.IR]

Fichier principal

coria2014_2.pdf (222.83 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Marie-Christine Fauvet : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00953140

Soumis le : mercredi 23 avril 2014-10:15:50

Dernière modification le : jeudi 4 avril 2024-21:30:46

Archivage à long terme le : mercredi 23 juillet 2014-10:45:18

Dates et versions

hal-00953140 , version 1 (23-04-2014)

Identifiants

HAL Id : hal-00953140 , version 1

Citer

Abdelkader Hamadi, Philippe Mulhem, Georges Quénot. Annotation de vidéos par paires rares de concepts. CORIA, 2014, Nancy, France. ⟨hal-00953140⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS LIG LIG_TDCGE LIG_TDCGE_MRIM LIG_SIDCH

100 Consultations

41 Téléchargements

Annotation de vidéos par paires rares de concepts

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager