Detecting Repeats for Video Structuring
Résumé
Television daily produces massive amounts of videos. Digital video is unfortunately an unstructured document in which it is very difficult to find any information. Television streams have however a strong and stable but hidden structure that we want to discover by detecting repeating objects in the video stream i.e.\textit{ self-similarities}. This report shows that television streams are actually highly redundant and that detecting repeats clearly outlines the underlying structure of the video. A method for detecting these self-similarities is presented here with an emphasis on the efficiency of the search in a large video corpus. Very good results are obtained both in terms of effectivness (98\% in recall and precision) as well as efficiency since one day of video is queried against a three weeks dataset in only one second. \\ La télévision produit en permanence des flux vidéo d'une ampleur considérable, sans que l'on sache pourtant ce qui a été exactement diffusé. Nous nous intéressons ici à la détection de répétitions dans des vidéos de grande taille. On montre que les flux de la télévision sont en effet extrêmement répétitifs et que la détection des \textit{auto-similarités} permet de découvrir la structure sous-jacente du flux. Ce rapport présente en détail une méthode de détection d'objets répétitifs dans une optique de recherche rapide dans d'importants volumes vidéos. De très bons résultats sont obtenus tant en qualité (98\% de rappel et précision) qu'en rapidité, puisqu'il suffit d'une seconde pour requêter une journée entière de vidéo contre une base de trois semaines.