Accueil > Actualités > TubeTagger automatise la catégorisation des vidéos
TubeTagger automatise la catégorisation des vidéos
mercredi 21 mai 2008Ce logiciel de reconnaissance vidéo apprend à reconnaître les images en analysant des extraits sur YouTube et les tags qui y sont associés. Ce qui à terme pourrait lui permettre de se passer d’une intervention extérieure pour fonctionner.
TubeTagger a pour objectif de supprimer toute intervention humaine dans le processus de catégorisation des vidéos et de l’attribution des mots-clefs nécessaires. Le programme développé par l’équipe de l’Université de Kaiserslautern en Allemagne modifie "l’entraînement" habituellement effectué par ce type de logiciel : les produits dédiés à la reconnaissance vidéo s’optimisent habituellement en parcourant une bibliothèque d’échantillons de films. Ce qui jusqu’à maintenant sous-entendait de titrer chacun d’entre eux à la main. Un travail laborieux qui réduit de fait le nombre de vidéos utilisées pour cette nécessaire optimisation. TubeTagger quant à lui apprend à ajouter des mots-clefs à des vidéos en regardant YouTube. Le fonctionnement est le suivant : les chercheurs donnent le mot-clef "football" à TubeTagger. Ce dernier télécharge alors automatiquement cinquante vidéos sur YouTube que les internautes ont déjà étiquetées de ce tag, et il examine les couleurs et les mouvements de chacun de ces contenus.
Plus d’un tiers de réussite
Dans les expériences menées par l’équipe de recherche, ce procédé d’apprentissage a été répété pour vingt-deux mots-clefs sur YouTube, avec par exemple les tags "émeute" ou "interview". Après son entraînement, TubeTagger a dû analyser un échantillon de vidéos issues du site communautaire qu’il n’avait jamais visionnées auparavant. A chaque fois qu’il regardait un film, le système lui attribuait trois mots-clefs parmi les vingt-deux qu’il avait intégrés, les rangeant par ordre de pertinence. Il ressort que TubeTagger a choisi le tag le plus approprié dans plus de deux tiers des cas. Mais le taux de réussite est plus bas lorsque les vidéos proviennent d’autres sources que YouTube. Il varie aussi considérablement en fonction du tag : le logiciel fonctionnait bien avec le mot-clef "football" mais était beaucoup moins efficace avec le mot "plage" par exemple.