Please use this identifier to cite or link to this item: http://repository.vnu.edu.vn/handle/VNU_123/236
Title: Localisation du locuteur dans une séquence audiovisuelle
Authors: CHOLLET, Gérard
MANZANERA, Antoine
VU, Ngoc Son
Keywords: localisation du locuteur;multi modalité;détection de visage
Issue Date: 2007
Abstract: Le mouvement de la bouche d'un locuteur est fortement corrélé avec les données audio que celle-ci produit. L'objectif est ici de détecter le locuteur dans une vidéo en utilisant ces deux signaux : le signal de parole acoustique et le signal de parole visuel. La localisation du locuteur est la clé dans certaines applications : les vidéoconférences, les systèmes de sécurité, la reconnaissance des personnes, l'indexation de vidéos, l'amélioration des interfaces homme machine, l'analyse d'expressions humaines, la lecture sur les lèvres, etc. L'objectif de ce stage est d'étudier la localisation du locuteur en utilisant les données audio et les donnés visuelles. Dans ce rapport, je présente d'abord les principes de l'extraction des énergies visuelles et de l'énergie sonore. En suite j'étudie di érents méthodes pour mesurer leurs correspondances. L'extraction des caractéristiques peut être aidée par la détection et le suivi des visages, je présenterai aussi les résultats de localisation obtenus en utilisant ou non ces outils.
URI: http://repository.vnu.edu.vn/handle/VNU_123/236
Appears in Collections:IFI - Master Theses

Files in This Item:
Thumbnail

  • File : stage-vu_ngoc_son.pdf
  • Description : 
  • Size : 3.68 MB
  • Format : Adobe PDF


  • Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.