Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

4 janvier 2019

Stage M2 : Apprentissage des composantes principales par réseau de neurones pour l'estimation du mouvement dans une séquence vidéo


Catégorie : Stagiaire


Apprentissage des composantes principales par réseau de neurones pour l'estimation du mouvement dans une séquence vidéo

Durée : 6 mois.
Lieu : Laboratoire de Traitement et Transport de l'Information.

Compétences requises :
Formation initiale en traitement d'image/vidéo, codage et apprentissage.
Bonnes connaissances en programmation Matlab, langage C++.

Mots clefs :
Vidéo, Estimation de mouvement, Analyse en composantes principales, Apprentissage, Réseaux de neurones.

Supervisors:
A. Mokraoui (L2TI) ; A. Osmani (LIPN).
Contacts :
A. Mokraoui (anissa.mokraoui@univ-paris13.fr)
A. Osmani (aomar.osmani@lipn.univ-paris13.fr)

 

Description succincte du sujet :

Pour comprimer une séquence vidéo, la réduction de la redondance spatiale et temporelle s'impose. Dans ce stage, nous nous intéressons au problème de l'estimation du flux de mouvement de façon à ce que la vidéo reconstruite soit de bonne qualité. De nombreuses approches ont été développées. La majorité des standards de compression vidéo (par exemple H264/AVC, HEVC) ont adopté la stratégie de mise en correspondance de blocs de différentes tailles combinant des stratégies de prédiction/codage des vecteurs de mouvement.

Dans ce stage un vecteur de mouvement, représenté par un modèle paramétré par son amplitude et sa phase, est associé à chaque bloc de l'image. Le traitement est réalisé dans le domaine transformé. Les calculs montrent que le flux de mouvement peut-être transformé en composantes principales. Il s'agira alors d'apprendre les deux matrices de transformation de l'amplitude et de la phase par réseaux de neurones.

Le travail demandé au cours de ce stage sera organisé comme suit. Dans un premier temps, un état de l’art sur l'estimation du mouvement dans une séquence vidéo basé sur l'apprentissage par réseau neuronale sera réalisé. Dans un deuxième temps, il s'agira d'étudier et d'adapter le réseau de neurones de Oja [2] et Sanger [1] à l'estimation du mouvement. Des simulations appuieront l'étude de l'approche modifiée.

Références :
[1] T.D. Sanger, Optimal unsupervised learning in a single layer linear feed-forward neural netxork, NeuralNetworks vol. 2, no. 8, pp. 459-473, 1989.
[2] E. Oja, A simpl ed neuron model as a principal component analysez, Journal of mathematical biology, vol. 15, pp. 267-273, 1982.

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2018.