Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

2 novembre 2018

Stage M2 : Relocalisation d’une caméra dans un environnement complexe en utilisant un apprentissage profond


Catégorie : Stagiaire


Ce stage se déroulera au sein de l'Institut Image, Laboratoire Lispen, de l'Ecole Nationale des Arts et Métier, située à Chalon sur Saône

 

La réalité augmentée (RA) connait un essor considérable, elle est utilisée dans divers domaines, notamment dans l’industrie, la formation, l’art et les divertissements. Un des problèmes majeurs de la Réalité Augmentée est la localisation du dispositif de visualisation. En effet, pour obtenir un recalage réel-virtuel précis, il est nécessaire d’estimer efficacement la pose de la caméra ou de l’objet 3D à chaque frame et en temps réel. Ce problème est d’autant plus difficile à résoudre que l’environnement de travail est complexe (environnement industriel par exemple), présentant des contraintes fortes : conditions d’éclairage très variables et non contrôlables, présence de matériaux réfléchissants (métaux) et absence de couleurs ou de textures, environnement changeant (déplacement des objets).

Les méthodes classiques de RA fonctionnent mal dans ces conditions et ne permettent pas d’obtenir des augmentations précises. Les approches basées SLAM visuel répondent en partie à ces problématiques, mais présentent une limitation importante liée à la qualité de la détection et appariement des points d’intérêt dans les images. Par ailleurs, l’apprentissage automatique est considéré comme un outil efficace pour traiter les problèmes de vision par ordinateur. Plusieurs approches de la littérature proposent de formuler le problème de suivi 3D comme un problème d’apprentissage où il s’agit d’apprendre la relation entre une paire d’images et le déplacement relatif de la caméra ou de l’objet.

L’objectif de ce stage est d’utiliser l’apprentissage profond (deep learning) pour résoudre ce problème. Il s’agira dans un premier temps de formaliser le problème de localisation comme un problème d’apprentissage. L’idée ici consiste à apprendre la fonction de mapping entre, d’une part, les informations visuelles extraites des images, et d’autre part, la localisation 3D de la caméra. Pour assurer de bonnes performances dans des conditions difficiles, les descripteurs locaux des points d’intérêt, tels que SIFT et SURF, seront utilisés. Un protocole expérimental sera mis en place pour tester et valider l’approche proposée

Contact:

Fakhreddine Ababsa, Professeur des Universités, Arts et Métiers.

E-mail : fakhreddine.ababsa@ensam.eu

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2018.