Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

3 novembre 2019

Stage M2 LaBRI/IMS (Bordeaux) : Fusion de données multimodales et structurées par apprentissage profond


Catégorie : Stagiaire


Stage M2 LaBRI/IMS (Bordeaux) : Fusion de données multimodales et structurées par apprentissage profond

Sujet détaillé au format PDF disponible ici : http://rgiraud.vvv.enseirb-matmeca.fr/data/jobs/Stage_LaBRI_sp_lidar_2020.pdf

Objectifs du stage

Dans ce stage, nous proposons d'étudier de nouvelles approches de fusion de données multimodales, telles que les images optiques et le LiDAR, en se focalisant notamment sur l'exploitation de leurs structures spatiales.
En effet, les capteurs LiDAR récents suivent, lors des captures, une certaine structure qui est intrinsèquement liée au balayage régulier de la scène, et qui peut être exploitée pour extraire de l'information [1].
De même, les images issues de caméras présentent une structure spatiale de haut niveau dû au positionnement relatif des différents objets.
Il paraît alors pertinent d'intégrer au sein des approches de fusion de données des représentations irrégulières telles que des décompositions en superpixels [2] ou des graphes décrivant les relations spatiales entre régions [3].

Ces représentations irrégulières pourraient apporter des informations additionnelles pertinentes aux chaînes de traitement actuelles reposant sur des réseaux de neurones convolutifs.
Un défi sera notamment de proposer des architectures adaptées à la manipulation de données irrégulières (où le nombre d'éléments et leurs formes sont variables), afin qu'elles puissent être exploitées de manière complémentaires aux caractéristiques d'apparence classiques à l'échelle pixellique.
L'approche pourra également s'inspirer de travaux récents sur les réseaux de neurones non-locaux [4], qui permettent de capturer des interactions à différents niveaux dans les images.

Profil recherché

Étudiant·e en Master 2 ou dernière année d'école d'ingénieurs, spécialisé·e en informatique, image et/ou intelligence artificielle.
Des connaissances et expériences solides en traitement d'images, apprentissage profond et programmation (Python, TensorFlow/PyTorch, C/C++) sont demandées.
La maîtrise de l'anglais scientifique et des qualités rédactionnelles sont également très importantes.

Candidature : Pour candidater, envoyer un dossier avec CV, lettre de motivation, relevés de notes, ainsi que toute pièce susceptible de renforcer la candidature (lettre de recommandation, etc.).
Pour l'envoi des pièces demandées, ou pour toute question sur le sujet : michael.clement@labri.fr

Références
[1] Biasutti, P., Lepetit, V., Aujol, J.-F., Brédif, M., and Bugeau, A. “LU-Net: An efficient network for 3D LiDAR point cloud semantic segmentation based on end-to-end-learned 3D features and U-Net”. Computer Vision for Road Scene Understanding and Autonomous Driving (CVRSUAD, ICCV workshop). 2019.
[2] Giraud, R., Ta, V.-T., Bugeau, A., Coupé, P., and Papadakis, N. “SuperPatchMatch: An algorithm for robust corre-spondences of superpixel patches”. IEEE Transactions on Image Processing 26.8 (2017), pp. 4068–407.
[3] Clément, M., Kurtz, C., and Wendling, L. “Learning spatial relations and shapes for structural object description and scene recognition”. Pattern Recognition 84 (2018), pp. 197–210.
[4] Wang, X., Girshick, R., Gupta, A., and He, K. “Non-local neural networks”. Conference on Computer Vision and Pattern Recognition (CVPR). 2018, pp. 7794–7803.

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2020.