Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

31 janvier 2018

Reconnaissance d’objets 3D et segmentation sémantique dans une scène 3D par réseaux de neurones profonds


Catégorie : Post-doctorant


Post-doc au CEA LIST en vision et apprentissage

Durée: 12 à 24 mois.

Laboratoire d'accueil : Au sein de l’Institut CEA LIST (www-list.cea.fr), un domaine d’activité important du laboratoire de Vision et de l'Ingénierie des Contenus (LVIC) concerne l’analyse de scènes par vision. Cette équipe d’une vingtaine de personnes développe des technologies d’analyse d’images et de vidéos capables de percevoir et modéliser les scènes, détecter et suivre et décrire des objets d’intérêt, ré-identifier des personnes et des objets, analyser le comportement et l’activité des personnes, et reconnaître des événements spécifiques.

Site web du laboratoire : www.kalisteo.eu

Contact : Dr Quoc Cuong Pham, quoc-cuong.pham@cea.fr

 

Description

Les avancées récentes en apprentissage automatique, notamment en apprentissage profond (deep learning) ont bousculé l’état de l’art dans de nombreux domaines, en particulier en vision par ordinateur. Parallèlement, les technologies des capteurs 3D ont aussi gagné en maturité, comme le montre l’essor des caméras à temps de vol et les LIDAR aujourd’hui incontournables pour le développement des véhicules autonomes. L’utilisation des méthodes de deep learning sur des données 3D, de plus en plus denses, de manière complémentaire aux l’exploitation des données visuelles 2D, ouvre d’immenses perspectives pour la segmentation sémantique et la reconnaissance d’objets. L’objectif du post-doc est de proposer et développer une méthode originale de reconnaissance d’objets et segmentation sémantique dans des données 3D, rapide et performante, basée sur l’apprentissage profond. Le travail de recherche portera ensuite sur la conception d’un algorithme d’apprentissage profond des représentations visuelles des données 3D en recherchant des propriétés d’invariance à la résolution, à l’échelle et aux transformations géométriques, pour la reconnaissance robuste des objets. Dans un second temps, une extension de la méthode exploitant l’information d’intensité de la réflexion et de couleur sera étudiée dans le but d’améliorer les performances de la reconnaissance d’objets.

Contexte

Les avancées récentes en apprentissage automatique, notamment en apprentissage profond (deep learning) ont bousculé l’état de l’art dans de nombreux domaines tels que la vision par ordinateur, le traitement du langage naturel, la robotique, en apportant des augmentations sans précédent des performances des algorithmes en terme de robustesse et de précision. En vision par ordinateur, les méthodes basées sur le deep learning tiennent le premier rang dans quasiment toutes les tâches : segmentation, détection d’objets, reconnaissance d’instances, reconnaissance d’actions et de comportements, description d’images et de vidéo, etc. grâce notamment à la mise à disposition de base de données annotées de plus en plus grandes, les capacités croissantes des moyens de calcul, et de nouveaux algorithmes d’apprentissage. Parallèlement, les technologies des capteurs 3D ont aussi gagné en maturité, comme le montre l’essor des caméras à temps de vol et les LIDAR (LIght Detection And Ranging) qui sont aujourd’hui incontournables pour le développement des véhicules autonomes. L’utilisation des méthodes de deep learning sur des données 3D, de plus en plus denses, de manière complémentaire aux l’exploitation des données visuelles 2D, ouvre d’immenses perspectives pour la segmentation sémantique et la reconnaissance d’objets.

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2018.