Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

18 juillet 2019

Thèse au CEA LIST en vision et deep learning sur la segmentation panoptique par apprentissage profond semi-supervisé.


Catégorie : Doctorant


ORGANISATION
Basé à Saclay (Essonne), le List est l'un des trois instituts de recherche technologique de CEA Tech, la direction de la recherche technologique du CEA. Dédié aux systèmes numériques intelligents, sa mission est de réaliser des développements technologiques d’excellence pour le compte de partenaires industriels, afin de créer de la valeur.
Au sein du List, le Laboratoire de Vision et d’Apprentissage pour l’analyse de scène (LVA) mène ses recherches dans le domaine de la vision par ordinateur et de l’intelligence artificielle pour la perception des systèmes intelligents et autonomes. Les thèmes de recherche du laboratoire sont la reconnaissance visuelle, l’analyse de comportement et d’activité, l’annotation automatique à grande échelle et les modèles de perception et décision. Ces technologies trouvent leur application dans des secteurs d’activité majeurs (sécurité, mobilité, manufacturing avancé, santé).

LIEU
CEA Centre de Nano-Innov - plateau de Saclay (91)

NATURE DU CONTRAT
Contrat de thèse CEA de 36 mois

SUJET

 

Les récents progrès en apprentissage automatique ont permis la construction de systèmes d’analyse d’images robustes notamment grâce à la popularisation des réseaux de neurones profonds (Deep Learning) . Leur efficacité a suscité un vif intérêt de la part de la communauté de vision par ordinateur pour traiter diverses problématiques: classification d’image, détection d’objets d’intérêt, segmentation…

Cette thèse s’intéresse à la problématique de la segmentation panoptique par Deep Learning. Étant donnée une image, l’objectif de la segmentation panoptique est de prédire une carte de segmentation regroupant deux types d’information: la segmentation sémantique et la segmentation d’instances. La segmentation sémantique consiste à attribuer à chaque pixel de l’image la classe auquel il appartient (arbre, route, voiture, personne…) tandis que la segmentation d’instances produit un masque pour chaque objet dans la scène. Le regroupement de ces deux types de segmentation fournit une description pixellique très riche ce qui s’avère très utile dans un certain nombre d’application (notamment la conduite autonome).

La segmentation panoptique est un sujet récent, introduit pour la première fois en 2018 par [1]. Les approches actuelles qui s’intéressent à ce sujet utilisent deux réseaux de neurones profonds (ou un réseau multi-tâches) permettant de produire les cartes de segmentation sémantique et d’instances. Une fusion est ensuite réalisée pour aboutir à la segmentation panoptique.

 

Le premier objectif de la thèse sera de proposer une nouvelle approche supervisée de segmentation panoptique. Pour se faire, le doctorant devra repenser la modélisation du problème et mener des expérimentations sur des benchmarks académiques [2, 3] pour prouver l’efficacité de sa méthode.

Le second objectif sera de proposer une extension de la méthode en s’intéressant a l’apprentissage semi-supervisé. En effet, la majorité des approches de Deep learning performantes se base sur l’apprentissage purement supervisé : le modèle utilise une base de donnée annoté pour apprendre ses paramètres. Néanmoins, étiqueter finement tous les éléments d’une grande base de donné est un travail fastidieux. Par exemple, dans le cadre de la conduite autonome, un grand nombre de données routières peuvent être facilement acquises en roulant plusieurs jours mais l’annotation manuelle de ces millions d’images est excessivement coûteux. En réalité, juste une petite partie des acquisitions est annotée finement ce qui peut limiter l’apprentissage d’un modèle et sa capacité à bien généraliser sur de nouvelles images. En partant de ce postulat, le doctorant devra proposer une adaptation de sa méthode de segmentation panoptique en utilisant, en plus des données finement annotées, des données peu ou pas annotées pour améliorer la généralisation du modèle appris.

[1] Panoptic Segmentation, A. Kirillov, K. He, R. Girshick, C. Rother, P. Dollár. CVPR 2019

[2] Microsoft COCO: Common objects in contex, T.-Y. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Dollár,.ECCV 2014

[3] The cityscapes dataset for semantic urban scene understanding, M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele. CVPR 2016

 

PROFIL DU CANDIDAT RECHERCHE

- Master 2 recherche, spécialité informatique / vision / machine learning / intelligence artificielle

- expérience projet Deep Learning

- connaissances python, tensorflow, pytorch

Pour candidater, envoyer un CV et lettre de motivation à florian.chabot@cea.fr

ORGANISATION
Basé à Saclay (Essonne), le List est l'un des trois instituts de recherche technologique de CEA Tech, la direction de la recherche technologique du CEA. Dédié aux systèmes numériques intelligents, sa mission est de réaliser des développements technologiques d’excellence pour le compte de partenaires industriels, afin de créer de la valeur.
Au sein du List, le Laboratoire de Vision et d’Apprentissage pour l’analyse de scène (LVA) mène ses recherches dans le domaine de la vision par ordinateur et de l’intelligence artificielle pour la perception des systèmes intelligents et autonomes. Les thèmes de recherche du laboratoire sont la reconnaissance visuelle, l’analyse de comportement et d’activité, l’annotation automatique à grande échelle et les modèles de perception et décision. Ces technologies trouvent leur application dans des secteurs d’activité majeurs (sécurité, mobilité, manufacturing avancé, santé).

LIEU
CEA Centre de Nano-Innov - plateau de Saclay (91)

NATURE DU CONTRAT
Contrat de thèse CEA de 36 mois

SUJET

 

Les récents progrès en apprentissage automatique ont permis la construction de systèmes d’analyse d’images robustes notamment grâce à la popularisation des réseaux de neurones profonds (Deep Learning) . Leur efficacité a suscité un vif intérêt de la part de la communauté de vision par ordinateur pour traiter diverses problématiques: classification d’image, détection d’objets d’intérêt, segmentation…

Cette thèse s’intéresse à la problématique de la segmentation panoptique par Deep Learning. Étant donnée une image, l’objectif de la segmentation panoptique est de prédire une carte de segmentation regroupant deux types d’information: la segmentation sémantique et la segmentation d’instances. La segmentation sémantique consiste à attribuer à chaque pixel de l’image la classe auquel il appartient (arbre, route, voiture, personne…) tandis que la segmentation d’instances produit un masque pour chaque objet dans la scène. Le regroupement de ces deux types de segmentation fournit une description pixellique très riche ce qui s’avère très utile dans un certain nombre d’application (notamment la conduite autonome).

La segmentation panoptique est un sujet récent, introduit pour la première fois en 2018 par [1]. Les approches actuelles qui s’intéressent à ce sujet utilisent deux réseaux de neurones profonds (ou un réseau multi-tâches) permettant de produire les cartes de segmentation sémantique et d’instances. Une fusion est ensuite réalisée pour aboutir à la segmentation panoptique.

 

Le premier objectif de la thèse sera de proposer une nouvelle approche supervisée de segmentation panoptique. Pour se faire, le doctorant devra repenser la modélisation du problème et mener des expérimentations sur des benchmarks académiques [2, 3] pour prouver l’efficacité de sa méthode.

Le second objectif sera de proposer une extension de la méthode en s’intéressant a l’apprentissage semi-supervisé. En effet, la majorité des approches de Deep learning performantes se base sur l’apprentissage purement supervisé : le modèle utilise une base de donnée annoté pour apprendre ses paramètres. Néanmoins, étiqueter finement tous les éléments d’une grande base de donné est un travail fastidieux. Par exemple, dans le cadre de la conduite autonome, un grand nombre de données routières peuvent être facilement acquises en roulant plusieurs jours mais l’annotation manuelle de ces millions d’images est excessivement coûteux. En réalité, juste une petite partie des acquisitions est annotée finement ce qui peut limiter l’apprentissage d’un modèle et sa capacité à bien généraliser sur de nouvelles images. En partant de ce postulat, le doctorant devra proposer une adaptation de sa méthode de segmentation panoptique en utilisant, en plus des données finement annotées, des données peu ou pas annotées pour améliorer la généralisation du modèle appris.

[1] Panoptic Segmentation, A. Kirillov, K. He, R. Girshick, C. Rother, P. Dollár. CVPR 2019

[2] Microsoft COCO: Common objects in contex, T.-Y. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Dollár,.ECCV 2014

[3] The cityscapes dataset for semantic urban scene understanding, M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele. CVPR 2016

 

PROFIL DU CANDIDAT RECHERCHE

- Master 2 recherche, spécialité informatique / vision / machine learning / intelligence artificielle

- expérience projet Deep Learning

- connaissances python, tensorflow, pytorch

Pour candidater, envoyer un CV et lettre de motivation à florian.chabot@cea.fr

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2019.