Annonce

Les commentaires sont clos.

Analyse des scènes dans les entrepôts de stockage par apprentissage de représentations démêlées (disentangled representation learning)

21 Janvier 2022


Catégorie : Doctorant


Thèse CIFRE entre le laboratoire de recherche L@bISEN de l'ISEN Yncréa Ouest (Brest) et l'entreprise Generix Group (Paris)

 
Contexte :
Les entrepôts industriels sont des espaces complexes et variables qui nécessitent une grande expertise humaine pour leur gestion. En effet, on y trouve un ensemble d'opérateurs et d'objets mobiles qui doivent effectuer de concert de nombreuses tâches pour faire entrer, transférer, stocker, scanner et sortir des produits, colis et palettes. Pour cela, un système d'information (SI) pilote l'entrepôt pour orchestrer ces opérations dans un but d'efficacité et de productivité. Cependant, des difficultés opérationnelles persistent, car parfois les informations connues par le SI et la réalité du terrain diffèrent pour diverses raisons : erreurs humaines, erreurs de saisie, sélection du mauvais produit, erreur d'emplacement, goulot d'étranglement, incident, vols...
 
Afin de solutionner ces problématiques, des outils de vision par ordinateur basés sur des approches d'apprentissage automatique peuvent être mis en œuvre. On note par exemple le développement en laboratoire de techniques visant à : détecter et scanner les codes-barres des produits, compter les objets sur une palette, dimensionner des colis à partir de photos, détecter des anomalies et dommages physiques... Ainsi, le but de cette thèse est d'apporter une vision globale de l'entrepôt à travers les différentes ressources visuelles (c.-à-d. les vidéos) et données disponibles dans le SI. On cherche plus particulièrement à comprendre les flux de l'entrepôt dans leurs globalités afin de simplifier le traçage et la navigation des produits.
 
Description du sujet :
Les réseaux de neurones profonds ont montré leur intérêt et d'excellents résultats pour de nombreuses tâches d'apprentissage automatique. De fait, ils sont capables d'extraire efficacement la représentation interne des données (c.-à-d. leurs caractéristiques propres). Cependant, ils sont encore difficilement applicables aux entrepôts industriels, car les données disponibles sont trop riches, trop variées et souvent parcimonieuses ce qui implique des difficultés à les analyser et à les interpréter. Afin de résoudre cette problématique, il est nécessaire de comprendre les données dans l'espace réduit des caractéristiques du réseau de neurones. Pour cela, nous souhaitons explorer les techniques d'apprentissage profond basées sur des représentations "démêlées" (c.-à-d. disentangled representation). Ces approches permettent de séparer les caractéristiques propres des données dans espaces de dimensions restreintes plus proches de l'intuition humaine [1,2,3,4,5].
 
Ainsi, l'objectif de cette thèse est d’exploiter ces nouvelles approches pour développer de nouvelles méthodes basées sur les représentations "démêlées" afin de répondre aux problématiques d'analyse de scènes dans les entrepôts industriels telles que : la détection et le suivi de produits, leur segmentation, l'estimation de leur pose ou encore la détection d'évènement non voulu. Pour atteindre ce but, il existe encore de nombreux verrous techniques et scientifiques dont :
 
L'application des approches de représentations "démêlées" aux scénarios réels qui offrent peu d'exemples (c.-à-d. apprentissage faiblement supervisé, apprentissage semi-supervisé). À court terme, ces recherches pourront s’appuyer sur les travaux de [3] qui permettent d’obtenir une décomposition des représentations sur des vidéos.
 
L’utilisation de ces techniques pour l’extraction de connaissances sur des vidéos acquises en condition de travail dans le but d’analyser les scènes pour le suivi de produit ou la détection d’évènement par exemple.
 
L’exploitation de ces méthodes dans des applications industrielles nécessitant des calculs temps réels pour une mise en œuvre efficace sur le terrain.
 
Enfin, le sujet de thèse se veut aussi applicatif. Le candidat serait amené à développer des prototypes opérationnels pour l'analyse de scène à partir de vidéos. Dans ce cadre, des données privées provenant des partenaires de l'entreprise Generix Group devront être exploitées dans le cadre des applications développées.
 
Références succinctes :
 
[1] Locatello, Francesco, et al. "Challenging common assumptions in the unsupervised learning of disentangled representations." PMLR, 2019.
[2] Denton, Emily, et al. "Unsupervised learning of disentangled representations from video." NIPS (2017).
[3] Hsieh, Jun-Ting, et al.. "Learning to decompose and disentangle representations for video prediction." NeurIPS (2018).
[4] Pham, Chi-Hieu, et al.. "PCAAE: Principal Component Analysis Autoencoder for organising the latent space of generative networks." arXiv preprint arXiv:2006.07827 (2020).
[5] Massague, Armand Comas, et al.. "Learning Disentangled Representations of Video with Missing Data." NeurIPS (2020).
 
Profil du Candidat(e) :
 
Le ou la candidat(e) doit :
  • Être titulaire d’un diplôme de Master et/ou Ingénieur, ou en cours de préparation, dans des domaines liés à l’informatique, les mathématiques ou la science des données.
  • Avoir un vif intérêt pour la recherche scientifique et être familier au moins avec l’un des outils/langages suivants (Python, C++, PyTorch, TensorFlow...)
  • Avoir une aptitude au développement de prototypes
  • Avoir de très bonnes connaissances théoriques et pratiques en Intelligence Artificielle, plus précisément en Deep Learning et en Vision par Ordinateur
Procédure de Recrutement :
 
Le dossier de candidature doit comprendre votre CV, lettre de motivation, Relevés de notes de L3, M1, M2 (ou années équivalentes) et une éventuelle lettre de recommandation. L’ensemble du dossier doit être adressé avant le 06/02/2022.
 
Les 3 ou 4 meilleurs profils seront invités à faire un exposé de 20 à 30 minutes qui sera suivi d’une séance de questions devant la commission de spécialistes.
 
Contacts :
  • Marwa EL BOUZ (Enseignant-Chercheur HDR ISEN Yncréa Ouest) : marwa.el-bouz@isen-ouest.yncrea.fr
  • Thibault NAPOLÉON (Enseignant-Chercheur ISEN Yncréa Ouest): thibault.napoleon@isen-ouest.yncrea.fr
  • Chi-Hieu PHAM (Enseignant-Chercheur ISEN Yncréa Ouest) : chi-hieu.pham@isen-ouest.yncrea.fr