Annonce

Les commentaires sont clos.

Stage M2 : apprentissage de représentations d'objets par renforcement et motivation intrinsèque

11 Janvier 2022


Catégorie : Stagiaire


Offre de stage de l'équipe ComSee de l'Institut Pascal : démêlement des facteurs de variations d’objets via l’apprentissage profond par renforcement et la motivation intrinsèque. L'offre détaillée est disponible ici : https://comsee.ispr-ip.fr/job-offers/

L'équipe ComSee de l'Institut Pascal recherche un(e) stagiaire de niveau bac+5 pour une durée de 6 mois

Sujet de stage : Démêlement des facteurs de variations d’objets via l’apprentissage profond par renforcement et la motivation intrinsèque

Mots clés : Apprentissage profond par renforcement, apprentissage de représentations, apprentissage développemental, apprentissage de compétences, démêlement de représentation.

Résumé :

En apprentissage profond par renforcement (AR) [Sutton and Barto, 2018], un agent apprend à résoudre une tâche par essais-erreurs en observant les données brutes de son environnement (e.g des pixels). Ainsi, en mixant réseaux de neurones et apprentissage par renforcement, de récentes méthodes parviennent à surpasser les humains sur des jeux-vidéos [Mnih et al., 2015]. Cependant, une importante partie de l’apprentissage humain se réalise sans tâche apparente pour un usage ultérieur : c’est ce qu’on appelle la motivation intrinsèque [Ryan and Deci, 2000]. Typiquement, un bébé apprend progressivement et de manière autonome à reconnaitre et à manipuler les objets qui l’entourent : leur couleur, position, rotation etc. . .[Harman et al., 1999]. C’est ce qu’on appelle démêler (disentangle) les facteurs de variation différents et indépendants [Higgins et al., 2016].

L’objectif du projet est d’apprendre une représentation capturant les différents facteurs de variation d’un objet (axes de rotations, positions, couleur) ainsi que les compétences [Li et al., 2021] qui permettent de les manipuler. Côté expérimental, nous souhaitons tirer parti de la plateforme de simulation threedworld [Gan et al., 2020] pour simuler l’interaction avec des objets photo-réalistes. Côté algorithmique, deux pistes peuvent être étudiées : 1- étendre [Thomas et al., 2018] en considérant l’activation simultanée de plusieurs compétences impactant différents facteurs de variation ; 2- le mélange d’une fonction de décorrélation [Kim and Mnih, 2018] avec un apprentissage contrastif temporel [Schneider et al., 2021].

Le/la stagiaire mènera une démarche de recherche incluant plusieurs étapes : 1- se familiariser avec l’apprentissage profond par renforcement, l’apprentissage intrinsèque de compétences et l’apprentissage de représentations démêlées et contrastives ; 2- Cibler et étudier l’état de l’art des approches traitant le démêlement ; 3- Proposer une contribution dans l’apprentissage actif et intrinsèquement motivé de représentations démêlées ; 4- Evaluer la méthode, et éventuellement écrire un article scientifique.

Profil recherché

— Niveau Bac+5 en robotique/intelligence artificielle/apprentissage machine.
— Expérience en Python et un framework d’apprentissage machine (Pytorch, Tensorflow, ...).
— Importante motivation pour la recherche en apprentissage machine.

Contact et candidature

Envoyer CV, lettre de motivation et relevés de notes Master/Ecole d’ingénieur à celine.teuliere@uca.fr et arthur.aubret@uca.fr

Le sujet complet est disponible ici : https://comsee.ispr-ip.fr/job-offers/