Annonce

Les commentaires sont clos.

Thèse Cifre : Architectures embarquées temps réel pour la Classification automatique de cellules biologiques

10 Mai 2022


Catégorie : Doctorant


Le descriptif complet du sujet de thèse est également accessible en téléchargement : http://ginhac.com/jobs/phd-2022.pdf

Titre de la thèse :

Architectures embarquées temps réel pour la Classification automatique de cellules biologiques

Champs scientifiques de la thèse :

Électronique, Informatique, Numérique

Mots clés :

Vision embarquée, Réseaux de neurones, Électronique embarquée, Apprentissage semi-supervisé, Algorithmie temps réel pour l’image

Contacts pour renseignements et candidature :

Date limite de candidature : 31 juillet 2022

Contexte de la thèse

Bien que les réseaux de neurones existent depuis les années 1940, leur utilisation massive en vision artificielle est très récente et remonte à 2012, lorsque le réseau Alexnet a surpassé pour la première fois les méthodes « traditionnelles » de classification d'images. Les principales raisons à l'origine de ce succès sont la disponibilité de grands ensembles de données dans le cloud et d’une énorme puissance de calcul accessible sur des serveurs de GPU. Depuis lors, les recherches se sont focalisées sur la mise en œuvre de réseaux de neurones de plus en plus profonds capables d’atteindre des performances inégalées dans de nombreux domaines. Cependant, ces réseaux complexes sont souvent incompatibles avec une utilisation embarquée sur des terminaux mobiles ou des architectures spécifiques dont les ressources matérielles peuvent être très contraintes. Malgré une intégration de plus en poussée de la mémoire et une augmentation de la puissance de calcul des GPU/FPGA, obtenir une implémentation efficace sur de telles architectures demeure un problème de recherche encore non résolu. Cela passe par une démarche systématique d’Adéquation Algorithme Architecture (AAA) visant à réduire significativement la complexité des algorithmes tout en garantissant des performances similaires, compatibles avec les exigences de la cible matérielle. Cette démarche a pour objectif d’explorer l’espace des solutions potentiellement implémentables en ayant recours à des techniques d’Approximate Computing pour limiter la quantité de mémoire nécessaire et d’élagage (pruning) des couches des réseaux pour limiter le nombre d’opérations de calcul à effectuer.

Ainsi, l’objectif de cette thèse est d’étudier et de proposer un système automatique novateur pour la classification de cellules biologiques à base de réseaux profonds. L’innovation portera à la fois sur les aspects logiciels en proposant un modèle de réseau combinant efficacité et simplicité et sur les aspects matériels en proposant une architecture électronique capable d’embarquer les algorithmes proposer et de les exécuter en temps réel. Autrement dit, l’objectif principal de la thèse est d’apporter des réponses à la question « Peut-on concevoir une architecture logicielle / matérielle pour la classification temps réel de cellules biologiques ? »

Du point de vue logiciel, une première piste envisagée peut être une approche semi-supervisée avec un modèle génératif de type GAN ”Generative Adversarial Networks” qui possède des propriétés intéressantes (complexité compatible avec l’architecture matérielle envisagée, entrainement avec un nombre réduit de données annotées). Cette première approche pourra être complétée par d’autres méthodes (en fonction de l’évolution très rapide de l’état de l’art), ce qui permettra d’offrir au final un panel de solutions candidates plus large.

Du point de vue matériel, en complément de la forte dominante algorithmique mentionnée précédemment, les travaux à mener nécessiteront une implication forte en électronique embarquée sur différentes cibles matérielles telles que FPGA, SoC et GPU. En étroite collaboration avec la société SeeFast Techonoloies/ Photon Lines, la première étape sera de définir la cible matérielle qui sera capable de satisfaire les exigences et contraintes relatives du cahier des charges. Par la suite, à partir de cette cible matérielle, il s’agira donc de proposer une architecture embarquée novatrice de réseaux convolutifs capable d’exécuter en temps réel les algorithmes proposés dans la partie logicielle.

Description des travaux de thèse :

Dans une première partie de la thèse, une étude bibliographique sur les différentes approches d’intégration des CNNs sur des cibles matérielles embarquées devra être menée. Une attention toute particulière devra être portée sur les solutions et performances proposées par les différents fabricants de silicium dans le cadre des applications AI. Il sera fait de même avec les bibliothèques de développement software dédiées AI proposées sur le marché.

Dans une seconde partie de la thèse, en ayant recours aux bibliothèques et IP dévolues aux CNN, une ou plusieurs architectures de réseaux convolutifs devront être explorées, mises en œuvre et évaluées à la fois au niveau des performances de classification mais également en complexité matérielle.

Dans une troisième partie, l’intégration du réseau retenu sera réalisée sur le système matériel embarqué. Des adaptations (approximate computing, pruning, …) devront être éventuellement menées afin de tenir compte des spécificités de la cible et ainsi optimiser les performances du système.

Dans une quatrième partie, une évaluation la plus exhaustive possible sera menée. Elle comprendra des tests réalisés à partir de datasets, des comparaisons de performance avec des modèles de l’état de l’art, des évaluations sur des données acquises en situation réelle, …

Planning de la thèse :

  • Phase 1 (durée de 3 mois) : Étude bibliographique sur les CNNs dans le cadre d’applications embarquées et étude des bibliothèques afférentes.
  • Phase 2 (3 à 6 mois) : Définition de l’architecture du système complet
  • Phase 2 bis (3 à 6 mois) : Étude et modélisation des algorithmes du système embarqué. Cette étape pourra être réalisée en parallèle de l’étape 2.
  • Phase 3 (12 à 15 mois) : Conception de système complet avec portage de l’algorithmie développée en phase 2 et 2bis.
  • Phase 4 (6 mois) : Optimisation des performances.
  • Phase 5 (3 mois) : Mesure des performances, comparaison des différents modèles développés
  • Phase 6 (3 mois) : Rédaction du manuscrit de thèse.

Présentation des partenaires

Le Laboratoire ImVia (Imagerie et Vision Artificielle) de l'Université de Bourgogne est un laboratoire de recherche spécialisé dans le domaine de la Vision Artificielle. Il est composé d’une cinquantaine d’enseignants-chercheurs organisés en trois équipes :

  • CORES (COmputer vision for REal time Systems) - Cette équipe propose pour thématique principale non seulement le développement d'architectures de systèmes spécifiques de vision et d'imagerie mais aussi des méthodes de traitements associés permettant de répondre aux contraintes de l'application considérée et d'analyser/exploiter les données générées.
  • IFTIM (Imagerie Fonctionnelle et moléculaire et Traitement des Images Médicales) Cette équipe étudie le déploiement de nouveaux traceurs d’imagerie en préclinique et clinique, le développement de nouvelles applications en imagerie médicale (physique, médecine) ainsi que le traitement et l’analyse des images associées.
  • VIBOT (VIsion pour la roBOTique) - Cette équipe aborde les problématiques liées à l’imagerie non-conventionnelle pour la robotique et à la reconstruction et l’analyse de scènes.

La Société Photon Lines est un groupe dont la vocation est de fournir des solutions optiques innovantes pour la recherche, l’industrie, la sécurité et les télécom. La photonique est omniprésente dans le monde de la Recherche, avec des applications très diversifiées. Photon Lines propose une très large gamme de produits et services répondant aux besoins classiques et beaucoup plus spécifiques, pour la physique et la bioimagerie. Nos services associés se composent d’un support technique et SAV, un service R&D qui assure également des formations et prestations.

La société See Fast Technologies est l'antenne R&D de Photon Lines. Elle s'est développée autour de solutions d'imagerie pour les marchés de l'industrie et de la recherche. Son savoir-faire en matière de conception matérielle et de développement logiciel permet de répondre à toutes les demandes en termes de rapidité et de grands volumes de données à traiter en temps réel. L'équipe d'experts en traitement d'images, en électronique embarquée (FPGA) et en optique peut produire des caméras personnalisées et des solutions d'analyse entièrement intégrées sur la base de spécifications particulières.

Profil du candidat recherché

Sur le plan scientifique, le candidat devra posséder des compétences solides en électronique embarquée sur FPGA, SoC et/ou GPU ainsi qu’en algorithmie de vision artificielle. Des connaissances en vision embarquée temps réel seraient un plus. Sur le plan humain, la thèse proposée conviendra parfaitement à un doctorant curieux, inventif, dynamique, possédant un solide socle de compétences matérielles et logicielles dans le domaine de la vision artificielle sous contraintes, ayant de bonnes capacités à travailler en groupe, capable de s’adapter à un environnement collaboratif mêlant recherche académique et entreprise privée.

Ecole Doctorale

SPIM - Sciences Physiques pour l'Ingénieur et Microtechniques n°37 UBFC, Université Bourgogne Franche Comté, Dijon, France

Laboratoire de Recherche :

ImVia (Imagerie et Vision Artificielle), Equipe CORES (COmputer vision for REal time Systems), Dijon,

Encadrement de la thèse:

Eléments à fournir pour candidater

Les candidatures devront impérativement comprendre un CV détaillé, une lettre de candidature détaillant vos motivations pour la thèse proposée, le relevé de notes de diplôme de master ou ingénieur, l’identité d’une ou plusieurs personnes référentes (enseignant référent, responsable de filière, maître de stage, …) pouvant être contactées.

Les candidatures devront être envoyées à Barthélémy HEYRMAN barthelemy.heyrman@u-bourgogne.fr et Dominique Ginhac dominique.ginhac@u-bourgogne.fr