Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

15 décembre 2020

Stage M2 : Reconnaissance de texte dans les bandes dessinées


Catégorie : Stagiaire


Recherche d'un(e) stagiaire pour un projet de reconnaissance automatique de texte dans les bandes dessinées à l’aide d’un smartphone en Centre Val-de-Loire.

Mots-clés : Analyse d’images, deep learning, reconnaissance optique de caractères, interactions homme-machine

Lieu du stage : LIFAT (Tours) ou PRISME (Orléans) ou télétravail (selon le contexte sanitaire).
Dates :
5 mois entre Mars et Septembre 2021
Indemnités mensuelles légales en vigueur (
∼600 euros)

 

Contexte et objectifs du stage :
Dans le cadre d’un projet collaboratif entre le LIFAT, le PRISME et la société ALGONA, on souhaite développer d’une application mobile grand public pour détecter et "lire" le texte présent dans les bandes dessinées. Les usages d’une telle application sont nombreux, par exemple, apprentissage ludique de la lecture ou de langues étrangères, améliorer l’accès au livre pour les publics empêchés, etc.

Travail à réaliser :

• effectuer un état de l’art exhaustif sur les méthodes existantes de reconnaissance de texte dans les images (scènes naturelles, documents, bande dessinées, etc) ;
• évaluer les dernières méthodes sur des jeux de données ouvertes (eBDetheque, …) et sur une collection créée en partenariat avec la région Centre Val de Loire ;
• implémenter (Python, TensorFlow/Keras) et entraîner l'algorithme sélectionné ;
• intégrer la ou les méthodes retenues dans le prototype actuel de l’application Android.
Les ressources GPU/CPU et les bases d’images de bandes dessinées nécessaires seront mis à disposition par les laboratoires. Il sera possible de s’appuyer sur les compétences et les outils déjà existants au LIFAT et au PRISME, les outils open-source comme notamment les librairies de deep learning ainsi que les nombreuses méthodes déjà proposées dans la littérature.

Profil recherché : Le candidat souhaité est un(e) étudiant(e) en Master ou dernière année d’une formation d’ingénieur en Informatique, avec des bonnes compétences en programmation (langage Python) et des connaissances en analyse d’images et/ou reconnaissance des formes (machine learning). Une première expérience avec le Deep Laerning (Caffe, Torch, Theano ou TensorFlow) en utilisant des GPUs serait apprécié.

Candidater : envoyer CV + lettre de motivation + programme et notes de Master disponibles à frederic.rayar@univ-tours.fr et sylvie.treuillet@univ-orleans.fr

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2020.