Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

8 septembre 2017

Désambiguïsation sémantique multimédia (Vision par ordi ou TAL)


Catégorie : Post-doctorant


Le CEA LIST propose un post-doc sur la désambiguïsation sémantique multimédia dans le cadre d’une collaboration avec le CNRS LIMSI. Le sujet se situe à la croisée de la vision par ordinateur et du traitement du langage naturel, pour fabriquer des espaces communs aux deux média texte et image.

CDD de 12 mois au CEA à nanoinnov (Palaiseau, 91), à pourvoir en janvier 2018.

 

Description du poste

La liaison d'entités (ou entity linking) consiste à relier des mentions d'entités d'un texte à des entités d'une base de connaissance (BC) si elles existent, dans le but de normaliser ces mentions. C'est un problème qui se pose, par exemple, pour le peuplement de bases de connaissances par extraction d'information à partir de textes. Une difficulté de cette tâche est la résolution d'ambiguïtés car les systèmes ont à choisir parmi un nombre important de candidats.

La désambiguïsation d’entités en tant que telle concerne à ce jour des données textuelles exclusivement, mettant en regard des problématiques de traitement automatique de la langue et de représentation de la connaissance. Le post-doc de 12 mois proposé vise à étudier l’intérêt d’ajouter la dimension visuelle pour aider à la désambiguïsation, chaque fois que cela peut être utile.

La vision par ordinateur a connu une rupture significative de la qualité des résultats de reconnaissance visuelle faisant suite au retour en grâce des réseaux de neurones sous forme d’architectures profondes. L’apprentissage profond a également eu un impact bénéfique dans le domaine du traitement des langues naturelles, bien que moins significatif qu’en vision à ce jour. En particulier les modèles de word embedding tel celui de (Mikolov et al., 2013) offrent une représentation des mots qui ont permis des avancées dans plusieurs tâches. Ce post-doc se situe à la croisée de la vision par ordinateur et du traitement du langage naturel, pour fabriquer des espaces communs « texte et image ».

L’approche générale envisagée repose sur un couplage précoce des entités visuelles et textuelles, obtenu au sein d’un espace commun texte image résultant, par exemple, d’un apprentissage par un réseau neuronal profond tendant à optimiser le rapprochement des documents à lier (image et texte se correspondant). Il s’agira d’étudier comment prendre en compte les représentations construites soit pour améliorer la sélection d’entités candidates à partir d’une mention dans un texte soit pour sélectionner le meilleur candidat. La dernière tâche concernera l’évaluation de l’intérêt des méthodes développées. Elle sera menée prioritairement sur une tâche de désambiguïsation d’entités nommées au sein d’articles (de presse) illustrés. Étant donné la nouveauté de la problématique en tant que telle, un ou plusieurs corpus pourront être créés en vue d’être distribués auprès de la communauté scientifique.

Le post-doc devra aboutir à des publications dans les conférences et revues du meilleur niveau du domaine concerné. La personne recrutée participera à des séminaires et présentera les résultats de ses travaux devant les groupes de travail concernés du plateau de Saclay (DIGICOSME). Idéalement, les expérimentations s’appuieront sur un code suffisamment bien structuré pour qu’il puisse donner lieu à un démonstrateur. La mise en place d’un démonstrateur complet n’est pas requise dans le cadre du post-doc, celle-ci pouvant être réalisée par des ingénieurs des équipes co-encadrant le post-doc. Toutefois, si la personne recrutée estime que la réalisation d’un tel démonstrateur valorise sa carrière, elle aura la possibilité de s’y investir, notamment si cela peut faire l’objet d’une participation à un workshop dédié, adossé à l’une des conférences du domaine.

Profil du candidat

Contrat et candidature

CDD de 12 mois au CEA de Saclay (91). Salaire selon diplômes et expériences.

Envoyer CV (format PDF ou URL), lettres de recommandation et lettre/mail de motivation à herve.le-borgne@cea.fr et brigitte.grau@limsi.fr. Merci de ne pas envoyer votre manuscrit de thèse ni vos publications par mail (leur référence dans le CV suffisent).

Présentation du laboratoire d’accueil

Le CEA-LIST est un laboratoire de 800 personnes, localisé sur le plateau de Saclay (91), dont les axes de recherche s’inscrivent dans le domaine des systèmes complexes à dominante logiciel. La mission du CEA LIST est le transfert d’innovation vers le monde industriel. Par ce positionnement, le CEA LIST occupe une place privilégiée dans les réseaux de collaboration entre laboratoires académiques, centre de recherche et acteurs industriels (grand groupes et PME) à l’échelle européenne et mondiale.

Au sein du CEA LIST, le Laboratoire Vision et Ingénierie des Contenus (www.kalisteo.eu) regroupe 80 chercheurs autour de thèmes de recherche qui sont l’analyse de document Multimédia (analyse jointe texte et image) et d’autres activité de vision par ordinateur. La personne recrutée travaillera notamment avec H. Le Borgne (vision par ordinateur), O. Ferret et R. Besançon (traitement automatique des langues).

Le post-doc sera co-encadré par Brigitte Grau, appartenant à l’équipe « Information Langue Écrite et Signée » du CNRS LIMSI (https://www.limsi.fr/fr/recherche/iles).

H. Le Borgne : https://sites.google.com/site/hleborgne

B. Grau : https://perso.limsi.fr/bg/

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2015.