Annonce

Les commentaires sont clos.

OFRRE DE THESE « Description de vidéo par enrichissement textuel et sémantique »

9 Mars 2023


Catégorie : Doctorant


OFRRE DE THESE « Description de vidéo par enrichissement textuel et sémantique »

Mots-clés : description de vidéo, apprentissage profond, réseau neuronal convolutif, résolution de coréférences, graphe de connaissances, multi-tâches, multimodalité

Résumé : Le sujet de la thèse porte sur la génération automatique de descriptions de vidéo en s'appuyant sur le traitement automatique du langage naturel et l'apprentissage profond. Un descriptif du sujet peut-être obtenu en ligne à https://www.info.univ-tours.fr/~soulet/download/phdsubject_short_fr.pdf

Laboratoire : LIFAT, équipes BDTLN et RFAI, Université de Tours

Lieu : Blois et Tours

Durée : 3 ans

Financement : 3 années - salaire 1600€ / mois

Profil candidat.e : Master en informatique, initiation à la recherche (enseignement suivi, ou projet, ou stage), motivation pour le TAL et l’imagerie par l’apprentissage profond

Date limite dossier complet dans ADUM : 15/05/2023

Lien de candidature : https://collegedoctoral-cvl.fr/as/ed/voirproposition.pl?site=CDCVL&matricule_prop=46957

Contacts : mathieu.delalandre@univ-tours.fr, nathalie.friburger@univ-tours.fr, donatello.conte@univ-tours.fr, arnaud.soulet@univ-tours.fr

 

OFRRE DE THESE « Description de vidéo par enrichissement textuel et sémantique »

Mots-clés : description de vidéo, apprentissage profond, réseau neuronal convolutif, résolution de coréférences, graphe de connaissances, multi-tâches, multimodalité

Résumé : Le sujet de la thèse porte sur la génération automatique de descriptions de vidéo en s'appuyant sur le traitement automatique du langage naturel et l'apprentissage profond. L'objectif est de surmonter les limitations des bases de données existantes en termes d’hétérogénéité d’encodage, de faible multimodalité et qualité de la vérité terrain afin d’améliorer les performances des méthodes de description de vidéo. Pour cela, nous envisageons d’appliquer des réseaux de neurones convolutifs sur des vidéos enrichies avec des données textuelles et sémantiques en s’appuyant notamment sur les graphes de connaissances du Web des données. Ce travail de thèse implique de résoudre des défis scientifiques tels que la résolution de coréférences et le traitement multi-tâche et multimodal pour l'évaluation de performance. En outre, le projet contribuera à la constitution de bases de données standardisées et à grande échelle pour l'évaluation de performance des méthodes de description de vidéo, ce qui est indispensable pour des recherches futures dans ce domaine. Un descriptif du sujet peut-être obtenu en ligne à https://www.info.univ-tours.fr/~soulet/download/phdsubject_short_fr.pdf

Laboratoire : LIFAT, équipes BDTLN et RFAI, Université de Tours

Lieu : Blois et Tours

Durée : 3 ans

Financement : 3 années - salaire 1600€ / mois

Profil candidat.e : Master en informatique, initiation à la recherche (enseignement suivi, ou projet, ou stage), motivation pour le TAL et l’imagerie par l’apprentissage profond

Date limite de candidature : 15/05/2023

Pièces nécessaires : bulletins de notes M1 et M2, lettres de recommandation,

Lien de candidature : https://collegedoctoral-cvl.fr/as/ed/voirproposition.pl?site=CDCVL&matricule_prop=46957

Contacts : mathieu.delalandre@univ-tours.fr, nathalie.friburger@univ-tours.fr, donatello.conte@univ-tours.fr, arnaud.soulet@univ-tours.fr

URLs :Université de Tours https://international.univ-tours.fr/, LIFAT https://lifat.univ-tours.fr/ , équipe RFAIhttps://www.rfai.lifat.univ-tours.fr/ , home pages ( https://www.info.univ-tours.fr/~soulet/, https://www.info.univ-tours.fr/~friburger/, http://mathieu.delalandre.free.fr/ )