Annonce
OFRRE DE THESE « Description de vidéo par enrichissement textuel et sémantique »
9 Mars 2023
Catégorie : Doctorant
OFRRE DE THESE « Description de vidéo par enrichissement textuel et sémantique »
Mots-clés : description de vidéo, apprentissage profond, réseau neuronal convolutif, résolution de coréférences, graphe de connaissances, multi-tâches, multimodalité
Résumé : Le sujet de la thèse porte sur la génération automatique de descriptions de vidéo en s'appuyant sur le traitement automatique du langage naturel et l'apprentissage profond. Un descriptif du sujet peut-être obtenu en ligne à https://www.info.univ-tours.fr/~soulet/download/phdsubject_short_fr.pdf
Laboratoire : LIFAT, équipes BDTLN et RFAI, Université de Tours
Lieu : Blois et Tours
Durée : 3 ans
Financement : 3 années - salaire 1600€ / mois
Profil candidat.e : Master en informatique, initiation à la recherche (enseignement suivi, ou projet, ou stage), motivation pour le TAL et l’imagerie par l’apprentissage profond
Date limite dossier complet dans ADUM : 15/05/2023
Lien de candidature : https://collegedoctoral-cvl.fr/as/ed/voirproposition.pl?site=CDCVL&matricule_prop=46957
Contacts : mathieu.delalandre@univ-tours.fr, nathalie.friburger@univ-tours.fr, donatello.conte@univ-tours.fr, arnaud.soulet@univ-tours.fr
OFRRE DE THESE « Description de vidéo par enrichissement textuel et sémantique »
Mots-clés : description de vidéo, apprentissage profond, réseau neuronal convolutif, résolution de coréférences, graphe de connaissances, multi-tâches, multimodalité
Résumé : Le sujet de la thèse porte sur la génération automatique de descriptions de vidéo en s'appuyant sur le traitement automatique du langage naturel et l'apprentissage profond. L'objectif est de surmonter les limitations des bases de données existantes en termes d’hétérogénéité d’encodage, de faible multimodalité et qualité de la vérité terrain afin d’améliorer les performances des méthodes de description de vidéo. Pour cela, nous envisageons d’appliquer des réseaux de neurones convolutifs sur des vidéos enrichies avec des données textuelles et sémantiques en s’appuyant notamment sur les graphes de connaissances du Web des données. Ce travail de thèse implique de résoudre des défis scientifiques tels que la résolution de coréférences et le traitement multi-tâche et multimodal pour l'évaluation de performance. En outre, le projet contribuera à la constitution de bases de données standardisées et à grande échelle pour l'évaluation de performance des méthodes de description de vidéo, ce qui est indispensable pour des recherches futures dans ce domaine. Un descriptif du sujet peut-être obtenu en ligne à https://www.info.univ-tours.fr/~soulet/download/phdsubject_short_fr.pdf
Laboratoire : LIFAT, équipes BDTLN et RFAI, Université de Tours
Lieu : Blois et Tours
Durée : 3 ans
Financement : 3 années - salaire 1600€ / mois
Profil candidat.e : Master en informatique, initiation à la recherche (enseignement suivi, ou projet, ou stage), motivation pour le TAL et l’imagerie par l’apprentissage profond
Date limite de candidature : 15/05/2023
Pièces nécessaires : bulletins de notes M1 et M2, lettres de recommandation,
Lien de candidature : https://collegedoctoral-cvl.fr/as/ed/voirproposition.pl?site=CDCVL&matricule_prop=46957
Contacts : mathieu.delalandre@univ-tours.fr, nathalie.friburger@univ-tours.fr, donatello.conte@univ-tours.fr, arnaud.soulet@univ-tours.fr
URLs :Université de Tours https://international.univ-tours.fr/, LIFAT https://lifat.univ-tours.fr/ , équipe RFAIhttps://www.rfai.lifat.univ-tours.fr/ , home pages ( https://www.info.univ-tours.fr/~soulet/, https://www.info.univ-tours.fr/~friburger/, http://mathieu.delalandre.free.fr/ )