Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

15 novembre 2018

Stage Ingénieur: Indexation de vidéos par le contenu


Catégorie : Stagiaire


L'objectif de ce stage d'une durée de 6 mois est d'identifier et évaluer des techniques d'extraction d'informations sémantiques de vidéos afin de faciliter leur indexation et de proposer des modes alternatifs de visionnage.

 

A partir de l'utilisation combinée de techniques classiques de suivi d'objets dans les vidéos (e.g. Lucas-Kanade point tracker) et d'approches de type Deep Learning pour la détection d'objets particuliers (e.g. visages, personnes, véhicules, ...), l'objectif sera d'extraire d'une vidéo un ensemble minimum d'observations permettant de rapidement décrire la vidéo en termes des visages, lieux et objets qui y apparaissent. L'un des objectifs sera notamment d'associer automatiquement toutes les instances d'un même objet (par exemple un même visage vu à des instants différents de la vidéo), de manière à pouvoir directement accéder aux portions de la vidéo où cette instance d'objet apparaît. Ce type d'information pourra également être utilisé afin d'améliorer l'indexation par le contenu des vidéos ainsi analysées.

Après un état de l'art des dernières avancées en extraction automatique de résumés vidéos et en indexation de vidéos par le contenu, les approches les plus prometteuses seront sélectionnées, implémentées et améliorées de manière à répondre aux besoins.

Le stage se déroulera au sein de l'équipe "Future Image Processing Technologies" basée sur le site d'Elancourt d'Airbus Defence and Space et spécialisée dans la maturation d'algorithmes de traitement d'image et de vision par ordinateur pour les applications et produits du groupe. Les domaines applicatifs typiques incluent la reconstruction 3D à partir d'images aériennes ou satellitaires, la réalité augmentée, la navigation basée vision, l'indexation de bases de données d'images ou de vidéos, et, de manière générale, l'extraction d'information de contenus visuels (images et vidéos).

Compétences requises :
- Première expérience en vision par ordinateur
- Première expérience en Deep Learning (codage, entraînement et évaluation de réseaux de neurones)
- Connaissances de OpenCV, Tensorflow
- Programmation en C++, python
- Anglais : avancé
- Français : avancé

Date de démarrage : courant 2019 (date flexible) - Durée 6 mois.
Lieu : Elancourt (région parisienne)
Contact : denis.marraud@airbus.com

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2018.