Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

22 septembre 2017

Stage M2 laboratoires IMS et IMB


Catégorie : Stagiaire


Sujet de master : géométrie de l'information et apprentissage statistique dans les variétés Riemanniennes

Encadrants : Salem Said, Marc Arnaudon, Yannick Berthoumieu

Etablissement : Laboratoire IMS (bât A31), IMB (bât A33) Université de Bordeaux, Campus de Talence

CV et lettre de motivation : envoyer à salem.said@u-bordeaux.fr

Profil recherché : bonnes connaissances en statistique inférentielle ; la familiarité avec les algorithmes EM, k-moyennes, et SVM serait un plus ; quelques connaissances de départ en géométrie différentielle ou Riemannienne ; aisance avec MATLAB ou Python

Poursuite : ce stage ouvre potentiellement sur une thèse de doctorat.

 

Le problèmes d'apprentissage statistique (par exemple d'estimation de densité de probabilité, de régression non linéaire, ou de classification) sont classiquement posés pour des données qui appartiennent à un espace euclidien. Or, de plus en plus d'application font appel à des données qui appartiennent à une variété Riemannienne. Par exemple, on voit apparaître de telles données en traitement des signaux radar, en neurosciences, en vision par ordinateur, et en robotique, entre autres. Le sujet de master permettra au candidat de se familiariser avec la recherche menée aux laboratoires IMS et IMB sur l'apprentissage statistique dans les variétés Riemanniennes. C'est une recherche interdisciplinaire, faisant intervenir la science des données et les mathématiques, et qui a déjà produit des résultats bien reconnus.

Deux pistes pourront être poursuivies durant le stage, selon le choix du candidat et des encadrants : (i) l'estimation en ligne des lois de mélange dans une variété Riemannienne, (ii) le calcul de la distance statistique entre deux clusters (populations unimodales) sur une variété Riemannienne. Concrètement, les variétés en question seront des variétés de Grassmann (applications en robotique et en vision par ordinateur, et incontournables pour les problèmes de réduction de dimensionnalité), ou des variétés de matrices de covariance (applications en radar ou en neurosciences).

Le candidat devra se familiariser avec la technique dite de "tir géodésique" qui sera utilisée pour effectuer le calcul de la distance statistique. Cette technique fait appel aux aspects fondamentaux de la géométrie Riemannienne, liés à l'équation de Jacobi. L'objectif sera de l'implémenter sous MATLAB ou Python, et de la valider, à travers l'application à la problématique de la fusion des bases de données.

Bibliographie :

--- Bases en géométrie Riemannienne :

--- Données sur les variétés Riemanniennes :

--- Modèles de mélange sur les variétés Riemanniennes :

--- Version en ligne de l'algorithme EM :

--- Distance statistique entre clusters :

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2018.