Annonce

Les commentaires sont clos.

Implémentation efficace d'algorithmes d'apprentisage pour la télédétection

6 Novembre 2023


Catégorie : Stagiaire


Proposition de stage M2 LISTIC - Implémentation efficace d'algorithmes d'apprentisage pour la télédétection

 

Contexte

La télédétection est un domaine de recherche en pleine expansion. Les satellites d'observation de la terre produisent des quantités de données de plus en plus importantes. Ces données sont ensuite traitées par des algorithmes de traitement d'image pour en extraire des informations utiles. Cette particularité est associée à des problématiques d'efficacité en termes de stockage des données et en termes de rapidité de calcul des algorithmes de traitements asossciés. Notamment, les données restent plus dificiles à manipuler que dans des domaines tels que la vision par ordinateur du fait d'un bruit de mesure plus important (dans les images par radar à Synthèse d'ouverture) et de par les ordres de grandeurs spatiales et temporelles des images considérées. Pour palier cela, des traitements se reposants sur des statistiques robustes, souvent multivariées, ont été développées dans les années récentes: [1, 2, 3].
Le fonctionnement de ces méthodes repose sur l'estimation d'une matrice de covariance sur voisinage de pixels (spatial/temporel ou les deux) et de l'utiliser comme information pour le traitement (détection de changements/classification, etc). Ces méthodes sont efficaces mais nécéssitent un temps de calcul important et une grande quantité de mémoire pour pouvoir être appliquées sur des données réelles.
On veut s'intéresser dans ce stage à améliorer la perfromance de calculs d'algorithmes de détections de changements et de classification d'images SAR et/ou hyeprspectrales. Le principal point bloquant à l'heure actuelle concerne l'implémentation réalisée de manière non-efficace en python natif avec la librairie numpy. L'objectif de ce stage est alors de s'intéresser à différentes techniques qui permettent d'améliorer le temps de calcul en pratique afin de pouvoir appliquer ces méthodes sur des données réelles à grande échelle.

Travail proposé

Deux axes de travail sont proposés en parallèle:

  1. Développement d'un processus de benchmarking objectif:

    Pour pouvoir développer des algorithmes efficaces, il est d'abord nécéssaire de définir des critères en amont qui permettent de valider les implémentations faites avec pour objectif de pouvoir exploiter ces algorithmes en pratique sur des données réelles d'images de télédection. Pour ce faire, une revue de littérature sera effectuée au débout du stage (ttp://www.cmap.polytechnique.fr/~nikolaus.hansen/benchmarking-and-experimentation-gecco17-slides.pdf} par exemple pour commencer.) pour ensuite développer des outils qui automatisent les tests et permettent de comparer les performances des différentes implémentations.
    Enfin, selon le temps, une processus de test sur données réelles sera développé pour pouvoir tester les algorithmes sur des données réelles. Notamment, on pourra s'intéresser utiliser un système de base de données spatiotemporelles pour rationaliser l'accès au données.
  2. Implémentation d'algorithmes d'apprentissage efficaces. On s'intéressera dans un premier temps à une problématique de détection de changements sur des séries temporelles d'images SAR. Deux détecteurs basés sur la covariance seront considérés [4, 5]. À partir d'implémentaitons en python on essaiera d'améliorer le temps de calcul grâce aux approches suivantes:

    * Utilisation de compilateurs à la volée (jit) tels que JaX\footnot (https://jax.readthedocs.io/en/latest/notebooks/quickstart.html) ou numba (https://numba.pydata.org)
    * Implémentation en language C et interfaçage avec python à l'aide de Cython.
    * Implémentation du calcul sur GPU avec notamment des stratégies de parcours de données.

Dans un deuxième temps, on s'attachera à clasisfier des images SAR et hyperspectrales (classification de terrain) en essyant de transposer les approches vues sur le problème plus simple de la détection de changement.

Environnement scientifique
 
Le stage se déroulera au sein du LISTIC, de l'Université Savoie Mont Blanc à Annecy. La durée du stage varie entre 4 mois et 6 mois. Le stage sera encadré par Ammar Mian, Mâitre de conférences à l'Université Savoie Mont Blanc.
 
Compétences requises
 
Connaissance de python et de numpy. Des notions de C et de CUDA sont un plus.
Intérêt pour la télédétection et les problématiques de traitement d'image ainsi que pour les problématiques d'optimisation et d'efficacité en calcul scientifique.
 
Candidater
 
Envoyer un CV et une lettre de motivation à ammar.mian@univ-smb.fr.
 
Bibliographie
  • [1] Anderson, T. W. (1962). An introduction to multivariate statistical analysis. Technical report, Wiley New York.
  • [2] Collas, A. (2022). Riemannian geometry for statistical estimation and learning: application to remote sensing.
  • [3] Conradsen, K., Nielsen, A. A., Schou, J., and Skriver, H. (2003). A test statistic in the complex wishart distribution and its application to change detection in polarimetric sar data. IEEE Transactions on Geoscience and Remote Sensing, 41(1):4–19.
  • [4] Mian, A., Ginolhac, G., Ovarlez, J.-P., and Atto, A. M. (2019). New robust statistics for change detection in time series of multivariate sar images. IEEE Transactions on Signal Processing, 67(2):520– 534.
  • [5] Zhong, N., Yang, W., Cherian, A., Yang, X., Xia, G.-S., and Liao, M. (2017). Unsupervised classification of polarimetric sar images via riemannian sparse coding. IEEE Transactions on Geoscience and Remote Sensing, 55(9):5381–5390.