Annonce

Les commentaires sont clos.

Apprentissage profond et espaces de représentation pour l’interprétation des images satellitaires multi-capteurs

16 Mars 2022


Catégorie : Doctorant


Proposition de thèse sur l’apprentissage profond et les espaces de représentation pour l’interprétation des images satellitaires multi-capteurs au LTCI, équipe IMAGES, Télécom Paris

 

 

Contexte

L’intelligence artificielle (IA) et les approches par apprentissage ont révolutionné la vision par ordinateur et le traitement d’images ces dernières années. Le domaine de la télédétection, qui exploite des images satellitaires ou aériennes pour l’observation de la terre, profite lui aussi de l’efficacité de ces approches qui ont conduit à de nombreuses avancées. Néanmoins, une application directe des méthodes d’apprentissage se heurte à de multiples difficultés. Tout d’abord, le domaine de la télédétection a de fortes spécificités qui nécessitent des adaptations significatives des méthodes d'apprentissage.

Par exemple en imagerie SAR (Synthetic Aperture Radar), la focalisation de l’image, les spécificités de l'imagerie cohérente (speckle), ou encore la nature complexe et éventuellement vectorielle (en polarimétrie, interférométrie ou tomographie) des données doivent être prises en compte. Par ailleurs, il existe actuellement peu de jeux de données de télédétection étiquetés, en particulier en imagerie SAR, et la création de tels jeux est particulièrement coûteuse en ressources. D’un point de vue applicatif, le domaine de la télédétection connaît actuellement une très forte évolution avec la mise à disposition de quantités énormes de données avec des fréquences temporelles élevées, comme les données Sentinel-1 et Sentinel-2 de l’agence spatiale européenne. Ainsi, les défis actuels de l’imagerie satellitaire portent sur l’exploitation conjointe de multiples sources de données acquises aussi bien avec des capteurs actifs (comme les SAR) que passifs (capteurs optiques), à différentes résolutions spatiales, spectrales et temporelles.

 

Objectif

L’objectif de cette thèse est de construire un cadre de représentation générique et robuste permettant l’interprétation de scènes satellitaires à partir de données hétérogènes. Pour cela, nous proposons de construire une représentation de haut niveau de la scène qui pourra être utilisée pour différentes tâches, en nous appuyant sur une architecture d’apprentissage profond. Cette représentation pourra être alimentée par différents types de données (données optiques, SAR de différentes modalités -amplitude, interférométrie, tomographie-) pour donner une interprétation de la scène à différents niveaux (information de classes, hauteurs, évolutions temporelles, types de matériaux ou de rétro-diffuseurs, …).

Deux axes de recherche seront développés. D'une part, nous proposons d'exploiter les architectures des auto-encodeurs, et en particulier les auto-encodeurs variationnels pour construire des espaces de représentations possédant des propriétés d'invariance.

D'autre part, nous proposons d'introduire des relations spatiales entre les objets ou leurs parties dans les architectures de réseaux développées.

Les méthodes développées pourront être exploitées dans différents contextes : interprétation de scène en imagerie satellitaire multi-capteurs (milieu urbain ou applications environnementales), mise à jour lors de nouvelles acquisitions, détection de changements.

 

Références

[1] Emanuele Dalsasso, Loïc Denis, and Florence Tupin. As if by magic: self-supervised training of deep despeckling networks with MERLIN. IEEE Transactions on Geoscience and Remote Sensing, pages 1–1, 2022.

[2] A. Newson, A. Almansa, Y. Gousseau, and S. Ladjal. Taking apart auto-encoders,

how do they encode geometric shapes ?, 2018. HAL preprint hal-01676326.

[3] Mateus Riva, Pietro Gori, Florian Yger, Roberto Cesar, and Isabelle Bloch. Approximation of dilation-based spatial relations to add structural constraints in neural networks, 2021. arXiv 2102.10923.

[4] Joy Hsu, Jeffrey Gu, Gong-Her Wu, Wah Chiu, and Serena Yeung. Capturing implicit hierarchical structure in 3D biomedical images with self-supervised hyperbolic representations, 2021. arXiv 2012.01644.

 

 

Sujet détaillé

français / anglais

 

Contacts

florence.tupin@telecom-paris.fr, loic.denis@univ-st-etienne.fr