Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

11 juillet 2018

Thèse CIFRE - Communication et Systèmes et CEDRIC( Cnam), Paris -


Catégorie : Doctorant


Segmentation biophysique par réseaux de neurones appliquée à l'imagerie satellitaire multi-spectrale et radar

Mots-clés: Intelligence artificielle, Réseaux de neurones, Deep Learning, Classification, Observation de la terre, remote sensing.

Encadrement

Directeur de thèse : Michel CRUCIANU, professeur CNAM, équipe VERTIGO du CEDRIC

Encadrant CEDRIC : Mihai DATCU, titulaire de la chaire Blaise Pascal au CNAM (http://spacedatascience.cnam.fr/)

Encadrant CS SI : Sébastien Dorgan (ingénieur)

Contexte

Au cours des dernières années, l'évolution des méthodes d'intelligence artificielle de l’apprentissage classique (SVM) à l’apprentissage profond (réseaux de neurones multicouches) ont permis d'énormes progrès dans des domaines tels que la vision par ordinateur ou la reconnaissance vocale, surpassant même les performances humaines. Ces progrès ont permis l’émergence d’innovations qui sont maintenant au cœur de notre quotidien : assistants vocaux, voitures autonomes...

En parallèle, les méthodes d'apprentissage statistiques appliquées aux données d'imagerie satellitaire ont permis de créer des chaînes de segmentation biophysique semi-automatique relativement efficaces. Il serait donc naturel de penser que l'utilisation des méthodes d’apprentissage profond sur ces données conduirait à des avancées comparables à celles connues dans le domaine de la vision par ordinateur. Cependant, appliquées à des cas concrets, les résultats ne sont pas aussi probants et il est encore aujourd’hui impossible de fournir une segmentation biophysique à l’échelle d’un continent ou d’un pays de façon automatique et quasi temps réel.

Pour comprendre ce phénomène contre-intuitif, nous avons mené une étude des méthodes de classification existantes en utilisant des méthodes d'apprentissage profond sur des données satellitaires multispectrales. Les conclusions que nous avons tirées ne remettent pas en question les capacités des méthodes d'apprentissage profond, mais davantage et les approches utilisées pour construire des bases de données d'apprentissage et la grande sensibilité au bruit des réseaux neuronaux (overfitting).

Description du sujet

Les études que nous avons analysées forment leur base de données de d’apprentissage et de validation en étiquetant chaque pixel à l'aide d'une base de données de références et en divisant le produit multispectral dans le domaine spatial en tenseurs de petites tailles. Les tenseurs ainsi produits sont alors utilisés pour alimenter des réseaux de neurones convolutifs du type Inception, VGG ou ResNet extrêmement performant pour la classification ou la segmentation d’images colorisées.

Cette procédure conduit à injecter dans le réseau un grand nombre de pixels mal étiquetés provenant de l'imperfection des bases de données de références. Or les réseaux de neurones convolutifs sont très sensibles aux bruits de la base d’apprentissage et de validation qui les amènent à créer un grand nombre de faux positifs.

Certaines études choisissent de ne pas tenir compte de la dimension temporelle du problème et n'obtiennent donc des résultats satisfaisants uniquement sur les classes pseudo-invariantes (constructions, rivières, lacs …) mais sont inefficaces sur les classes à fortes variabilités temporelles (cultures, forêts …). D'autres abordent la composante temporelle en créant des tenseurs tridimensionnels sur l'espace, le temps et le spectre. Dans ce cas, ils obtiennent de meilleurs résultats sur les classes avec des variabilités temporelles plus élevées mais pour des coûts de traitement énormes et pour un gain de précision très faible, voire nul par rapport aux méthodes d’apprentissage classique. Enfin, aucune de ces études ne prend en compte des paramètres exogènes comme les données climatiques ou n'utilise des indicateurs consolidés pour réduire les biais de mesures ni de données fusionnées pour profiter des synergies des capteurs satellitaires de natures différentes (Optique, radar, interféromètre …).

Objectifs et approche

Compte tenu de cette analyse il semble nécessaire d’aborder la problématique de la segmentation biophysique appliquées aux données satellitaires par l’élaboration d’une approche générique pour la création des bases de données d’entrainement et de validation permettant de :

Compte tenu de la diversité des données Géospatiales et des « objets » quelles observentobservés, il faudra examiner, adapter et combiner des méthodes d’intelligence artificielle et des approches statistiques pour créer une méthode hybride s’adaptant aux mieux à la nature des données d’entrainement et à l’apprentissage des classes cibles.

Cette première partie de l’étude conduira à la création d’une chaîne traitement produisant une segmentation biophysique sur une zone d’intérêt géographique ou l’on dispose de séries temporelles d'images satellitaires (SITS) complètes et de base de données de références denses. Un cas d’étude pourrait-être de produire une segmentation en s’appuyant sur les produits Sentinel 2, pour les séries temporelles et sur le Registre Parcellaire Graphique (RPG) pour la base de données de références.

D’un point de vue plus général les observations multi-spectrales sont affectées par les occlusions de nuages, en raison des conditions atmosphériques, les observations sont à des intervalles de temps irréguliers, pour assurer des observations fréquentes, il faut utiliser des capteurs multiples et différents. Cette thèse abordera, étudiera et proposera des solutions pour l'apprentissage avec des SITS incomplets, irréguliers ou multi-capteurs.

Enfin la durée de vie d’une mission satellite d’observation de la Terre n’étant que de quelques années cette thèse abordera et proposera une méthode permettant d’assurer la continuité de l’exploitation de la chaîne de traitement dans le temps en transférant l’apprentissage acquis d’un capteur satellite vers un autre. De manière plus générale cette thèse étudiera les possibilités de transfert d’apprentissage entre capteur satellites par exemple Landsat 8 vers Sentinel 2, SPOT vers Pléiade.

Communications & Systèmes (CS) :

CS Systèmes d’Information, agit comme concepteur, intégrateur et opérateur de systèmes critiques. L’expertise de CS SI en matière d’applications et de systèmes critiques en fait le partenaire privilégié de grands secteurs économiques, notamment dans les domaines de la défense & de la sécurité, de l'espace, de l’aéronautique et de l’énergie.

CS intervient sur l’ensemble de la chaîne de valeur et bénéficie d’un positionnement différencié sur le marché des services numériques :

CS SI s’impose aujourd’hui comme un partenaire de confiance, reconnu par ses grands clients en raison de l’expertise, de l’engagement et du sens du service de ses collaborateurs.

Le domaine de l’espace est un des grands marchés où la société est présente depuis plus de 35 ans. La Business Unit Espace de CS SI, située à Toulouse, dont la vocation première est la fourniture clés en main de systèmes sols, pour tout type de mission (observation de la Terre, télécommunication, scientifique / interplanétaire, lanceur, ballons ou missions de Rendez-Vous type ATV).

Les principaux clients de la société dans le domaine spatial sont le CNES, l'ESA (ESOC, ESTEC et ESRIN), la DGA & le Ministère de la Défense, La Commission Européenne, Airbus Defense & Space, Thales Alenia Space et Eumetsat, mais CS SI a aussi œuvré pour de nombreux autres agences spatiales et industriels Européens.

CEDRIC-Cnam (http://cedric.cnam.fr) :

Le Centre d’Etudes et de Recherche en Informatique et Communications (CEDRIC) est un laboratoire académique qui fait partie du Cnam (Conservatoire National des Arts et Métiers, http://www.cnam.fr) et est localisé dans le centre de Paris. Les travaux des 160 chercheurs du laboratoire couvrent plusieurs domaines de l'informatique, du traitement du signal et des statistiques. Plusieurs membres permanents et plusieurs doctorants de deux équipes différentes travaillent sur l'apprentissage profond pour le traitement des images.

Profil recherché

La candidate ou le candidat devrait avoir des bases mathématiques solides et de bonnes connaissances dans le domaine de l'apprentissage statistique (et spécifiquement de l'apprentissage profond), ainsi que des connaissances générales dans le traitement du signal et de l'image. La maîtrise d'au moins un framework d'apprentissage profond est nécessaire.

Les lettres de candidature, accompagnées d'un CV détaillé et des relevés de notes devraient être transmises à michel.crucianu@cnam.fr, Mihai.Datcu@dlr.de, Sebastien.Dorgan@c-s.fr, Frederic.Andraud@c-s.fr.

Ecole doctorale : EDITE (ED130) - UPMC Sorbonne Universités

 

Intelligence artificielle, Réseaux de neurones, Deep Learning, Classification, Observation de la terre, remote sensing

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2018.