Annonce

Les commentaires sont clos.

Stage M2 ONERA - Self Supervised Learning pour la détection d'objets de petite taille

14 Novembre 2023


Catégorie : Stagiaire


Stage au département d'Optique et Techniques Associées de l'ONERA Palaiseau sur l'adaptation aux petits objets d'algorithmes de détection du type YOLO avec pré-entrainement sur des données non labélisées via une tâche prétexte (SSL - self supervised learning)

 

Début : entre février et mai 2024

Durée : 5 à 6 mois

Contact : envoyer un CV à alina.ciocarlan@onera.fr et sidonie.lefebvre@onera.fr

 

Sujet :

Le développement de capteurs qui permettent d’acquérir de façon simultanée des images dans plusieurs bandes spectrales du visible à l’infrarouge lointain et leur exploitation automatique, rendue possible grâce à l’essor des méthodes de machine learning (SVM, arbres de décision, réseaux de neurones…), ont permis de réaliser ces 20 dernières années de grands progrès en détection, reconnaissance et identification (DRI). Cependant, il demeure difficile de détecter des objets de petite taille (entre 1 et 50 pixels de surface), notamment quand ils présentent un faible contraste par rapport au fond ou quand on cherche à les détecter sur un fond texturé comme un ciel nuageux.

Les méthodes de deep learning ont connu un très fort développement ces dernières années, car elles ont démontré qu’elles pouvaient, en extrayant automatiquement des caractéristiques non linéaires bien adaptées à la tâche à accomplir, surpasser les techniques conventionnelles en termes de performances dans de nombreux domaines : classification automatique, détection et reconnaissance d’objets dans des images, traduction de texte... Toutefois, en imagerie, ces performances en détection et classification sont obtenues pour des objets de grande taille dans des images RGB. De plus, l’apprentissage des paramètres des réseaux profonds nécessite d’avoir accès à des grandes bases de données annotées (plusieurs centaines de milliers ou plusieurs millions d’exemples) pour éviter le phénomène de surapprentissage. Il est difficile d’accéder à ce volume de données pour des instruments fonctionnant en infrarouge.

L’objectif du stage consistera à proposer des méthodes de détection à base de deep learning adaptées au cas d'objets de petite taille, potentiellement de faible contraste par rapport au fond, pour lesquelles la signature est mesurée ou simulée en infrarouge.

Le ou la candidat(e) s’intéressera à l'adaptation aux petits objets d'algorithmes de détection du type YOLO [Redmon2016], en proposant des modifications de l'architecture pour conserver des caractéristiques à des échelles pertinentes pour les petits objets et en incluant des mécanismes d'attention qui permettent, suivant leur type, attention spatiale ou par canal, d'améliorer la prise en compte de l’information contextuelle spatiale ou bien de sélectionner les canaux les plus pertinents [Liang2023]. L'apport d'un module de décision a contrario similaire à celui proposé dans [Ciocarlan2023] sera également évalué.

Enfin, du fait de la difficulté à disposer de grandes bases de données annotées en infrarouge, l'apport des méthodes de pré-entrainement d'une partie du réseau sur des données non labélisées via une tâche prétexte (SSL - self supervised learning) sera envisagée. Il faudra pour cela définir une tâche prétexte pertinente pour la détection de petits objets sur fonds texturés, en s'appuyant notamment sur les travaux à base de masked autoencoder [He2021] ou d'apprentissage contrastif intra-image [Zhao2021].

Si le temps le permet, l'adaptation de la méthodologie à des données multispectrales ou multitemporelles sera envisagée. Les travaux de stage pourront en effet se poursuivre dans le cadre d'une thèse dédiée à la détection de cibles de petite taille en multispectral.

Bibliographie :

[Redmon2016] J. Redmon et al., "You only look once: Unified, real-time object detection." Proceedings of the IEEE conference on computer vision and pattern recognition. 2016.

[He2021] K. He et al, “Masked autoencoders are scalable vision learners,” arXiv: 2111.06377, 2021.

[Zhao2021] Y. Zhao et al., "Self-supervised visual representations learning by contrastive mask prediction." Proceedings of the IEEE/CVF International Conference on Computer Vision. 2021.

[Ciocarlan2023] A. Ciocarlan et al, “Deep-NFA: a Deep a contrario Framework for Small Object Detection", arXiv: 2303.01363, 2023.

[Liang2023] C. Liang et al, "Improved YOLOv5 infrared tank target detection method under ground background, Scientific Reports 2023:13 -6269, DOI 10.1038/s41598-023-33552-x