Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

18 novembre 2020

Stage M2/Ingénieur : Analyse d'images de spectrométrie de masse pour le diagnostic en oncologie


Catégorie : Stagiaire


Contexte

La spectrométrie de masse permet d'identifier des molécules en les vaporisant, puis en mesurant les masses (plus précisément les rapports masse sur charge) de leurs composants, produisant un spectre (vecteur multi-dimensionnel) caractéristique d'une molécule. Cette technologie peut notamment être utilisée dans le domaine bio-médical pour analyser les composants de tissus vivants, par exemple afin d'établir un diagnostic sur l'état de ces tissus. La spectrométrie de masse réalisée in vivo (technologie SpiderMass) ouvre vers l’aide à la décision pour la chirurgie. Dans le domaine de l’oncologie, une telle technologie doit permettre au chirurgien de définir avec une meilleure précision les bords de la tumeur et la marge d’exérèse en temps réel en cours d'opération. En effet, le SpiderMass permet d’étudier la composition des tissus de façon micro-invasive et à une l’échelle de quelques centaines de microns. Les empreintes moléculaires obtenues localement avec la technologie permettent de discriminer des cellules saines et cancéreuses mais également de différencier les sous-types de cancer et les grades. Pour automatiser la reconnaissance, l’instrument se base sur du machine learning via l’analyse de biopsies dont le diagnostic est déjà posé et sûr. Ainsi l’analyse de ces tissus connus permet d’établir une banque de profils moléculaires associés à des caractéristiques des tissus qui constituent les classes pour établir des modèles de classification. Par interrogation en temps réel du modèle de classification, l’instrument est ensuite capable de réassocier à une zone d’un tissu inconnu une classe, et donc un diagnostic. Si ce modèle fonctionne bien pour associer un profil à une classe, il ne permet pas de résoudre une problématique de marge. Dans le cas des marges, il est nécessaire d’obtenir les profils moléculaires de l’ensemble d’une région, i.e. de réaliser une image moléculaire de cette zone, puis d’être capable de déterminer le pourcentage de cellules cancéreuses dans chacun des pixels de l’image sachant que la résolution des images est supérieure à la résolution cellulaire. Le problème de la marge d’exérèse nécessite le développement de nouvelles solutions de deep learning basées sur les réseaux de neurones convolutifs pour la segmentation des images.

Problématique

L'objectif général de ces travaux est de réaliser une segmentation d'images de spectrométrie de masse en fonction de la nature (cancéreux / sain) des tissus analysés, en associant à chaque pixel la proportion de cellules cancéreuses / saines en ce point du tissu. Cet objectif se heurte à plusieurs difficultés du point de vue des modèles de machine learning mis en œuvre.

  1. Les images sont constituées de "pixels" en grande dimension (plusieurs milliers de composantes), les spectres des molécules mesurés par spectrométrie de masse. Ces spectres contiennent, de manière superposée, les caractéristiques de toutes les molécules présentes en ce point du tissu vivant analysé. Un modèle de machine learning efficace pour ce type de données devra donc être robuste à la dimensionnalité des données et être capable de séparer les différentes signatures de molécules mesurées en chaque point de l'image, ou a minima d'identifier les composantes pertinentes pour résoudre le problème d'apprentissage posé.
  2. L'estimation de la densité de cellules cancéreuses ne constitue pas un problème classique de segmentation binaire (classification des pixels en deux classes — cancéreux ou sain), mais un problème de régression où le modèle doit prédire une valeur continue (proportion de cellules). Les modèles récents de segmentation sémantique par réseaux de neurones traitent très rarement des problèmes de ce type.
  3. Les données pour ce problème sont difficiles à obtenir (données cliniques de patients) et leur annotation coûte cher (expertise médicale). Des données artificielles peuvent être produites en laboratoire, ici encore avec un coût conséquent. Les modèles de machine learning doivent donc pouvoir fonctionner avec des quantités de données annotées les plus faibles possibles.

Dans le cadre de ce stage, les deux premiers points seront abordés. L'objectif sera donc d'abord d'évaluer la pertinence de modèles de segmentation sémantique existants pour l'analyse d'images multidimensionnelles de spectrométrie de masse, puis d'adapter un de ces modèles à la problématique de régression de cette application.


Travail à effectuer

  1. Réaliser un état de l'art des méthodes de segmentation d'images de spectrométrie de masse et des méthodes de segmentation sémantique basées sur le deep learning.
  2. Participer à la mise en forme de données expérimentales pour constituer une vérité-terrain pour l'expérimentation des modèles de machine learning.
  3. Sélectionner des modèles de segmentation existants de l'état de l'art et les évaluer sur le problème traité réduit à un problème de segmentation standard (classification des pixels).
  4. En fonction de ces résultats préliminaires, sélectionner un modèle de segmentation de référence et l'adapter pour traiter le problème de régression (estimation des densités de cellules cancéreuses).
  5. Valider expérimentalement le modèle proposé.
  6. Rédiger des rapports techniques sur les méthodes étudiées.


Profil

Ce stage s'adresse à un(e) étudiant(e) de Master 2 ou équivalent (école d'ingénieur, etc.) avec une spécialisation en Informatique, Sciences des données, Mathématiques appliquées ou un domaine connexe. Des connaissances ou une expérience dans un ou plusieurs des domaines suivants sont souhaitables :

Les compétences additionnelles suivantes seront appréciées:

Conditions du stage

Le stagiaire sera intégré à l'équipe FOX (Fouille de Données compleXes) du laboratoire CRIStAL (UMR CNRS 9189) de l'université de Lille.

Le stage se déroulera à l'IRCICA (USR CNRS 3380), sur le Campus de la Haute Borne, à proximité directe du campus Cité Scientifique de l'Université de Lille (Villeneuve d'Ascq — Métropole de Lille, France).

Le stage aura une durée de 5 à 6 mois, sur une période à définir entre février et septembre 2021. La stage sera rémunéré selon la gratification légale en vigueur (environ 580€/mois).


Contact

L'encadrement de ce stage sera réalisé par Pierre Tirilly (Laboratoire CRIStAL, Univ. Lille, UMR CNRS 9189) et Isabelle Fournier (Laboratoire PRISM, Univ. Lille, U INSERM 1192).

Pour toute question sur le sujet et les conditions du stage, contacter par email Pierre Tirilly (pierre.tirilly@univ-lille.fr).

Pour postuler, envoyer votre CV et vos relevés de notes de Master 1 et 2 (si disponibles) à Pierre Tirilly (pierre.tirilly@univ-lille.fr) et Isabelle Fournier (isabelle.fournier@univ-lille.fr).


Bibliographie

Alexandrov, T. Spatial Metabolomics and Imaging Mass Spectrometry in the Age of Artificial Intelligence. Annual Review of Biomedical Data Science, vol. 3, pp. 61-87, 2020. doi:10.1146/annurev-biodatasci-011420-031537.
Alexandrov, T. & Kobarg, J.H. Efficient spatial segmentation of large imaging mass spectrometry datasets with spatially aware clustering. Bioinformatics, vol. 27, no. 13, pp. i230-i238, 2011. doi:10.1093/bioinformatics/btr246.
Eberlin, L.S., Margulis, K., Planell-Mendez, I. et al. Pancreatic Cancer Surgical Resection Margins: Molecular Assessment by Mass Spectrometry Imaging. PLoS Med., vol. 13, no. 8, art. e1002108, 2016. doi:10.1371/journal.pmed.1002108.
Garcia-Garcia, A., Orts-Escolano, S., Oprea, S., Villena-Martinez, V., Martinez-Gonzalez, P. & Garcia-Rodriguez, J. A survey on deep learning techniques for image and video semantic segmentation. Applied Soft Computing, vol. 70, pp. 41-65, 2018. doi:10.1016/j.asoc.2018.05.018.
Huang, K., Zhang, Y., Cheng, H.D., Xing, P. & Zhang, B. Fuzzy Semantic Segmentation of Breast Ultrasound Image with Breast Anatomy Constraints. arXiv 1909.06645, 2019. https://arxiv.org/abs/1909.06645.
Li, S., Song, W., Fang, L., Chen, Y., Ghamisi, P. & Benediktsson, J.A. Deep Learning for Hyperspectral Image Classification: An Overview. IEEE Transactions on Geoscience and Remote Sensing, vol. 57, no. 9, pp. 6690-6709, 2019. doi:10.1109/TGRS.2019.2907932.

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2020.