Annonce

Les commentaires sont clos.

[M2/Ingénieur] Classifieur minimax égalisateur pour données non-équilibrées

6 Janvier 2023


Catégorie : Stagiaire


Sujet : Il s'agit de développer un classifieur en machine learning qui permet de reconnaître différentes classes avec la même probabilité d’erreur.

 

Contexte : Ce sujet de stage s’intéresse à la classification statistique de données étiquetées avec un nombre de classes fixé et connu. Un problème typique consiste à classifier des images médicales [1] en différentes catégories, par exemple selon le type de lésion cutanée ou le type de cellules sanguines. Souvent, les jeux de données ne sont pas équilibrés ; certaines classes sont sur-représentées dans le jeu de données tandis que d’autres classes apparaissent rarement. Dans ce contexte, le machine learning minimax est très pertinent comme nous l’avons démontré dans de précédents travaux au sein de notre équipe de recherche [2, 3]. En effet, les classifieurs minimax sont souvent égalisateurs, ce qui signifie que les probabilités de bonne classification sont égales quelle que soit la classe à reconnaître.

 

Objectif :

Dans ce stage, il s’agira donc d’exploiter notre étude sur le classifieur minimax [2] pour entrainer un classifieur égalisateur sur les données d’entrainements. Nous étudierons en particulier les erreurs de classification sur un jeu de test afin de proposer une approche robuste qui est presque égalisatrice sur des données nouvelles qui n’ont pas été utilisées lors de l’entrainement du classifieur. En outre, le stagiaire comparera l’efficacité de son approche à des méthodes classiques de l’état de l’art : forêt aléatoire, régression logistique, etc.

Cette approche sera testée sur des données biologiques étiquetées. Le stagiaire bénéficiera du soutien de chercheurs en biologie lorsqu’il traitera ces données de santé.

 

Profil recherché :

Formation niveau M2/Ingénieur en mathématiques appliquées et/ou en informatique.

Ces travaux requièrent les compétences suivantes :

- Programmation informatique : les développements informatiques seront réalisés en Python et Pytorch (connaître préalablement Python n’est pas nécessaire mais souhaitable)

- Notions de bases en machine learning (en particulier sur les réseaux de neurones).

 

Lieu du stage : campus SophiaTech (Sophia Antipolis).

 

Encadrant du stage : M. Lionel Fillatre (professeur des universités)

Courriel : lionel.fillatre@i3s.unice.fr

 

Durée : de 4 à 6 mois (démarrage en mars/avril 2023 selon les contraintes du stagiaire).

Rémunération : environ 550 euros par mois.

Procédure pour déposer sa candidature : envoyer son CV, sa lettre de motivation et ses résultats académiques niveau L1, L2, L3, M1 et M2 à lionel.fillatre@i3s.unice.fr

 

Bibliographie :

[1] https://medmnist.com

[2] Cyprien Gilet, Susana Barbosa, and Lionel Fillatre. Discrete box-constrained minimax classifier for uncertain and imbalanced class proportions.IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020.

[3] Lionel Fillatre, Constructive minimax classification of discrete observations with arbitrary loss function, Signal Processing, 2017.