Annonce

Les commentaires sont clos.

Stage M2: Deep-learning pour détecter l’apparition d’altérations sur les ouvrages de la médiathèque du musée du Quai Branly Jacques Chirac

8 Février 2022


Catégorie : Stagiaire


Le stage se place dans le cadre d'un projet de thèse mené par une doctorante de CY Cergy Paris Université, avec la participation du laboratoire ETIS
(UMR8051, CY Cergy Paris Université, ENSEA Cergy, CNRS), et dont l'objectif est le développement d'un outil qui permette d'aider les conservateurs à évaluer l'état sanitaire d'un fonds d'archive.

 

La médiathèque du musée du Quai Branly conserve 200 000 ouvrages sur l’ethnologie et l’histoire des arts et civilisations d’Afrique, d’Asie, d’Océanie et des Amériques. Cette collection est accessible au public et la fréquence des emprunts de chaque ouvrage est consignée dans la base de données de la médiathèque.

Sur un total de 1200 ouvrages, environ 100 ouvrages très consultés et 100 ouvrages peu consultés seront sélectionnés sur la base de données. Des photographies des ouvrages sur leurs étagères seront prises et les altérations annotées avant le début de stage (charnières fendues, dos décollés, etc.)

Il s’agira de quantifier l’impact des consultations sur un fonds en utilisant des outils de deep-learning.

Ce projet pluri-disciplinaire permettra à l’étudiant.e de mettre en pratique ses connaissance en deep-learning dans un contexte avec des contraintes fortes et stimulantes (base de données de petite taille). Les interactions avec les institutions culturelles permettront de mettre en contexte le travail.

Un premier stage a déjà permis en 2021 de mettre en place plusieurs algorithmes sur des images plus homogènes (fonds du Parlement de Paris des Archives Nationales).

L'étudiant.e sera responsable des tâches suivantes :

  • Prise en main et adaptation des algorithmes existants aux nouvelles images (segmentation, détection des cotes, reconnaissance des altérations).
  • Choix et implémentation de métriques adaptées à l’évaluation de l’état sanitaire.

Ces deux tâches vont au delà d’une simple implémentation d’algorithmes existants. Dans le premier cas, les images du fonds du Quai Branly sont si différentes de celles des Archives Nationales qu’une adaptation fine du réseau sera sûrement nécessaire. En effet, la tâche se complexifie car l’on passe d’ouvrages très uniformes (reliures cuir) à des ouvrages récents de hauteur et d’épaisseur variées.

Nous avons aussi constaté que les métriques  classiquement utilisées en segmentation sémantique ne sont pas pertinentes pour évaluer la détection d’altération des reliures. Ainsi, en discussion avec la doctorante et les institution culturelles, il faudra proposer des métriques adaptées au problème pour quantifier les dégradations d’une façon qui fasse sens pour les conservateurs.

Langage : Python

Appétences et compétences : des compétences en machine learning et en programmation Python sont requises. Un intérêt pour le domaine applicatif sera apprécié.

Contact : Camille Simon-Chane (camille.simon-chane@ensea.fr), Michel Jordan (michel.jordan@cyu.fr).

Le stage se déroulera dans les locaux d'ETIS à l'ENSEA Cergy, pour une durée de 6 mois (gratification mensuelle d'environ 570 euros).

Candidature : pour candidater envoyer un CV + notes de M2 aux contacts ci-dessus en précisant [M2 Reliures] dans le sujet du mail.

 

Lien vers le descriptif complet du stage : https://cloud.etis-lab.fr/index.php/s/P2ynxcBKeAssPgd