Annonce

Les commentaires sont clos.

Offre de postdoc : Classification de séries spatio-temporelles. Application à l'analyse de la qualité de l'eau au sein d'un réseau dynamique

2 December 2021


Catégorie : Post-doctorant


Mots clés : réseau dynamique, données spatio-temporelles, classification de séries temporelles, apprentissage non supervisé, qualité de l’eau

Durée : 24 mois

Pour candidater, envoyer un cv et une lettre de motivation aux adresses suivantes :
Allou Samé : allou-badara.same@univ-eiffel.fr
Latifa Oukhellou : latifa.oukhellou@univ-eiffel.fr
Pierre Mandel : pierre.mandel@veolia.com

Lieu de travail principal : Université Gustave Eiffel, Laboratoire GRETTIA, Champs-sur-Marne,
Lieu de travail secondaire : Veolia Eau d’Ile-de-France, DACE - Service Études, Recherche et Développement, Nanterre

 

L’évaluation de la qualité de l’eau au sein des réseaux de distribution demeure un sujet crucial pour des questions de santé et de protection de l’environnement. Dans cette optique, les gestionnaires sont amenés à effectuer en continu des mesures relatives à la qualité et au débit de l’eau à l’aide de capteurs spécifiques répartis dans le réseau, ce qui génère de grandes quantités de données spatio-temporelles. A ces données s’ajoutent celles issues de la simulation hydraulique, qui peuvent aussi être exploitées pour caractériser la dynamique de l’eau au sein de son réseau de distribution.

L’objectif de ce postdoc est l’analyse avancée de ces données réparties dans le temps et dans l’espace (réseau) à l’aide de techniques d’apprentissage statistique, afin d’en extraire une vue synthétique de la dynamique d’évolution de la qualité de l’eau. Le cas d’étude sera celui d’un réseau d’eau en Ile de France qui est doté de capteurs permettant d’acquérir des masses de données physico-chimiques comme la température, la conductivité électrique, la concentration en chlore, ou le débit.

Une attention particulière sera portée aux méthodes non supervisées de classification et de segmentation de séries temporelles, notamment celles à base de processus stochastiques latents qui fournissent un cadre flexible permettant de résumer la dynamique d’évolution de données temporelles. Des variantes de ces méthodes pourront être développées dans le but de classifier les points du réseau selon la dynamique temporelle et spatiale de la qualité d’eau, et en tenant compte du caractère complexe (décalages et déformations temporelles, incomplétude) des séries temporelles associées.

Les missions confiées au post-doctorant seront relatives au développement et à la mise en œuvre pratique de telles méthodes. Les tâches à réaliser seront : (1) la prise en main et l’exploration élémentaire des données issues de réseaux de distribution d’eau, (2) la mise au point d’algorithmes de classification automatique de séries temporelles complexes basés sur des modèles à variables latentes dynamiques, (3) le développement d’outils informatiques permettant de réaliser ces traitements de données.

Profil : les candidats devront être titulaires d’une thèse de doctorat dans les champs disciplinaires de l’apprentissage automatique (machine learning), de la statistique ou de la modélisation des séries temporelles avec un intérêt pour les applications réelles ; ils pourront aussi être titulaires d’une thèse dans le domaine de l’hydraulique et avec une forte expérience dans l’analyse de données massives. Une utilisation courante des logiciels/langages R, Python ou Matlab est indispensable pour ce poste.