Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

7 décembre 2019

Deep-learning pour la surveillance de pollution atmosphérique par système multi-capteurs


Catégorie : Stagiaire


Mots-clés : Intelligence artificielle (IA), COP21, deep learning (DL), exploration de mesures, calibration de
capteurs

L'objectif est de réaliser un système de calibration intelligent pour équiper un capteur mesurant les quantités de polluants atmosphériques/gaz. Le travail est réalisé en partenariat avec une startup francilienne spécialisée dans l’instrumentation
et la métrologie, les systèmes connectés et les services sur plateforme web en mode SaaS (Software as a Service)
pour la surveillance et l’analyse de données environnementales. Il s'agit in fine de mesurer par un réseau de capteurs les dispersions de ces gaz et de décider si les concentrations de ces polluants font courir un risque à la population locale. On s'oriente vers une technologie deep-learning type CNN.

keywords: Artificial intelligence (AI), COP21, DL, data exploration, sensor calibration

The goal is to create an intelligent calibration system to equip a sensor measuring the quantities of atmospheric pollutants / gases. The work is done in partnership with a Parisian startup specialized in instrumentation
and metrology, connected systems and web platform services in SaaS (Software as a Service) mode
for the monitoring and analysis of environmental data. The ultimate goal is to measure the dispersions of these gases through a network of sensors and to decide whether the concentrations of these pollutants pose a risk to the local population. Calibration technology will be based on a deep-learning technology like CNN.


Contact: université Paris-Saclay/IBISC lab.

vincent Vigneron, Dominique Fourer, Hichem Maaref
(vincent.vigneron,dominique.fourer,hichem.maaref)@ibisc.univ-evry.fr
Phone: +33 6 635 687 60

 

On peut observer depuis la COP21 un essor rapide des systèmes de mesures de polluants atmosphériques qui
permet, combiné avec le crowd-sourcing par exemple, de représenter spatialement la qualité de l’air [5]. Cette
cartographie à l’initiative des acteurs traditionnels de la surveillance, des collectivités locales, en est à ses débuts.
Elle pose néanmoins la question de l’incertitude sur les données, de leur exploitation et des possibilités offertes
par les nouvelles technologies issues de l’intelligence artificielle (IA) en particulier par DL pour la surveillance
(réglementaire) de la qualité de l’air [4]. Elle questionne aussi la dérive des capteurs entre l’étalonnage en
laboratoire et leur utilisation sur le terrain. De nombreux paramètres peuvent influer sur cette dérive. In fine,
la précision de ces capteurs est relative et les incertitudes de mesure sont encore mal connues.
Des travaux approfondis sont nécessaires pour rendre ces estimations plus précises jusqu’alors réalisées à partir
de simples régressions linéaires [3] et reconsidérer des problématiques primordiales telles que (i) l’optimisation
du déploiement des capteurs [1] (ii) la gestion de la représentativité spatiale des mesures (iii) le traitement de
données hétérogènes dans l’espace et dans le temps.
Comment rendre plus fiables les mesures en exploitant les données disponibles ? Peut on prédire une mesure
x(t) à partir de l’historique x(t − 1), x(t − 2), . . . , x(t − T ) ou par interpolation géostatistique d’autres mesures
capteurs (krieging [2]) ? comment s’assurer que les paramètres ne divergent pas des conditions réelles ? faut il
exploiter aussi les données topographiques ?

Par exemple, on peut estimer les concentrations de polluants à des localisations où celles-ci sont inconnues
en utilisant simultanément des données de mesure et des données d’une ou plusieurs variables auxiliaires. Soit
X 0 la concentration du polluant à estimer en un point p 0 ; l’hypothèse à travailler sera celle d’une relation
non-linéaire entre X 0 et les variables auxiliaires prises en compte :
X 0 = f (X 1 , X 2 , . . . , X p ; a) + e, (1)
où f (·) est un réseau de neurones profonds (DLNN), X 1 , X 2 , . . . , X p les variables auxiliaires (features)
et a les paramètres du DLNN à apprendre.
Les data (θ, P , humidité, concentrations en gaz NO 2 , O 3 et particules) sont des mesures de références locales
via des stations et des mesures d’AirParif/MétéoFrance. Ces données sont géolocalisées, issues de stations
installées partout dans le monde (US, Australie, Russie, Afrique du Nord,etc.).

Le stage sera effectué au laboratoire IBISC EA 4526 dans l’optique de continuer en thèse sur un contrat
doctoral CIFRE, en collaboration avec une start-up située en Ile de France, spécialisée dans l’instrumentation
et la métrologie, les systèmes connectés et les services sur plateforme web en mode SaaS (Software as a Service)
pour la surveillance et l’analyse de données environnementales.

Résultats attendus : conception d’un modèle à partir des technologies IA permettant d’affiner les mesures de
capteurs environnementaux, d’effectuer des calibrations automatiques et faire de la prédiction hyperlocale
à partir de ces mesures.
Implémenter un prototype de ce modèle et mettre en place l’apprentissage à partir des bases de données
environnementales collectées depuis 3 ans, i.e. environ 1 To de mesures avec une fréquence d’acquisition
de 0.016 Hz.
Apprentissage, puis validation du modèle sur des données temps réel stockées sur un cloud.

Compétences techniques souhaitées : connaissances des mécanismes des systèmes intelligents autonomes
pour la prédiction, capacité à développer des algorithmes d’apprentissage autonomes et de traiter des
données environnementales , les indexer et les utiliser dans un système opérationnel pour réaliser la
mission décrite ci-dessus.

Compétences en programmation : Python. Une pratique de Tensorflow et Pytorch serait un plus.
Profil et compétences recherchées : autonomie, sens du relationnel pour interagir avec les équipes de
recherche et de la société, motivation pour les nouvelles technologies, créativité pour mettre en place
une solution innovante, intérêt pour l’environnement.


Contact: université Paris-Saclay/IBISC lab.

vincent Vigneron, Dominique Fourer, Hichem Maaref
(vincent.vigneron,dominique.fourer,hichem.maaref)@ibisc.univ-evry.fr
Phone: +33 6 635 687 60

 

=============================ENGLISH VERSION

Since COP21, there has been a rapid growth of atmospheric pollutant measurement systems which, combined
with crowd-sourcing for example, make it possible to spatially represent the quality of air [5]. This mapping
initiated by the traditional actors of surveillance, local communities, is in its infancy. It nevertheless raises the
question of data uncertainty, their exploitation and the possibilities offered by new technologies derived from
artificial intelligence (AI), in particular by DL for (regulatory) quality surveillance of air [4]. It also questions the drift of
sensors between laboratory calibration and their use in the field. Many parameters can affect this drift. In fine
the accuracy of these sensors is relative and the measurement uncertainties are still poorly known.
So extensive work is needed to make these estimates more accurate up to now made from simple linear
regression [3] and reconsider critical issues such as (i) optimization of the deployment of sensors [1] (ii) the
management of the spatial representativeness of the measurements (iii) the treatment of heterogeneous data in
space and in time.
Many questions arise: how to make the measurements more reliable by exploiting the available data? can
one predict a measure x (t) from the history x(t − 1), x(t − 2), . . . , x(t − T ) or by geostatistical interpolation of
other sensor measurements (krieging[2])? how to make sure that the parameters do not diverge from the actual
conditions? should we also use the topographic data?

For example, pollutant concentrations can be estimated at locations where these are unknown by simulta-
neously using measurement data and data from one or more auxiliary variables. Let X 0 be the concentration
of the pollutant to be estimated at a point p 0 ; the assumption is that of a linear relation between X 0 and the
auxiliary variables taken into account:
X 0 = f (X 1 , X 2 , . . . , X p ; a) + e , (2)
where f (·) is a deep learning neural networks (DLNN), X 1 , X 2 , . . . , X p the auxiliary variables
(features) and the parameters of the DLNN to learn. The data (θ, P , humidity, concentrations of NO 2 , O 3 gas
and particles) are local reference measurements via AirParif / MétéoFrance stations and measurements. These
data are geolocated, from stations installed all over the world (US, Australia, Russia, North Africa, etc.).
The internship will be done at IBISC laboratory EA 4526 in order to continue in PhD thesis CIFRE, in collab-
oration with a start-up located in Ile de France, specialized in instrumentation and metrology, connected systems
and web based services in SaaS (Software as a Service) mode for monitoring and analyzing environmental data.
Expected results: To establish a model using IA technologies to refine environmental sensor measurements,
perform automatic calibrations and make hyperlocal prediction from these measurements.
Implement a prototype of this model and set up learning from environmental databases collected for 3
years, i.e. about 1 TB of measurements with an acquisition frequency of 0.016 Hz.

Learning, then validation of the model on real-time data stored on a cloud.
Profile and skills required: knowledge of the mechanisms of autonomous intelligent systems for prediction,
ability to develop autonomous learning algorithms and to process environmental data, index them and
use them in an operational system to achieve the mission described above.
Programming skills: Python or in C/C++. A practice of Tensorflow and Pytorch would be a plus.
Desired professional qualities: autonomy, sense of relationship to interact with teams of research and soci-
ety, motivation for new technologies, creativity to set up a innovative solution, interest for the environment.

Contact: université Paris-Saclay/IBISC lab.

vincent Vigneron, Dominique Fourer, Hichem Maaref
(vincent.vigneron,dominique.fourer,hichem.maaref)@ibisc.univ-evry.fr
Phone: +33 6 635 687 60

 

References
[1] Rivano H. Boubrima A., Bechkit W. A new wsn deployment approach for air pollution monitoring. In The
14th IEEE Consumer Communications & Networking Conference (CCNC 2017), Las Vegas, US, 2017.
[2] Pierre Goovaerts. Geostatistics for natural resource evaluation. Technometrics, 42, 01 1997.
[3] T.J. Hastie and R.J. Tibshirani. Generalized Additive Models. Monographs on Statistics and Applied
Probability. Chapman and Hall/CRC, June 1990.
[4] M. Künzli, N. Jerrett, WJ. Mack, B. Beckerman, L. LaBree, F. Gilliland, D. Thomas, J. Peters, and HN.
Hodis. Ambient air pollution and atherosclerosis in los angeles. Environ Health Perspec, 113(2):201–206,
Feb 2005.
[5] X. Xie, I. Semanjski, S. Gautama, E. Tsiligianni, N. Deligiannis, R.T. Rajan, and Philips W. A Pasveer, F.
Review of urban air pollution monitoring and exposure assessment methods. Int. J. Geo-Inf, 6:389, 2017.

 

rémunération: environ 1000€/mois

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2020.