Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

10 mars 2020

Post-doctorant en Data sciences et Apprentissage statistique à l’Université Gustave Eiffel


Catégorie : Post-doctorant


 Traitement de données multi-sources pour l’analyse de la mobilité des personnes.

 

Date de démarrage : dès que possible Mai 2020

Localisation principale : Champs-Sur-Marne (77)

Durée du contrat : CDD de 18 mois

Salaire : 2600 € environ

 

Profil du candidat

Nous recherchons un candidat ayant un obtenu un doctorat en data sciences, apprentissage statistique et/ou informatique pour occuper le poste de chercheur post-doctorant contractuel pendant une durée de 18 mois. Des compétences minimales en traitement de données distribuées (Spark) sont un pré-requis. Une appétence pour les problèmes appliqués notamment la mobilité et le transport serait un plus. Pour déposer une candidature, envoyer un CV, une lettre de motivation et les contacts de deux personnes référentes aux contacts mentionnés ci-dessous.

Laboratoire d’accueil

Le candidat sera accueilli au sein du laboratoire GRETTIA (Génie des réseaux de transport terrestres et Informatique Avancée) de l’Université Gustave Eiffel – Campus Marne-la-vallée. Des déplacements sur le campus de l’Université Gustave Eiffel à Lyon seront à prévoir.

Contacts :

Latifa Oukhellou

Directrice de Recherche

Latifa.oukhellou@univ-eiffel.fr

14-20 Bd Newton, 77 420 Champs-sur-marne

Tél : +33 (0)1 81 66 87 19

 

Etienne Côme

Chargé de Recherche

Etienne.come@univ-eiffel.fr

14-20 Bd Newton, 77 420 Champs-sur-marne

Tél : +33 (0)1 81 66 87 18

 

Angelo Furno

Chargé de Recherche

angelo.furno@univ-eiffel.fr

25 Avenue François Mitterrand, 69500 Bron

Tel. +33 (0)4 78 65 68 70

 

 

Contexte

Le poste de chercheur post-doctorant est à pourvoir au sein d’une structure de recherche travaillant sur l’apprentissage statistique pour le traitement de données massives urbaines. Il s’insère dans un projet collaboratif financé par l’agence nationale de la recherche (Projet ANR MobiTic, https://mobitic.huma-num.fr/). Plusieurs partenaires sont impliqués dans le projet : deux laboratoires de l’université Gustave Eiffel (Grettia-Coordinateur et Licit) mais aussi le laboratoire SENSE d’Orange Labs, le SSP lab de l’Insee, et le laboratoire Géographie-cités. Ce projet ambitionne de produire des indicateurs de présence et de mobilité des personnes pertinents, fiables, représentatifs et fréquemment mis à jour, en combinant données numériques massives (données de signalisation téléphonique, données télé-billetiques, ...) et données traditionnelles (recensements, données socio-démographique de l’insee,...). Ces données numériques ouvrent des perspectives d’analyse dynamique à des niveaux de précision géographique et temporelle très fins, et offrent aux acteurs le potentiel de gérer plus efficacement leurs ressources, prérequis indispensable à un développement durable des territoires. Le projet s’appuiera pour cela sur des champs disciplinaires de la statistique, du machine learning et de l’analyse de données.

Problématique

Ces dernières années, de nombreux travaux examinent l’utilisation de données numériques pour l’analyse des mobilités. Une grande majorité de ces travaux se focalisent sur l’exploitation d’une seule source de données et un seul mode de transport. A ce titre, nous pouvons citer les travaux menés par les chercheurs de l’Université Gustave Eiffel impliqués dans le projet MobiTic sur l’exploitation des données billettiques pour analyser l’usage des systèmes de mobilité partagée [1], ou de transport en commun [2] [3], l’utilisation des données Bluetooth pour le trafic routier [4] ou encore l’usage des données de téléphonie pour comprendre les dynamiques urbaines et analyser les réseaux de transport routier et leur résilience [5, 6, 7].

Le projet MobiTIC ambitionne de fusionner plusieurs sources de données pour l’analyse des mobilités et des présences.

Le candidat sera en charge de développer des traitements pour l’enrichissement des données de signalisation sur le réseau mobile. Un défi majeur de cet enrichissement est l’imputation des modes et des motifs de déplacement [8, 9, 10]. En effet, les données de téléphonie mobile ne peuvent à elles seules fournir toutes les informations nécessaires à la construction des indicateurs de mobilité. En plus des redressements mobilisant les informations socio-démographiques, les indicateurs sur la mobilité des personnes (flux entre origines-destinations par exemple) peuvent bénéficier des informations issues des sources tierces (données billettiques, données de boucles électromagnétiques pour le trafic routier). Plusieurs stratégies pourront être investiguées par le candidat ;

Il est par exemple possible de travailler à l’échelle de la trace de signalisation individuelle tel que proposé dans [11] et intégrer au sein de la procédure de map-matching multi-modal des informations agrégées sur les différents modes en provenance des autres sources. Une telle approche pourra trouver des synergies avec les travaux effectués dans [13] et également par le laboratoire Licit, partenaire du projet [7].

Il est également possible de combiner les différentes sources de données une fois les opérations d’agrégation effectuées [12]. Bien que potentiellement moins riche, cette approche simplifie les traitements et ne soulève pas de difficultés liées au traitement de données individuelles.

Une autre direction de recherche intéressante pourrait consister à détecter et à explorer les comportements de mobilité humaine en présence de situations atypiques (par exemple, intempéries, accidents, événements extrêmes, etc.) afin d’identifier et décrire comment les gens réagissent à des situations anomales, soudaines ou inattendues. La connaissance de ces comportements a une importance fondamentale dans le domaine du transport pour calibrer correctement l'offre de mobilité et pour mettre en place de nouvelles solutions de contrôle qui puissent améliorer la résilience du système de transport. À cette fin, la disponibilité des données de téléphone mobile à grande échelle pourrait être exploitée et croisée avec d'autres sources de données (actualités Web, données de réseaux sociaux, données météorologiques historiques) qui contiennent des informations sur des situations anormales ayant un impact sur la mobilité.

Les méthodologies développées devront être évaluées en tirant partie des données de validations disponibles.

Références bibliographiques :

[1] E. Côme, L. Oukhellou, (2014). Model-based count series clustering for Bike-sharing system usage mining, a case study with the Vélib system of Paris, ACM Transactions on Intelligent Systems and Technology (TIST). 5(3). Ed. ACM.

[2] Briand AS, Côme E, Trépanier M, Oukhellou L (2017). Analyzing year-to-year changes in public transport passenger behaviour using smart card data, Transportation Research Part C, 79, 274-89, https://doi.org/10.1016/j.trc.2017.03.021

[3] El Mahrsi MK, Côme E, Oukhellou L, Verleysen M (2017). Clustering Smart Card Data for Urban Mobility Analysis, IEEE Transactions on Intelligent Transportation Systems 18(3), pp. 1 - 17. https://doi.org/10.1109/TITS.2016.2600515.

[4] P-A. Laharotte, R. Billot, E. Côme, L. Oukhellou, A. Nantes, N-E El Faouzi (2015) Spatiotemporal Analysis of Bluetooth Data: Application to a Large Urban Network. IEEE Transactions on Intelligent Transportation Systems 16(3): 1439-1448.

[5] Furno A, Fiore M, Stanica R, Ziemlicki C, Smoreda Z (2017). A Tale of Ten Cities: Characterizing Signatures of Mobile Traffic in Urban Areas, IEEE TMC 16(10). https://ieeexplore.ieee.org/document/7779102/

[6] Henry E., Bonnetain L., Furno A., El Faouzi N.E., Zimeo E. (2019, June). Spatio-temporal Correlations of Betweenness Centrality and Traffic Metrics. In 6th International Conference on Models and Technologies for Intelligent Transportation Systems (MT-ITS).

[7] Bonnetain, L., Furno, A., Krug, J., & Faouzi, N. E. E. (2019). Can We Map-Match Individual Cellular Network Signaling Trajectories in Urban Environments? Data-Driven Study. Transportation Research Record, 2673(7), 74-88.

[8] Bonnel, P. & Hombourger, E. & Olteanu R., A-M. & Z., Smoreda. (2015). Passive Mobile Phone Dataset to Construct Origin-destination Matrix: Potentials and Limitations. Transportation Research Procedia. 11. 381-398. 10.1016/j.trpro.2015.12.032.

[9] Wang, H., Calabrese, F., Di Lorenzo, G., and Ratti, C. Transportation mode inference from anonymized and aggregated mobile phone call detail records. In Intelligent Transportation Systems (ITSC), 2010 13th International IEEE Conference on (2010), IEEE, pp. 318–323.

[10] Jiang, S. & Ferreira, J. & Gonzalez, Marta C. (2017). Activity-Based Human Mobility Patterns Inferred from Mobile Phone Data: A Case Study of Singapore. IEEE Transactions on Big Data. 3. 208 - 219. 10.1109/TBDATA.2016.2631141.

[11] F. Asgari, A. Sultan, H. Xiong, V. Gauthier and M. A. El-Yacoubi, "CT-Mapper: Mapping sparse multimodal cellular trajectories using a multilayer transportation network," Computer Communications, vol. 95, pp. 69-81, 2016.

[12] Friedrich, M. & Immisch, K. & Jehlicka, P. & Otterstätter, T. & Schlaich, J. (2010). Generating Origin-Destination Matrices from Mobile Phone Trajectories. Transportation Research Record: Journal of the Transportation Research Board. 2196. 93-101. 10.3141/2196-10.

[13] D Bachir, G Khodabandelou, V Gauthier, M El Yacoubi, J Puchinger Inferring dynamic origin-destination flows by transport mode using mobile phone data, Transportation Research Part C: Emerging Technologies 101, 254-275.

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2020.