Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

3 juillet 2018

Traitement de données multi-sources hétérogènes dans un environnement d’objets connectés : application à la gestion interactive du réseau du transport de la société TICE. (Thèse CIFRE))


Catégorie : Doctorant


L’entreprise TICE gère en moyenne 80000 voyageurs par jour, ce qui engendre un volume de données très important. Face à cette masse de données dont l’évolution est exponentielle, la gestion des données nécessite des moyens technologiques et informatiques performants. Dans ce cadre, TICE souhaite optimiser et contrôler ces données pour mieux gérer ses différents services. Actuellement, l’exploitation se fait de manière ponctuelle et intuitive, ce qui ne permet pas une rentabilité contrôlée. En effet, l’exploration de nombreuses données, souvent hétérogènes, permet d’établir un modèle explicatif et de suivi du fonctionnement des différents services.

D’une manière générale, pour que cette entreprise puisse effectuer une analyse objective du bon fonctionnement de ses différents services et de leurs activités, elle doit d’abord rassembler les données provenant de toutes les sources considérées comme pertinentes, puis les transformer et les stocker dans une base de données très significative. Actuellement et devant un besoin important, l’entreprise TICE souhaite mettre en place un pôle de traitement et analyse de données pour:

- Adapter et anticiper l’offre de BUS aux besoins des personnes, comme le traitement à la demande ou le regroupement avec les données socio-économique.

- Le traitement de la fraude,

- Simuler l’impact d’une grève, etc.

- Gérer le trafic en temps réel

Dans ce cadre, les outils de l’informatique décisionnelle, en particulier les systèmes d’analyse en ligne (On-Line Analytical Processing : OLAP) [1], présentent de nombreux avantages. En effet, ces systèmes permettent une analyse sur de larges bases de données. D’une manière générale, les approches de l’informatique décisionnelle [1, 2, 3] et de l’apprentissage statistique permettent de développer des outils d’analyse, d’interprétation et de la décision [4, 5, 6, 7].

Objectifs du travail de thèse :

En concertation avec les différents services de l’entreprise TICE, le travail commencera par la définition d’un plan de récolte de données avec une stratégie de stockage adaptée. Ensuite, autour d’un système de gestion de base de données permettant le stockage de l’entrepôt de données, la conception d’un outil d’intégration de données. Ces données souventhétérogènes et provenant de multiples sources connectées seront intégrées après conditionnement (normalisation) dans l’entrepôt de données. Ces outils, permettent ensuitela restitution de données, et de fournir des statistiques descriptives sur les données.

Les recherches dans cette thèse porteront principalement sur la conception et la réalisation d’un système d’interprétation et de restitution des données provenant de sources hétérogènes permettant une gestion optimale et interactive des informations issues d’objets connectés du réseau du transport de la société TICE. Pour ces objectifs, un modèle d’apprentissage statistique sera développé et mis en place pour l’interprétation et la restitution interactive des données. Les différentes fonctionnalités réalisées seront évaluées dans le cadre d’une architecture OLAP avec un système d’information décisionnel qui pourra apporter des solutions technologiques pertinentes et innovantes à l’entreprise TICE. Des modalités de visualisation de données et d’interaction seront également étudiées afin d’offrir une interface homme machine multimodale et multiplateformes.

Mots clés : Extraction de données, Entrepôt de données, Apprentissage statistique, Classification, Interprétation et restitution de données, Objets connectés,

 

Profil candidat(e) :

-Diplômé(e) de Master Recherche (ou équivalent) en Informatique, Recherche opérationnelle, Apprentissage et intelligence artificielle.

-Compétences en développement logiciel, base données et bons bagages scientifiques.

-Intérêt pour la conception et le prototypage rapide, les tests, et l’évaluation avec les utilisateurs finaux.

-Bonne maitrise de la communication en français et en anglais (oral/écrit).

-Qualités recherchées : grande motivation, autonomie, rigueur, force de proposition, ouverture aux approches pluridisciplinaires

 

Modalités pratiques :

Cette thèse CIFRE sera effectuée alternativement au sein du laboratoire IBISC (équipe IRA2) à Evry, France et dans l’entreprise TICE à Evry.

Le candidat retenu sera inscrit en thèse à l’École Doctorale Sciences et technologies de l'information et de la communication (STIC) de l’Université Paris-Saclay.

La thèse sera placée sous la direction de Khalifa DJEMAL (UEVE), codirigée par Samir Otmane (UEVE) et co-encadrée par Karine Hallouinde la société TICE.

 

Lieu:

IBISC - Informatique, Biologie Intégrative, & Systèmes Complexes, EA 4526, Université d’Evry-Val-d’Essonne, 91020 Evry.

Candidature à déposer sur: ADUM

contact: Khalifa.Djemal@univ-evry.fr

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2018.