Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

31 juillet 2017

« Deep Learning » appliquée à la reconnaissance du mode de transport


Catégorie : Doctorant


Le CEA-LETI Grenoble, a engagé depuis quelques années des recherches sur la problématique de « capture de contexte » à partir de signaux temporels hétérogènes issus de capteurs (accéléromètre, magnétomètre, gyromètre, GPS, UWB, acoustique …) embarqués dans un smartphone ou une montre connectée. L'un des objectifs est la reconnaissance automatique du mode de transport utilisé par une personne (marche, vélo, voiture...). Cette information peut en effet servir pour de multiples applications telles que l'estimation de l'empreinte carbone, la planification d'itinéraires,...

Ce problème a déjà fait l’objet de nombreux travaux qui reposent sur des approches de classification « traditionnelles », i.e. en construisant manuellement les descripteurs utilisés pour la classification à partir des signaux disponibles. Cependant les nombres de classes traitées (marche, vélo, voiture...) et de capteurs utilisés (principalement accéléromètre et/ou GPS) sont généralement faibles. Et les performances de classification (autour de 75 à 80% de bonne classification) sont souvent insuffisantes pour être utiles à une application.

Cette thèse a pour objectif de proposer des méthodes et des algorithmes de classification qui puissent tirer profit de l'ensemble des signaux disponibles fournis par les capteurs embarqués.

 

Contexte

Le CEA-LETI, Grenoble, a engagé depuis quelques années des recherches sur la problématique de « capture de contexte » à partir de signaux temporels hétérogènes issus de capteurs (accéléromètre, magnétomètre, gyromètre, GPS, UWB, acoustique …) embarqués dans un smartphone ou une montre connectée. L'un des objectifs est la reconnaissance automatique du mode de transport utilisé par une personne (marche, vélo, voiture...). Cette information peut en effet servir pour de multiples applications telles que l'estimation de l'empreinte carbone, la planification d'itinéraires,...

Ce problème a déjà fait l’objet de nombreux travaux qui reposent sur des approches de classification « traditionnelles », i.e. en construisant manuellement les descripteurs utilisés pour la classification à partir des signaux disponibles. Cependant les nombres de classes traitées (marche, vélo, voiture...) et de capteurs utilisés (principalement accéléromètre et/ou GPS) sont généralement faibles. Et les performances de classification (autour de 75 à 80% de bonne classification) sont souvent insuffisantes pour être utiles à une application.

Sujet

Cette thèse a pour objectif de proposer des méthodes et des algorithmes de classification qui puissent tirer profit de l'ensemble des signaux disponibles fournis par les capteurs embarqués. Deux directions principales de travail se dégagent.

Améliorer significativement les performances : Apprentissage profond (« Deep Learning »)

Récemment, des méthodes d’apprentissage « profond » ont permis d'obtenir des résultats impressionnants en vision par ordinateur et traitement de la parole, et sont désormais utilisées de façon industrielle par Google et Facebook. Ces approches tirent profit de la grande masse de données disponibles afin de construire automatiquement les règles de classification à partir des données brutes (ici les séries temporelles acquises par les différents capteurs). En 2016, ces approches ont ainsi été appliquées à la reconnaissance d’activités humaines à partir de signaux temporels issus de capteurs (ex. accéléromètre) semblables à ceux présents dans les smartphones [1, 2, 3]. La problématique de reconnaissance du mode de transport commence juste à être abordée [4]. Le travail de thèse permettra d'évaluer les performances de ces méthodes et le gain par rapport à des approches plus traditionnelles (de type SVM ou boosting).

Contrôler la complexité de la méthode

La méthode de classification proposée devra avoir une complexité calculatoire maîtrisée pour ne pas monopoliser les ressources (processeurs et capteurs) du smartphone et en grever l'autonomie. On pourra par exemple utiliser une approche hiérarchique en augmentant progressivement la finesse de la classification souhaitée, et adapter l'échantillonnage des différents capteurs à la situation et à d’éventuelles données manquantes intermittentes (ex GPS). Afin de réduire les données en entrée, et donc la complexité de l'algorithme, on pourra aussi combiner l’approche « Deep Learning » avec des signaux déjà fusionnés (par exemple fusion des signaux capteurs accéléromètre et gyromètre pour estimer la gravité et l’accélération propre horizontale).

Les travaux déjà effectués au CEA-LETI, comme la constitution d'une première base de données annotée, serviront de point de départ au travail de thèse. Des bases de données publiques constituées de signaux temporels multi-capteurs pourront aussi être utilisées afin d’entraîner et valider les algorithmes proposés. Ce travail profitera également des compétences méthodologiques du laboratoire LIRIS sur les aspects analyse de données et de séries temporelles, fusion d'information, apprentissage automatique et apprentissage profond.

Références bibliographiques :

[1] C. A. Ronao and S.-B. Cho, “Human activity recognition with smartphone sensors using deep learning neural networks,” Expert Syst. Appl., vol. 59, pp. 235–244, Oct. 2016

[2] N. Y. Hammerla, S. Halloran, and T. Ploetz, “Deep, Convolutional, and Recurrent Models for Human Activity Recognition using Wearables,” in Proc. of the 25th Int. Joint Conf. on Artificial Intelligence, pp. 1533–1540, 2016

[3] Y. Cheng and Y. Xue, “A Deep Learning Approach to Human Activity Recognition Based on Single Accelerometer,” in Proc. of IEEE Int. Conf. on Systems, Man, and Cybernetics, pp. 1488–1492, 2015

[4] T. H. Vu, L. Dung, and J.-C. Wang, “Transportation mode detection on mobile devices using recurrent nets,” presented at the MM 2016 - Proceedings of the 2016 ACM Multimedia Conference, pp. 392–396, 2016

Compétences requises : traitement du signal, notions d'apprentissage automatique, programmation 

Financement : CDD CEA

Encadrement

Andrea Vassilev (CEA, Grenoble), andrea.vassilev@cea.fr,

Professeur Liming CHEN – ECL – CNRS – LIRIS (http://perso.ec-lyon.fr/liming.chen/)

 

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2015.