Vous êtes ici : Accueil » Thèmes » Thème A » Actions spécifiques

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Thème A : Actions spécifiques

Apprentissage

Olivier Cappé (DR CNRS, LTCI, Paris), Pierre Chainais (MCF, LAGIS, Lille), Zaïd Harchaoui (CR INRIA, INRIA, Grenoble)

L'apprentissage automatique (ou machine learning en anglais) est un domaine de recherche à la croisée de la statistique, de l'informatique et de l'optimisation. Les objectifs essentiels sont de modéliser des systèmes complexes (par exemple, une expertise humaine) ou de classer des données, en vue par exemple de leur indexation (fouille de données), principalement à partir d'échantillon de données ou d'exemples des tâches à effectuer. L'apprentissage automatique est devenu un outil prééminent dans plusieurs domaines du traitement des signaux et des images (problèmes inverses, vision par ordinateur, indexation de données multimédia, etc.). Cet intérêt s'est notamment manifesté par la création du comité technique MLSP (Machine Learning for Signal Processing) au sein de la société Signal de l'IEEE.

L'objectif de cette Action est double. D'une part, il s'agit, sur un sujet largement pluridisciplinaire, d'entretenir et de développer les liens entre les communautés de l'apprentissage automatique et la communauté représentée par le GdR ISIS. En particulier, il est envisagé d'organiser des réunions communes avec des groupes d'intérêt ou sociétés relevant plus de l'informatique (GdR I3, SIF, AFIA) ainsi qu'avec leurs homologues du côté statistique et optimisation (notamment le groupe MAS de la SMAI, la SFdS, les GdR MIA et MOA). Le second objectif est de développer les échanges autour du corpus de méthodes et de l'ensemble des applications qui relèvent plus spécifiquement de la thématique MLSP : en particulier, la séparation de source et les factorisations matricielles (problématique dite également d'apprentissage de dictionnaire), la question des données structurées (flux temporels, graphes, etc.), les modèles parcimonieux (y compris dans leur utilisation pour l'acquisition de données), les algorithmes adaptatifs, les méthodes séquentielles (détection de ruptures notamment), ainsi que les méthodes d'apprentissage distribuées.

Optimisation

Nelly Pustelnik (CR CNRS, Laboratoire de Physique, ENS de Lyon), Said Moussaoui (MCF, IRCCyN, Nantes)

De nombreuses problématiques de traitement des signaux et des images telles que la séparation de sources, la restauration et les décompositions parcimonieuses ont récemment gagné en performances grâce aux outils d'optimisation convexe qui permettent de gérer des fonctions non-lisses telles que les normes L1 ou nucléaire. Une grande activité de recherche émane de ces sujets et de nombreuses questions sont soulevées. Un premier axe est la prise en compte d'un choix plus large de contraintes convexes par le biais de méthodes telles que les points intérieurs, la pénalité extérieure ou les projections épigraphiques. Un autre axe d'intérêt est l'extension des méthodes existantes au cadre non-convexe, afin de traiter des problèmes inverses non-linéaires ou de se rapprocher de pénalités non-convexes telles que la pénalisation L0 ou des contraintes sur le rang de matrices. Enfin, la question de la résolution de problèmes de grande dimension, qui s'inscrit dans la continuité de thématiques portées par le Thème A et B à travers la précédente Action "Problèmes inverses", requiert l'exploitation d'outils de calcul parallèle mais également des méthodes nécessitant un faible nombre d'évaluations du critère/gradient.

Méthodes de simulation stochastiques

Gersende Fort (DR CNRS, LTCI, Paris) et François Septier (MCF, Télécom Lille1 / LAGIS, Lille)

Les méthodes de simulation Monte Carlo sont utilisées pour l'exploration de lois de probabilités, par exmple dans une  approche bayésienne des problèmes inverses ou pour la restauration de données manquantes. Comme l'atteste la littérature, ces approches ont été appliquées avec succès à de très nombreuses applications (navigation et localisation, classification en imagerie, traitement du signal audio, communications numériques, etc.).

Le défi majeur pour les prochaines années est lié à l'analyse de données de très grandes dimensions et de données massives. Dans ce contexte, il est nécessaire de faire évoluer ces méthodes afin de les rendre robustes à la grande dimension des supports à explorer et à la multimodalité des lois tout en intégrant les aspects séquentiels du traitement de l'information soit du fait du phénomène d'acquisition des données soit du fait du caractère massif des données.

L'objectif de cette Action est tout d'abord de développer des échanges avec la communauté Statistique pour les aspects  méthodologiques des algorithmes de simulation Monte Carlo; et la communauté Optimisation qui partage des problématiques communes (optimisation stochastique; contexte multimodal; techniques "mutation / sélection"). Enfin, cette Action a également pour objectif de favoriser les interactions entre les chercheurs intéressés par le développement méthodologique dans ce domaine et ceux soucieux de résoudre des problèmes complexes par le biais de ces techniques.

Estimation et détection en grande dimension

Jamal Najim (CR CNRS, IGM, Marnes-la-Vallée), Romain Couillet (MCF, Supélec), Emmanuel Duflos (PU, Ecole Centrale de Lille)

Les statisticiens sont de plus en plus fréquemment confrontés à de grands jeux de données. Grands par le volume, mais aussi par le fait que la dimension des données à traiter est du même ordre que la taille de l'échantillon disponible. Cette dernière caractéristique affaiblit substantiellement la portée des procédures statistiques habituelles. Des problèmes aussi classiques que l'estimation de matrices de covariance, de filtres prédicteurs, d'analyse d'estimateurs de type sous-espace, ou de détection de signal dans du bruit, doivent être revisités. Cette problématique, fréquente dans les domaines du traitement du signal et de l'image ainsi que des communications numériques, a fait l'objet ces dernières années de nombreux travaux, ayant abouti à des résultats mal diffusés dans la communauté.

Cette Action a plusieurs objectifs : accompagner le développement actuellement rapide de l'estimation et de la détection en grande dimension sur certains aspects clairement identifiés ; en informer la communauté ISIS ; faciliter l'accès aux outils utilisés (théorie des matrices aléatoires, estimation de grandes matrices de covariance par seuillage/pondérations, ...) et organiser des séances tutorielles; identifier les besoins spécifiques de la communauté et l'expertise présente, enfin susciter des interactions entre statisticiens, probabilistes, et spécialistes du traitement du signal et des communications numériques. Les aspects communs et complémentaires avec d'autres thématiques comme la représentation parcimonieuse seront abordés.

Signaux & Images sur graphes

Pierre Borgnat (CR CNRS, Laboratoire de Physique, ENS de Lyon), Cédric Richard (PU 61, Laboratoire Lagrange, Nice)

Cette Action s'intéresse aux zones de rencontre entre le traitement des signaux et des images et les études des graphes et réseaux. Dans de nombreux contextes d'application, les données sont naturellement réparties sur un réseau (par exemple réseaux de capteurs, de neurones, de gènes, d'ordinateurs, de transport ou même de contacts sociaux, etc.), et leur analyse requiert de développer ces deux approches. D'autres approches proposent de décrire des signaux ou des images via une structure de graphes, par exemple par des modèles graphiques ou en reconstruisant sous forme de graphe la topologie d'une variété non euclidienne contenant des données.

Toutes ses approches se révèlent intéressantes et complémentaires : la description des mesures ayant des structures topologiques qui s'éloignent des situations simples (données sur des variétés non convexes ou irrégulières, données en nuage de points ou de vecteurs, modèles graphiques de processus aléatoires, etc.) peut en effet être appréhendée à l'aide de représentation par graphes. La caractérisation de ces réseaux complexes nécessite le développement de méthodes adaptées telles que mesures d'entropie, de forme, opérations de classification, mesures de circulation de l'information, etc. Plus généralement, les méthodes de traitement des signaux ou des images sur graphe autant que des traitements des graphes eux-mêmes attirent une nouvelle activité. Par la suite, l'utilisation de ces outils sur des réseaux de grandes tailles, pour résoudre des problèmes inverses, ou pour capturer des propriétés non triviales telles que des connectivités à longue portée ou des invariances d'échelles constitue un enjeu actuel qui pourra être exploré en lien avec les autres Actions de ce thème.

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2015.