Annonce

Les commentaires sont clos.

Sujet de thèse

1 Mars 2023


Catégorie : Doctorant


Contacts: David Helbert: david.helbert@univ-poitiers.fr, Fabien Courrèges: fabien.courreges@unilim.fr, Jean Pierre Cances: jean-pierre.cances@unilim.fr

 

I.Contexte global :

Dans le contexte de l’urgence imposée par le changement climatique, l’accroissement de la pollution atmosphérique, le vieillissement des populations, et l’insécurité dans les villes, les pistes pour faire face à ces problèmes reposent sur la recherche de la maîtrise de la consommation énergétique, de l’impact environnemental des installations humaines, du contrôle du vieillissement des bâtiments et de l’automatisation des habitats (domotique) et moyens de transports pour une meilleure gestion de la logistique urbaine. Le traitement de ces aspects à l’échelle d’une ville par les technologies de l’information et de la communication a induit le concept de ville intelligente (smart city) où de nombreux réseaux de capteurs vont être déployés pour faciliter la vie quotidienne des citoyens. De très nombreuses applications sont prévues telles que : les smart grids pour le contrôle et la commande des réseaux de distribution d’électricité, le déploiement de réseaux de vidéo-surveillance pour la sécurité, le déploiement de réseaux de capteurs d’environnement pour la qualité de l’air, la surveillance en temps réel du trafic routier (détection précoce des accidents et des embouteillages automobiles), la gestion des places de parking, la commande des éclairages publics en fonction de la fréquentation, les applications liées à la télémédecine etc…). Les applications citées ne sont que quelques exemples tant le contexte est riche. Les systèmes existants à longue portée (LPWAN) tels que SIGFOX ou LORA qui fonctionnent sur les bandes ISM ne peuvent pas satisfaire à de tels déploiements massifs à moins d’utiliser une architecture réseau complexe avec un nombre important de sous-ensembles de capteurs (clusters) ayant chacun une station de collecte (head-cluster), ces stations de collecte étant ensuite reliées à un cloud. Un des points les plus pénalisants, outre l’utilisation d’un mode d’accès purement aléatoire nettement insuffisant en cas de connexions massives, est la contrainte du duty-cycle: les capteurs ne sont autorisés à émettre que pendant des périodes très courtes. C’est ainsi que les capteurs de type SIGFOX émettent quelques octets par jour à un débit de 100 bits/s avec la possibilité de transmettre chaque paquet sur trois fréquences différentes. Bref, dans le domaine des réseaux de capteurs, il reste à inventer un système efficace capable de prendre en compte le problème de la connexion massive pour faire face aux grands défis sociétaux de demain. Nous nous proposons dans le cadre de ce sujet de thèse une approche à base de techniques d’acquisition compressée et d’Intelligence Artificielle (I.A.) pour optimiser la couche PHY/MAC des réseaux de capteurs MMTC (Massive Machine Type Communication).

Le déploiement de réseaux de capteurs à grande échelle, on évoque le chiffre de 106 capteurs au km2 pour des applications de type smart city, sur des bandes passantes limitées soulèvent de nombreux problèmes techniques. En premier lieu, on rencontre le problème des transmissions en mode grant-free. En effet, pour pouvoir préserver la durée de vie des capteurs et afin de ne pas surcharger les messages courts transmis par ces derniers avec des en-têtes qui auraient une taille semblable voire supérieure à celle du contenu utile des messages, on laisse les capteurs libres de transmettre à n’importe quel instant sans aucune synchronisation avec la station de collecte ou station de base. La conséquence est que la station de collecte n’a aucune idée au préalable des capteurs actifs dans le réseau. Il faut en premier lieu qu’elle estime la liste des capteurs actifs, i.e. la liste des capteurs qui sont en train de transmettre. Cette étape dans la littérature scientifique est appelée user-activity detection.

Un autre problème technique très important est lié au fait que l’on est contraint d’utiliser des techniques d’accès multiple de type non orthogonal (NOMA : Non Orthogonal Multiple Access) pour obtenir de la capacité. Le fait de tolérer que plusieurs utilisateurs puissent se superposer sur une même bande passante permet évidemment d’accroître la capacité du système ; cependant le prix à payer ou la contrepartie réside dans la génération d’interférences et il faudra mettre en place à la station de base un récepteur multi-utilisateurs capable de traiter ces interférences. Beaucoup de techniques NOMA ont été proposées dans le cadre des travaux de normalisation du groupe de travail 3GPP autour de l’IoT pour la 5G. Disons que parmi toutes ces techniques on peut distinguer deux groupes principaux. Le premier groupe comprend les techniques de séparation par séquences d’étalement (CDMA : Code Division Multiple Access) tandis que le second inclue les techniques de séparation des utilisateurs par allocation de puissance différentes (PDMA : Power Division Multiple Access). Il est indéniable que dans le premier groupe certaine techniques à base de séquences d’étalement creuses (sparse) telles que le SCMA (Sparse Code Multiple Access) ou le MUSA (Multi User Shared Access) qui combine l’OFDM et le CDMA avec un facteur d’étalement égal au nombre de sous-porteuses utilisées apparaissent parmi les plus prometteuses. Le PDMA est une alternative possible mais il requière un contrôle de puissance assez strict au niveau de l’émission des capteurs car il faut pouvoir démoduler à la réception les utilisateurs par ordre de puissance décroissante.

L’utilisation d’un contexte de transmission utilisant le mode NOMA-grant free a une conséquence très importante au niveau du signal observé à la réception sur les différentes sous-porteuses: on obtient un système linéaire d’équations fortement sous-déterminé, i.e. il y a beaucoup plus d’inconnues que d’équations. Il est clair que, sans hypothèse supplémentaire, il n’est pas possible de décoder les données de chaque utilisateur. Fort heureusement, on peut faire des hypothèses fortes sur la modélisation du trafic généré par ces réseaux de capteurs. Typiquement on va supposer qu’à un instant t considéré, seule une petite fraction des capteurs (typiquement quelques pourcents) est active, la plupart des capteurs dans le réseau sont en mode sommeil profond (deep sleep). Cette hypothèse suppose que l’on se place dans le cas où les capteurs transmettent de façon régulière leurs données de mesure; i.e. on ne prend pas en compte le cas des messages d’alerte où quasiment tous les capteurs deviennent actifs au même instant. Avec une telle hypothèse on obtient alors un système linéaire d’équations toujours fortement indéterminées mais sparse, i.e. avec un nombre important d’inconnues égales à zéro. Dans ce contexte il est clair que les techniques dites d’acquisition comprimée ou compressive sensing permettent d’obtenir de bonnes performances en détection malgré la forte indétermination du système. Le problème à résoudre sera mis sous la forme d’un problème d’optimisation sous-contraintes en utilisant typiquement les normes issues du compressive sensing.

Au niveau de la couche Physique, il reste encore le problème d’estimation du canal à traiter. En effet, de par le nombre d’objets connectés et le temps de cohérence limité, on va être contraint d’utiliser des symboles pilotes non-orthogonaux ce qui risque de pénaliser la précision de l’estimation réalisée. Il faudra donc mettre en place des algorithmes d’estimation du canal qui permettent de tenir compte des interférences entre les symboles pilotes. Nous pensons recourir ici aux techniques à base d’Intelligence Artificielle en particulier avec de l’apprentissage profond (deep learning) qui ont fait leurs preuves dans le contexte de canaux difficiles comme le canal accoustique sous-marin. De plus, en considérant l’évolution classique de la 5G vers les bandes millimétriques, on se rend compte que les canaux à traiter présentent un fort caractère sparse: leurs réponses impulsionnelles présentent un nombre élevé de coefficients dont les valeurs sont proches de zéro avec un nombre de coefficients significatifs relativement faible, ces coefficients étant souvent groupés en sous-ensembles (clusters). On a donc ici avec la réponse impulsionnelle du canal un autre degré de sparsité. Il faudrait donc mettre en place, également au niveau de l’estimation des canaux, des algorithmes d’optimisation efficaces qui prennent en compte ce caractère sparse des canaux de propagation.

On le voit, le décodage NOMA grant free en accès massif avec l’estimation conjointe canal + activité des utilisateurs + données transmises pose de gros challenges techniques que nous nous proposons de résoudre au moins en partie dans cette thèse.

 

II.Sujet de thèse proposé :

2.1- Etat de l’art et verrous scientifiques

Le contexte visé par ce projet est celui du déploiement massif de réseaux de capteurs soit dans le cadre de la ville intelligente, soit dans le cadre de la télésurveillance de vastes zones comme les forêts pour la prévention des incendies. Nous nous placerons dans le cadre d’un accès multiple qui est reconnu comme facilitant l’accès massif typiquement le MUSA : Multi User Shared Access. Le MUSA a vraiment été conçu pour supporter le NOMA et le mode de transmission grant-free. On considère ici en effet que les capteurs peuvent transmettre leurs paquets à n’importe quel instant sans la moindre synchronisation avec la station de base ou station de collecte. De plus, il est possible que les données de plusieurs utilisateurs se superposent sur une même sous-porteuse. Le MUSA utilise la modulation OFDM pour le transport des données. La séparation des utilisateurs à la réception est facilitée par l’emploi de séquences d’étalement de faible longueur et par l’emploi de puissances d’émission différentes entre les utilisateurs. Cette séparation de puissance est faîte pour permettre à un récepteur de type SIC (Serial Interference Canceler) d’opérer dans les meilleures conditions possibles.

 

2.1.1-La détection d’activité et la détection des données des utilisateurs

Dans le cadre du projet présenté ici, nous proposons une nouvelle méthode de détection basée sur le compressive sensing, qui n’utilise pas forcément une détection itérative des utilisateurs par puissance décroissante. Nous avons déjà développé au cours des années précédentes une véritable compétence autour de la détection des données en compressive sensing pour les applications de vidéo-surveillance. Cependant, pour pouvoir appliquer ici les techniques issues du compressive sensing, il faut pouvoir bénéficier des bonnes hypothèses de sparsity. Pour pouvoir bénéficier du caractère sparse des données observées nous supposerons qu’à un instant t donné, seule une petite fraction des capteurs est active dans le réseau (typiquement quelques pourcents). Cette hypothèse est fondamentale pour dérouler les algorithmes de détection à base de compressive sensing. Quand on regarde la littérature existante sur le sujet on se rend d’abord compte qu’un certain nombre de travaux traitent de la détection conjointe activité-données utilisateurs en supposant que le canal est parfaitement estimé à la réception. Les travaux de Cirik en 2018 ont par exemple permis d’obtenir un algorithme de détection multi-utilisateurs basé sur l’utilisation de l’algorithme ADMM (Alternating Direction Method of Multipliers) relativement simple à mettre en œuvre. L’algorithme mis en œuvre dans ce papier tire parti des symboles estimés et des utilisateurs détectés précédemment pour obtenir une information à priori sur la trame suivante.

2.1.2-La détection conjointe des utilisateurs et des paramètres des canaux de propagation

En ce qui concerne le problème de l’estimation de canal, on se rend vite compte qu’il s’agit d’un problème complexe dû principalement au fait que l’on ne peut pas disposer dans le contexte MMTC de symboles pilotes orthogonaux. Les méthodes classiques d’estimation de canal de type LMS ou MMSE s’avèrent inefficaces dans ce contexte NOMA grant-free. Heureusement, grâce à la nature très sporadique du trafic MMTC généré, l’estimation conjointe de l’activité des utilisateurs et des paramètres du canal peut être vue comme un problème de détection de signaux sparse que l’on peut essayer de résoudre avec les algorithmes issus du compressive sensing. Dans ce cadre, le problème de l’estimation du canal devient plus facile car le nombre de mesures nécessaires est considérablement réduit. C’est ainsi que des auteurs ont proposé un algorithme de détection d’activité basé sur le principe du message passing comme pour le décodage des codes LDPC. Des auteurs proposent une méthode de détection séquentielle basée sur l’algorithme block coordinate descent (BCD) pour traiter le problème de l’estimation conjointe du canal et la détection multiutilisateurs dans le cadre d’un accès massif à un cloud RAN (Radio Access Network). Une technique Bayesienne utilisant la propagation de moyenne (expectation propagation) peut également être appliquée pour obtenir une approximation précise de la distribution du vecteur des canaux de propagation. Cette distribution approximée est alors utilisée pour pouvoir dérouler un algorithme de maximum de vraisemblance à postériori qui conduit à une estimation du vecteur des canaux de propagation. Enfin, parmi les travaux récents les plus pertinents, on peut citer l’utilisation de deux détecteurs à maximum de vraisemblance : un premier détecteur pour trouver l’ensemble des utilisateurs actifs (MAP-AUD : MAP-based active user detector) et un second détecteur pour déterminer les données transmises (MAP-DD : MAP-based data detector). Les performances de détection peuvent être améliorées en échangeant les informations extrinsèques entre les deux types de détecteur : MAP-AUD et MAP-DD.

 

2.1.3-Apport des techniques basées sur l’Intelligence Artificielle

Un examen de l’état de l’art dans le domaine de la détection multi-utilisateurs en MMTC montre donc que les algorithmes proposés sont souvent des algorithmes itératifs basés sur l’utilisation de critères d’optimisation utilisant des normes bien adaptées au contexte de la sparsité, telle que la norme l0. Il n’existe pas à l’heure d’aujourd’hui une méthode bien identifiée qui permettent de faire efficacement de façon conjointe : l’estimation des canaux, la détection des utilisateurs actifs et la démodulation des données de ces derniers. Pour essayer d’obtenir une approche globale efficace nous nous proposons dans le cadre de ce projet d’utiliser des techniques d’Intelligence Artificielle basées sur le deep learning (DL). En ce qui concerne l’application des techniques DL en communications numériques on peut distinguer principalement deux catégories : les algorithmes dits data-driven ou gouvernés par les données et les algorithmes dits model-driven ou gouvernés par le modèle. En ce qui concerne les algorithmes dits data-driven on traite l’ensemble du problème de détection comme une boite noire et on doit opérer souvent un apprentissage sur une très grande quantité de données pour pouvoir obtenir une convergence satisfaisante dans tous les cas. Compte tenu de la difficulté du problème de détection conjointe auquel nous sommes confrontés ici nous ne croyons pas trop en cette approche. Il nous semble plus intéressant ici d’explorer la méthode dite model driven avec laquelle nous allons utiliser un algorithme bien connu (par exemple l’ADMM (Alternating Direction Method of Multipliers) dont les paramètres seront réglés et optimisés à l’aide des techniques de deep learning (DL). C’est cette approche que nous souhaitons privilégier pour les travaux de ce sujet de thèse. Notre idée est de proposer une architecture capable d’opérer de façon conjointe l’estimation de canal, la détection d’activité et la démodulation des données des utilisateurs en utilisant de façon itérative l’algorithme ADMM (par exemple une itération de l’algorithme ADMM pourra être effectuée à l’intérieur de chaque couche d’un réseau de neurones) qui sera alimenté par un estimateur de canal utilisant l’apprentissage DL. Pour cet apprentissage DL nous exploiterons l’outil Open Source de L’université de New York appelé NYUSIM. Le défi à relever sera bien évidemment de trouver une architecture de décodage et d’estimation de canal capable de prendre en compte tous les degrés de sparsity présents dans le système tant au niveau de l’activité des utilisateurs que de la réponse impulsionnelle des canaux de propagation à estimer.