Vous êtes ici : Accueil » Kiosque » Annonce

Identification

Identifiant: 
Mot de passe : 

Mot de passe oublié ?
Détails d'identification oubliés ?

Annonce

16 juillet 2018

Audio distribué dans un contexte d’assistant vocal


Catégorie : Post-doctorant


Contexte : La maison s’étoffe de plus en plus d’objets connectés (thermomètres, détecteurs de présence, enceintes, mobiles, tablettes, TV…). Orange a l’ambition de devenir un acteur majeur dans le domaine des services connectés à la maison. En effet, le contrôle de ces objets et de leur interconnexion lui permettrait d’offrir une qualité de bout en bout optimale de ses services. Les périphériques audio connectés sont actuellement encore assez simples et dédiés à des usages spécifiques (webcam pour la surveillance) ou liés à une plateforme donnée, comme la commande vocale et l'écoute musicale (Amazon Echo, Google Home) ou l'écoute multi haut-parleurs sans fils (Sonos). Cependant ils possèdent un potentiel applicatif qui dépasse leurs fonctionnalités actuelles : demain, on pourra peut-être localiser, suivre, voire identifier une personne dans la maison grâce aux sons qu’elle génère, créer un système home-cinéma à partir de haut-parleurs hétérogènes (de marques différentes) en se situant en permanence au centre du « sweet spot » (lieu privilégié) pour une expérience immersive optimisée, analyser l’état de santé d’un sujet par sa voix, détecter des intrusions dans une maison avec de nouveaux capteurs…

 

Etat de l’art :

Orange étudie actuellement ce sujet, en identifiant, par des informations acoustiques, la position de haut-parleurs, de microphones, et de personnes au sein d’un lieu (pièce, voire maison). Pour cela, il s’avère nécessaire de synchroniser et syntoniser les différents éléments (micros/haut-parleurs) par une étape de calibration, avant de pouvoir réaliser une cartographie des éléments sonores (micros/haut-parleurs, mais aussi locuteurs). Tous ces éléments sont connectés à un hub audio, centre névralgique du système.

Les applications associées sont entre autre :

  • ·Un rendu multi haut-parleurs de type home-cinéma sur la base d’enceintes connectées hétérogènes
  • ·L’amélioration du rendu audio 3D multi haut-parleurs (adaptation du « sweet spot »)

Ces applications sont actuellement en cours d’implémentation et d’évaluation dans le cadre d’un partenariat avec un équipementier audio/video de réputation internationale.

C’est dans ce contexte que trouve l’origine de ce sujet de recherche, dont le but est d’aller un cran plus loin, en étudiant l’extension à un fonctionnement avec annulation d’écho, notamment afin de pouvoir adresser à terme les applications suivantes :

  • ·Un assistant vocal domestique présent dans toute la maison (sélection du meilleur couple micro/haut-parleur), capable d’atténuer, voire supprimer, les sons provenant des autres éléments acoustiques afin d’améliorer le taux de reconnaissance (par exemple quand la TV ou la radio fonctionnent)
  • ·Une communication mains-libres, qui nécessite en plus de l’application précédente d’adresser la problématique de la faible latence.

Le verrou principal réside dans l’annulation d’écho centralisée pour un système hétérogène: Chacun des éléments sonores contrôlés par le hub audio est susceptible d’émettre du son (TV, musique, radio, voire un correspondant en communication…), alors considéré comme du bruit pour le système de reconnaissance vocal de l’assistant vocal. Or, en principe le hub audio a connaissance de tous ces signaux, un traitement d’annulation d’écho devrait donc être possible car tous les devices sont synchronisés. On suppose que les transports des media en local se font sans compression audio.

La connaissance de la distance de propagation entre chaque haut-parleur et chaque microphone devrait permettre à la fois une estimation plus fiable du filtre à mettre en œuvre, ainsi que la réduction de sa taille. En effet, lors de la phase de calibration du système, la réponse impulsionnelle caractérisant les trajets acoustiques entre chaque couple micro/haut-parleur peut être stockée, et servir de base pour le filtrage d’annulation d’écho ; tout écart par rapport à ce filtre (le résidu) pourrait être pris en charge par un algorithme d’annulation d’écho dont le but est d’estimer un filtre résiduel, par une approche classique de filtrage adaptatif, et/ou exploitant une estimation par réseau de neurones.

L’application principale de cette recherche vise l’assistant vocal domestique, mais en fonction de l’avancement des travaux, l’application de communication (incluant donc la contrainte de faible latence) pourrait être également abordée.L’annulation d’écho étant d’une importance primordiale dans ces 2 applications, l’objectif principal de ce post-doc se concentrera donc en priorité sur cette problématique. En effet, la réduction de la latence ne sera utile pour une communication en mains-libres que si l’annulation d’écho est réalisée avec une qualité correcte.

 

Références :

J. Benesty, T. Gaensler, D. R. Morgan, M. M. Sondhi, and S. L. Gay, Advances in Network and Acoustic Echo Cancellation. Springer-Verlag, Berlin, Germany, 2001.

J. Benesty, C. Paleologu, T. Gaensler, and S. Ciochina, A Perspective on Stereophonic Acoustic Echo Cancellation. Springer-Verlag, Berlin, Germany, 2011.

Generalized multichannel frequency-domain adaptive filtering: efficient realization and application to hands-free speech communication H Buchner, J Benesty, W Kellermann - Signal Processing, 2005

Acoustic Echo Control, Gerald Enzner, Herbert Buchner, Alexis Favrot and Fabian Kuech [http://www.buchner-net.com/chap_elsevier2013_e-offprint_16227_10030.pdf]

 

 

Profil :
Titulaire d’une thèse, vous possédez les compétences et qualités personnelles suivantes :
§Pré-requis techniques :
-Maîtrise du traitement du signal audio.
-Connaissances en prise de son, transport (codage), restitution spatialisée (acoustique et psycho-acoustique) appréciées
-Maîtrise de langages de programmation (Matlab, C/C++, Python … outils d’Intelligence Artificielle appréciés)
§Aptitudes personnelles :
-Forte sensibilité à l’audio
-Autonomie et prise d’initiatives
<!--[if gte mso 9]> <w:LsdException Locked="false" Priority="63" Name="Med
Offre de poste publiée sur Orange Jobs : https://orange.jobs/jobs/offer.do?joid=72488&lang=FR

Dans cette rubrique

(c) GdR 720 ISIS - CNRS - 2011-2018.