Thèse Algorithmes asynchrones et économes pour l'optimisation des communications d'un réseau d'objets connectés F/H
Orange
Meylan , France
il y a 1 mois

about the role

Votre rôle est d'effectuer un travail de thèse sur les algorithmes asynchrones et économes pour l'optimisation des communications d'un réseau d'objets connectés .

Contexte

On peut distinguer 2 types de réseau d'objets connectés :

  • Les évolutions des réseaux traditionnels cellulaires comme Extended Coverage Global System for Mobile Communications (EC-
  • GSM), LTE-M ou Narrow Band IoT (NB-IoT).

    Les futurs réseaux 5G, qui promettent de répondre au challenge de massivité des objets connectés, rentrent bien évidemment dans cette catégorie réseau cellulaire IoT.

  • Les réseaux LPWA (Low Power Wide Area) qui eux opèrent sur les bandes de fréquences non licenciées. Les objets connectés communiquent alors directement avec les stations de base dans une topologie en étoile.
  • Avec l'accès aléatoire des terminaux IoT au réseau, qu'il soit cellulaire ou LPWA, se pose le risque de congestion, par exemple lorsque deux objets vont tenter de joindre la station de base sur la même fréquence et au même moment.

    Lorsqu'une collision se produit entre deux messages, aucun des deux n'est transmis. Les deux objets doivent refaire une tentative, ce qui a pour effet d'augmenter le volume de données transmis et donc indirectement d'augmenter le risque de collisions.

    De plus, beaucoup de ces objets, comme les compteurs d'eau et de gaz, les capteurs de présence pour les parkings ou bien ceux mesurant la qualité de l'air, sont alimentés par des batteries et peuvent être placés dans des endroits difficilement accessibles.

    Dès lors la question de l'économie d'énergie devient cruciale.

    Afin d'optimiser les ressources du réseau tout en consommant le moins d'énergie possible, chaque objet connecté doit alors pouvoir faire des choix efficaces d'accès, comme choisir de manière décentralisée l'instant, la fréquence et / ou la puissance d'émission de ses messages.

    Etat de l'art

    Dans un environnement ouvert et évolutif, comme celui des objets connectés, le choix des paramètres de connexion doit être dynamique.

    C'est ce que propose en natif le protocole du réseau LoRa, choisi par Orange. L'algorithme ADR (Adaptative Data Rate) se base sur le rapport signal à bruit des dernières transmissions pour déterminer la fréquence et la puissance d'émission de la prochaine transmission 1 .

    Cet algorithme ne minimise pas explicitement la consommation énergétique et l'efficacité du réseau, si bien qu'il s'avère peu efficace du point de vue énergétique, et qu'il a tendance à perdre des paquets lorsque la charge du réseau est élevée 2 .

    Récemment, des techniques d'apprentissage par renforcement (les bandits manchots) ont été testées avec succès pour déterminer les paramètres de connexion pour les communications d'objets connectés 2,3 .

    Les bandits manchots 4 permettent ici de régler de manière optimale le compromis entre l'exploration des différents paramétrages et l'exploitation des meilleurs paramétrages.

    Ces études récentes montrent tout le potentiel de l'approche par apprentissage pour l'optimisation des communications dans un réseau d'objets connectés.

    De nombreuses questions restent néanmoins en suspens : Quel est le coût énergétique des différents algorithmes de bandits ?

    Que se passe-t-il lorsque tous les objets optimisent leurs communications par apprentissage ? Si une partie des objets collaborent de manière décentralisée, peut-

    elle prendre l'avantage sur le reste des objets connectés ?

    Se référer à la section 3 Le plus de l'offre pour des informations détaillées sur la mission scientifique et les principales activités associées à la thèse.

    about you

  • Bac +5, Master Recherche, informatique, statistique, mathématiques appliquées, réseaux de télécommunication.
  • Les compétences nécessaires pour traiter le sujet sont de deux types :
  • les mathématiques appliquées et plus particulièrement la statistique, la théorie de l'apprentissage et la théorie des jeux,
  • une bonne maitrise des outils informatiques et plus particulièrement d'un langage de programmation C++ et / ou Java.
  • Dossier de candidature : CV, lettre de motivation, relevé de notes, rapport de stage, deux lettres de recommandation.
  • additional information

    Objectif scientifique - verrous à lever

    L'objectif de la thèse est de proposer et d'analyser des algorithmes d'apprentissage par renforcement permettant d'optimiser les communications d'un réseau d'objets connectés, tout en minimisant la consommation électrique de ces objets connectés.

    Les difficultés majeures soulevées par ce sujet s'articulent autour de trois points :

    1.Les ressources utilisées par les algorithmes de bandits (énergie, mémoire, capacité de calcul)

    Les objets connectés reposent sur des systèmes d'exploitation embarqués et disposent de capacités de calcul et de mémoire restreinte.

    Cette contrainte est d'autant plus forte que chaque ressource supplémentaire augmente la consommation électrique de l'objet connecté.

    Un bon algorithme d'optimisation des communications des objets connectés doit donc être parcimonieux.

    2.L'analyse multi-joueurs des algorithmes de bandits

    Les premières études menées sur le sujet 2,3 montrent des résultats très encourageants lorsqu'un objet ou un sous-ensemble d'objets optimise leurs paramètres de connexion avec des algorithmes de bandits alors que le reste des objets appliquent une politique constante ou celle définie dans le protocole.

    L'analyse multi-joueurs des algorithmes de bandits rentre dans le cadre général de la théorie des jeux 5 . Le doctorant pourra en outre s'inspirer des travaux connexes effectués pour la radio cognitive 6 .

    3.L'analyse des algorithmes de bandits coopératifs

    Chaque opérateur fournit aux objets connectés de ses clients l'accès à son réseau. Les objets connectés d'un même opérateur ont intérêt à collaborer pour trouver un équilibre global satisfaisant pour le réseau et offrant la meilleure QoS possible.

    Néanmoins, la collaboration entre les objets connectés nécessite des échanges d'information, ce qui a pour effet d'augmenter la charge du réseau et la consommation électrique des objets.

    Les bandits coopératifs ont récemment suscité un intérêt de la communauté et le doctorant pourra s'appuyer sur l'état de l'art existant 7,8,9 pour développer et analyser des algorithmes de bandits coopératifs économes en énergie, et permettant d'obtenir un équilibre avantageux par rapport aux autres acteurs.

    Approche méthodologique-planning

    Le planning et les étapes de cette étude seront les suivantes

  • T0 : L'étude commencera par un état de l'art et le positionnement des travaux envisagés. L'aspect performance énergétique des bandits n'a, à notre connaissance, jamais été analysé et, si les algorithmes de bandits stochastiques ou adverses sont réputés peu exigeants en ressources, leurs exigences et leurs performances ne sont pas les mêmes, et les algorithmes les plus performants pour faire face à la non-
  • stationnarité nécessitent de mémoriser un grand nombre de compteurs.

  • T0 + 6 mois : Pour mettre au point et tester les algorithmes produits durant la thèse, le doctorant pourra utiliser un simulateur de réseau LoRa développé par Orange Labs 10 .
  • L'extension du simulateur au cas multi-joueurs pourra être faite durant cette seconde phase. Pour aborder la consommation électrique des algorithmes de bandits, le doctorant disposera d'une plateforme de monitoring d'objets connectés au réseau LoRa avec laquelle il aura à se familiariser.

  • T0 + 12 mois : A l'issue de ce travail, le doctorant sera à même d'élaborer des algorithmes de bandits (économes, multi-
  • joueurs et coopératifs), de les analyser et de réaliser des premiers tests en simulation.

  • T0 + 24 mois : Le début de troisième année sera consacré à la réalisation de tests in vivo sur la plateforme LoRa. Un codage efficace des algorithmes sur de vrais objets connectés permettra au doctorant de confronter les différents algorithmes de bandits in vivo.
  • T0 + 30 mois : Rédaction du mémoire de thèse.
  • department

    oL'équipe PROF, spécialisée en machine learning, est reconnue tant au sein du groupe Orange et que sur le plan académique au niveau international.

    Elle compte actuellement 20 membres permanents, et 5 doctorants.

    oLe / la doctorant.e sera amené(e) à travailler au sein de l'équipe CITY du département M2M, Internet of Things, Smart Cities qui a développé une importante expertise sur les réseaux d'accès pour les objets connectés (M2M et IoT) dans le cadre des études qu'elle mène depuis plusieurs années.

    Qu'est ce qui fait la valeur ajoutée de cette offre ?

    Le sujet de thèse contient à la fois des aspects expérimentaux allant jusqu'à l'implémentation des algorithmes dans les objets connectés pour faire des tests réels et des aspects analytiques importants pour fournir les garanties théoriques.

    Le sujet de thèse est pluridisciplinaire. Plusieurs équipes d'Orange Labs seront impliquées dans leur domaine d'expertise notamment en réseaux, objets connectés et apprentissage par renforcement.

    Références :

    1 LoRa Alliance, What is LoRaWAN? https : / / www.lora-alliance.org / what-is-lora, last accessed August, 13th 2017.

    2 R. Kerkouche, R. Alami, R. Féraud, N. Varsier, P. Maillé, Node-based optimization of LoRa transmissions with Multi-Armed Bandit algorithms , submitted to ICC 2018.

    3 R. Bonnefoi, L. Besson, C. Moy, E. Kaufmann, and J. Palicot, Multiarmed bandit learning in IoT networks : Learning helps even in nonstationary settings, in CROWNCOM, 2017.

    4 Robbins, H. (1952). "Some aspects of the sequential design of experiments" in Bulletin of the American Mathematical Society.

    5 S. Lasaulce and H. Tembine Game Theory and Learning for Wireless Networks , Elsevier, 2011

    6 B. Wang, Y. Wu, and K.J. Liu Game Theory for cognitive radio : an overview in Computer Networks, 2010.

    7 E. Hillel, Z. Karnin, T. Koren, R. Lempel, O. Somekh, Distributed Exploration in Multi-Armed Bandits , NIPS, 2013.

    8 V. Kanade, Z. Liu, B. Radunovic,, Distributed Non-Stochastic Experts , NIPS, 2012.

    9 R. Féraud Networks of Bandits insure privacy of end-users , arxiv, 2016.

    10 N. Varsier and J. Schwoerer, Capacity limits of LoRaWAN technology for smart metering applications, in Proc. of IEEE ICC, 2016.

    Thesis

    Postuler
    Postuler
    Mon email
    En cliquant sur « Continuer », je consens au traitement de mes données et à recevoir des alertes email, tel que détaillé dans la Politique de confidentialité de neuvoo. Je peux retirer mon consentement ou me désinscrire à tout moment.
    Continuer
    Formulaire de candidature