Stage - Apprentissage de représentation et par renforcement H/F
CEA
Saclay France, Ile-de-France, Essonne (91)
il y a 5j

Domaine

Sciences pour l'ingénieur

Intitulé de l'offre

Stage - Apprentissage de représentation et par renforcement H / F

Sujet de stage

Apprentissage de représentation et apprentissage par renforcement pour la navigation autonome.

Durée du contrat (en mois)

Description de l'offre

L’apprentissage par renforcement a permis de développer des algorithmes capables de battre les humains dans différentes tâches de contrôle et prise de décision comme les jeux atari ou les jeux de plateau (Go, Echecs).

Son utilisation pour la conduite autonome est prometteur mais souffre de plusieurs problèmes :

  • Il est difficile de résoudre le problème d’optimisation associé à ces algorithmes quand les espaces d’états et d’action sont de très grande dimension.
  • La phase d’apprentissage nécessite beaucoup d’interaction entre l’agent et l’environnement. C’est un processus difficile à mettre en œuvre dans le cas de la conduite autonome.
  • Les algorithme d’apprentissage par renforcement sont souvent aperçus comme une boite noire. Or les notions d’explicabilité et d’interprérabilité sont primordiales pour faire accepter ces solutions dans le monde de l’automobile.
  • Ce stage a pour objectif d’apporter des solutions à ces problèmes. Notamment, en étudiant les méthodes d’apprentissage de représentation pour réduire la dimensionnalité des espaces d’états et d’actions.

    Pour limiter l’interaction avec l’environnement il est possible de s’appuyer sur les techniques d’apprentissage hors-ligne (offline reinforcement learning).

    Finalement, la notion d’interprétabilité peut être introduite dans ces algorithmes en ajoutant des tâches à niveau sémantique élevé dans ses algorithmes (prédiction de trajectoire, segmentation de la scène, ).

    Il sera demandé au stagiaire de faire une étude bibliographique, de proposer et d’implémenter une solution aux différents problèmes soulevés et finalement procéder à une validation expérimentale.

    Profil du candidat

    Compétences requises :

  • Vision par ordinateur
  • Apprentissage automatique (deep learning)
  • Reconnaissance de formes
  • C / C++, Python
  • La maîtrise d'un framework d'apprentissage profond (en particulier Tensorflow ou PyTorch) est un plus.
  • Signaler cette offre d'emploi
    checkmark

    Thank you for reporting this job!

    Your feedback will help us improve the quality of our services.

    Postuler
    Mon email
    En cliquant sur « Continuer », je consens au traitement de mes données et à recevoir des alertes email, tel que détaillé dans la Politique de confidentialité de neuvoo. Je peux retirer mon consentement ou me désinscrire à tout moment.
    Continuer
    Formulaire de candidature