Objectifs de la chaire

La robotique a connu d’énormes progrès ces dernières années grâce aux avancées des simulateurs, des optimiseurs et de l’apprentissage par renforcement. Malgré des démonstrations impressionnantes, ces méthodes n’ont pas encore été pleinement déployées dans le monde réel, et leur mise à l’échelle reste un défi.

Principal investigator

Et si nous pouvions exploiter tout le potentiel de l’optimisation sous contrainte et de l’apprentissage par renforcement pour former des politiques sûres et efficaces pour les tâches de locomotion et de manipulation dynamiques ?
Dans le cadre de cette chaire, nous proposons d’atteindre cet objectif en revisitant le fonctionnement des algorithmes d’apprentissage par renforcement en tirant parti de l’expertise consolidée acquise par des années de progrès en commande prédictive numérique, et en exploitant les avancées récentes en matière de simulateurs différentiables.

Co-chair

Notre objectif est de parvenir à une convergence plus rapide et plus précise, en réduisant la charge de calcul et en fournissant des garanties strictes sur la politique optimale obtenue. Nous incorporerons ensuite des stratégies globales pour planifier à travers des modes dynamiques hybrides (par exemple, en raison d’interactions de contact intermittentes) et l’intégration d’informations sensorielles multimodales, y compris la détection de la force et du toucher.
Ces améliorations augmenteront la robustesse et la sécurité de nos politiques lors des interactions physiques, ce qui permettra une manipulation et une locomotion robotiques fiables dans des environnements complexes.
Les capacités expérimentales uniques de notre équipe et sa forte expertise dans les domaines de l’apprentissage par renforcement et le contrôle optimal permettront d’établir un cadre complet pour l’optimisation et le contrôle des politiques robotiques permettant à terme le développement de robots capables de mouvements complexes, adaptatifs et fiables déployés dans des cas applications réelles.
La chaire bénéficiera d’interactions fortes avec la chaire de synergie C3PO ainsi qu’avec d’autres chaires dans le domaine de l’optimisation numérique et de l’apprentissage automatique. Les résultats seront traduits en problèmes pratiques grâce à une collaboration efficace avec le fabricant de robots PAL et avec l’utilisateur final AIRBUS.
Le projet prendra également en compte les impacts socio-économiques directs avec une attention particulière portée sur la diffusion directe auprès des étudiants grâce à la création d’un programme d’échange international et le jeune public par le biais d’activités robotiques spécifiques.

Ne manquez rien !

Inscrivez-vous pour recevoir l'actualité d'ANITI chaque mois.

Nous n’envoyons pas de messages indésirables !

fr_FRFrench