Reinforcement Learning on a Diet

Chair objectives

Deep reinforcement learning (RL) – learning optimal behaviors from interaction data, using deep neural networks – is often seen as one of the next frontiers in artificial intelligence.

While current RL algorithms do not escape the relentless pursuit of larger models, bigger data and more computation demands, we posit realworld impacts of RL will also stem from algorithms that are relevant in the small data regime, on reasonable computing architectures.

Principal investigator

Emmanuel Rachelson, (Professor, ISAE-SUPAERO

RL is at a crossroads where one wishes to retain the versatility and representational abilities of deep neural networks, while coping with limited data and resources.

Dans ces conditions, il est essentiel de comprendre comment préserver les propriétés de convergence algorithmique, la robustesse aux incertitudes, les garanties dans le pire des cas, les caractéristiques transférables ou les éléments d’explication du comportement.

Co-chair

Alexandre Albore (Researcher, ONERA)
David Bertoin (Researcher, IRT Saint-Exupéry)

C’est pourquoi nous tentons de mettre le RL “au régime”, afin de mieux comprendre le RL frugal : ses fondements théoriques, les nombreuses façons de compenser des données limitées, les algorithmes solides que l’on peut concevoir, et les impacts pratiques qu’elle peut avoir sur les nombreuses applications du monde réel, où, intrinsèquement, les données sont coûteuses et les ressources limitées, aussi bien dans le domaine de la robotique autonome que dans celui de la médecine personnalisée.

Research objectives

Coopérations et applications industrielles

Main scientific outcomes

Research objectives

Coopérations et applications industrielles

Main scientific outcomes

Reinforcement Learning on a Diet

Chair objectives

Ne manquez rien !

Inscrivez-vous pour recevoir l'actualité d'ANITI chaque mois.