Objectifs de la chaire

Les modèles d’IA récents ont connu un succès remarquable dans des domaines spécifiques (par exemple, la vision, le langage, le contrôle d’agents robotiques, etc) et l’on s’oriente vers des modèles de plus en plus grands combinant plusieurs modalités d’entrée et de sortie. 
En théorie, les représentations multimodales peuvent aider les spécialistes de la vision en dotant les entrées sensorielles d’informations sémantiques.

De même, les linguistes peuvent les utiliser pour ancrer les jetons NLP dans l’environnement sensorimoteur et créer une forme de sens référentiel.

Les roboticiens peuvent également tirer parti de ces représentations polyvalentes pour la navigation et la planification des actions.

Principal investigator

Mais dans la pratique, les modèles actuels reposent sur des approches d’apprentissage par force brute utilisant des milliards d’exemples étiquetés alors que les ensembles de données et les ressources informatiques à la disposition des chercheurs universitaires et industriels sont généralement beaucoup plus petits.
Par rapport aux réseaux neuronaux artificiels, les vrais cerveaux apprennent beaucoup plus efficacement. Nous nous inspirons donc de l’idée des sciences cognitives d’un espace de travail global (GW) pour construire une nouvelle classe de systèmes d’IA.
L’espace de travail global, modèle unique d’ancrage multimodal (englobant la perception, l’action et les représentations sémantiques) peut favoriser les avancées dans les modèles perceptifs et soutenir les interactions descendantes (du langage et de la sémantique à la perception et à l’action) qui intéressent les linguistes et les interactions ascendantes (de la perception active et de la navigation aux abstractions sémantiques) qui intéressent les roboticiens.
L’hypothèse haut risque/haut gain est que les modalités se complètent de manière synergique, de sorte que l’ensemble du système est beaucoup plus efficace que la somme de ses parties, non seulement pour les tâches multimodales, mais aussi lorsqu’elles sont évaluées dans les domaines initiaux (vision, NLP, robotique).
Construire des modèles perceptifs et cognitifs frugaux qui peuvent prendre en charge l’ancrage et l’incarnation du langage et fournir des représentations sémantiques aux agents robotiques devrait avoir des conséquences bénéfiques pour les partenaires industriels d’ANITI (par exemple Airbus, Linagora).

Co-PI

Ne manquez rien !

Inscrivez-vous pour recevoir l'actualité d'ANITI chaque mois.

Nous n’envoyons pas de messages indésirables !

fr_FRFrench