Objectifs de la chaire
L’apprentissage par représentation est un aspect fondamental de l’intelligence artificielle qui implique l’extraction automatique d’une représentation compacte et utile des données d’entrée pour les tâches de classification, de regroupement et de prédiction.
Cependant, il peut s’agir d’une tâche difficile dans l’apprentissage profond, où la surparamétrisation est un problème, et dans les statistiques à haute dimension, où des structures éparses peuvent être cachées.
Dans de nombreux contextes industriels, les simulations informatiques génèrent des données complexes qui nécessitent une sélection des caractéristiques pour une analyse efficace.
Pour relever ce défi, nous proposons de tirer parti d’outils mathématiques puissants pour des représentation efficaces, notamment l’analyse de sensibilité (AS), les signatures de la théorie des chemins (RPT) et la théorie des matrices aléatoires (RMT).
L’analyse de sensibilité permet d’identifier les caractéristiques les plus informatives en sélectionnant les variables qui contribuent le plus à la variabilité des données.
Les signatures de la théorie des chemins rugueux fournissent une représentation universelle et expressive pour les données de séries temporelles qui capture les dépendances temporelles complexes et permet une analyse efficace.
Enfin, la RMT permet d’estimer le nombre de composantes principales significatives dans des ensembles de données à haute dimension et de fournir des informations sur la qualité des données de haute dimension et donner un aperçu de la stabilité des réseaux neuronaux.
En utilisant ces outils mathématiques pour l’apprentissage de la représentation, notre objectif est de faciliter l’analyse efficace et efficiente de données industrielles complexes afin de faciliter la prise de décision fondée sur les données.
- L’analyse de sensibilité pour la sélection des variables et la compréhension des codes informatiques à boîte noire.
- La théorie des matrices aléatoires pour les statistiques de grande dimension, plus précisément pour la récupération des signaux et la
la stabilité des réseaux neuronaux - La théorie des chemins rugueux pour les représentations universelles des séries temporelles.
- NXP SEMICONDUCTORS : Analyse de sensibilité à haute dimension et processus gaussiens. Thèse Cifre de D. REMOT (Sept 2022-…), encadrée par R. CHHAIBI et C. PELLEGRINI
- SAFRAN TECH : génération de formes 3D pour la conception de pales industrielles. Thèse Cifre de V. FOY (sept 2020-…), encadrée par R. CHHAIBI et F. GAMBOA
- RENAULT : apprentissage automatique de l’état des routes. Thèse Cifre de V. NGUYEN (2022-…), encadrée par R. CHHAIBI, F. GAMBOA, S. GRATTON, S. ZHANG (sept 2022-…)
- EDF : fiabilité et géométrie de l’information. Thèse Cifre de B. KETEMA (2022-…), sous la direction de F. GAMBOA et F. Costantino.
- LIEBHERR : apprentissage automatique et détection virtuelle. Thèse Cifre de J. REVERDI (2021-…), encadrée par F. GAMBOA et S. Gratton
- EDF : théorie des jeux et analyse de sensibilité. Thèse Cifre de M. IL IDRISSI (2021-…), sous la direction de F. GAMBOA et J.M. Loubès
- D’autres projets industriels sont actuellement en discussion avec AIRBUS, RENAULT et le CEA.
- Apprentissage de représentations compactes et expressive
- Améliorer les méthodes classiques d’IA avec de nouveaux outils mathématiques