Cette formation permet aux participants de renforcer leurs connaissances théoriques et pratiques afin de mettre en œuvre des techniques d’apprentissage automatique pour l’analyse automatique des données. Les principales méthodes statistiques pour l’analyse des données sont présentées, tant pour l’exploration des données (apprentissage non supervisé) que pour la prédiction (apprentissage supervisé). Chaque méthode est d’abord présentée et commentée sur un plan théorique, puis illustrée grâce à des expériences numériques effectuées à partir d’ensembles de données publics, à l’aide du logiciel R et/ou de Scikit-learn de Python.

Objectifs

  • Connaître les principaux algorithmes d’analyse automatique des données et savoir comment les utiliser avec R et/ou Scikit-learn de Python.
  • Reconnaître le type de problème auquel ils sont confrontés : apprentissage supervisé ou non supervisé, apprentissage séquentiel, apprentissage par renforcement, etc.
  • Choisir le bon algorithme à utiliser.
  • Utiliser une mise en œuvre R ou Python de cet algorithme.

Pré-requis

Enseignement scientifique à Bac+2
avec un contenu en Statistique mais le stage peut aussi être calibré à Bac+4
ou Bac+5, au niveau de la formation dispensée en Science des Données dans
la spécialité Mathématiques Appliquées de l’INSA Toulouse.

Programme

Jour 1 : Introduction à l’apprentissage automatique et à l’apprentissage non supervisé

  • Présentation générale de l’apprentissage automatique statistique
  • Analyse des composantes principales
  • Regroupement hiérarchique agglomératif, k-moyennes, k-médoïdes et variantes, DBSCAN, etc.
  • Les tutoriels exécutent successivement le premier tutoriel, puis l’épisode un de chaque bloc-notes : Ozone, Mars, HAR, MNIST. La segmentation d’une image de Mars à l’aide d’algorithmes de regroupement a lieu uniquement le premier jour.
  • B. Il serait trop long d’exécuter tous les blocs-notes. Vous pouvez donc choisir en fonction de votre niveau et/ou domaine d’intérêt. La complexité augmente progressivement d’Ozone à MNIST.

Jour 2 : APPRENTISSAGE SUPERVISÉ 1/2

  • k plus proches voisins
  • Modèle linéaire gaussien, régression logistique, sélection de modèles
  • Lasso et variantes
  • Machines à vecteurs supports
  • Tutoriels pour l’épisode deux de : Ozone, HAR, MNIST

Jour 3 : APPRENTISSAGE SUPERVISÉ 2/2

  • Arbres de décision
  • Bagging, forêts aléatoires, boosting
  • Réseaux de neurones, Deep Learning
  • Tutoriels pour l’épisode trois de : Ozone, HAR, MNIST

Jour 4 : AUTRES ALGORITHMES D’APPRENTISSAGE AUTOMATIQUE

  • Apprentissage séquentiel, problèmes du bandit manchot
  • Super-apprentissage et agrégation experte
  • Apprentissage par renforcement (introduction)
  • Tutoriels Contrôle d’inventaire

Compétences

  • Reconnaître le type de problème auquel ils sont confrontés :
    • apprentissage supervisé ou non supervisé,
    • apprentissage séquentiel,
    • apprentissage par renforcement, etc.
  • Choisir le bon algorithme à utiliser.
  • Utiliser une mise en œuvre R ou Python de cet algorithme.

Inscription

fcq@insa-toulouse.fr

Tél : +33 (0)5 61 55 92 53

Niveau
Cycle
Langue

Anglais

Lieu

INSA, 135 Avenue de Rangueil, 31400 Toulouse

Durée et dates

Sur demande

Tarif
  • 2500 € repas et matériel pédagogique inclus.
  • Remise de 10% pour les partenaires ANITI
Modalités

Présentiel

Publics

Les ingénieurs et les informaticiens qui souhaitent renforcer ou étendre leurs connaissances théoriques et pratiques sur l’analyse automatique des données grâce aux algorithmes d’apprentissage statistique.

Intervenants

Philippe Besse Professor, department Applied Mathematique department at INSA Toulouse Member of the Institut de Mathématiques Statistics & Probabilities Team (UMR CNRS 5219)

https://www.math.univ-toulouse.fr/~besse/index.html

 

Contact

emmanuel.bachelier@univ-toulouse.fr

Tél : +33 (0)5 62 25 01 20

Categories:

fr_FRFrench