Cette formation permet aux participants de renforcer leurs connaissances théoriques et pratiques afin de mettre en œuvre des techniques d’apprentissage automatique pour l’analyse automatique des données. Les principales méthodes statistiques pour l’analyse des données sont présentées, tant pour l’exploration des données (apprentissage non supervisé) que pour la prédiction (apprentissage supervisé). Chaque méthode est d’abord présentée et commentée sur un plan théorique, puis illustrée grâce à des expériences numériques effectuées à partir d’ensembles de données publics, à l’aide du logiciel R et/ou de Scikit-learn de Python.
Objectifs
- Connaître les principaux algorithmes d’analyse automatique des données et savoir comment les utiliser avec R et/ou Scikit-learn de Python.
- Reconnaître le type de problème auquel ils sont confrontés : apprentissage supervisé ou non supervisé, apprentissage séquentiel, apprentissage par renforcement, etc.
- Choisir le bon algorithme à utiliser.
- Utiliser une mise en œuvre R ou Python de cet algorithme.