Cette formation de niveau « sensibilisation/initiation » s’adresse aux personnes qui souhaitent mieux comprendre les enjeux liés aux données et découvrir quelques outils et méthodes applicables aux problèmes de données.

Objectifs

  • découvrir et maîtriser les aspects fondamentaux du Big Data
  • être en capacité de dialoguer avec des data scientists
  • découvrir les outils et méthodes applicables aux problèmes de données

Pré-requis

Avoir des connaissances de base en statistiques, probabilités, calcul différentiel et algèbre linéaire numérique. Il est également demandé des connaissances de base de l’environnement Linux et de la programmation (R, python), ainsi que la gestion de structures de données dans ces langages.

Programme

La formation s’articule autour de trois modules :

  • un module de sensibilisation, pour être initié aux fondamentaux des sciences des données et comprendre ce que c’est que le big data
    • introduction à R, introduction à Python, exploration multidimensionnelle, apprentissage statistique, algorithmes classiques d’optimisation, techniques de virtualisation et containérisation (AWS).
  • un module immersion, pour aller un peu plus loin dans les méthodes et les outils utilisés dans ce domaine, sans pour autant devenir autonome
    • Module de sensibilisations :  Module d’immersion : infrastructures logicielles pour le Big Data (MapReduce, Hadoop, Spark), méthodes d’apprentissage (arbre binaire de décision, réseaux de neurones, support vector machines, agrégation d’arbres), algorithmes stochastiques plus sophistiqués (optimisation parcimonieuse, factorisation non négative de matrice).
  • un module d’information, comportant un cycle de conférences.

Compétences

Langage de programmation R :

  • notions de calcul statistique avec outil informatique R (statistiques élémentaires, estimation et test, analyse descriptive uni et bidimensionnelle) ;
    utilisation des outils de classification en R.

Langage de programmation Python :

  • compétences de mise en oeuvre d’une analyse exploratoire de données multidimensionnelle et des premiers pas de la modélisation statistique à l’aide de la librairie Scikit Learn de Python ;
    compétences de mise en oeuvre d’une analyse exploratoire de données complexe et de diverses méthodes de classification supervisée de ces données (données fonctionnelles ou en grande dimension) à l’aide de la librairie Scikit Learn de Python ;
    compétences de mise en oeuvre d’algorithmes standards en optimisation numérique (sans contrainte, avec contraintes d’égalité) ainsi que d’algorithmes utilisés pour l’apprentissage ;
    connaissance théorique des principales méthodes d’apprentissage et l’utilisation pratique de ces méthodes en Python.

Les infrastructures logicielles pour le big data :

  • connaissance des bases du traitement de données massives dans des infrastructures de calcul ;
    capacité de concevoir une application de traitement avec Spark ;
    connaissance des techniques de virtualisation des infrastructures et capacité d’utiliser une infrastructure virtualisée.

Inscription

certificatbigdata.tech@univ-toulouse.fr
Tél : +33 (0)5 61 00 91 20

Niveau
Cycle
Langue

Français

Lieu

La formation se déroule sur plusieurs établissements (ISAE-SUPAERO,
Toulouse INP-ENSEEIHT, INSA Toulouse)

Durée et dates

16 septembre 2021 > 31 mars 2022
(Démarrage possible en cours de
route sur la session 2020-2021) Sessions journées :
25 & 26 octobre 2021
de 9h à 18h
Sessions demi-journées :
de 14h à 17h (ou 18h)

Tarif
  • 2500 €
  • Remise de 30% pour les partenaires ANITI
Modalités

En présentiel : 2 sessions d’une journée complète + 6 sessions d’une demi-journée (formation à distance possible)

La formation est dispensée en blended-learning :
– à distance/ travail en autonomie : 24 heures d’enseignements en e-learning, 20 heures de projets.
– en présentiel : 36 heures de cours et TP (soit 10 demi-journées),
Un cycle de conférence est associé.

Publics

CEO, cadres dirigeants, managers, consultant métiers, organismes publics et entreprises privées

Intervenants
  • BOURGEOIS Florent – enseignant-chercheur Toulouse INP-ENSIACET
  • DINH Tu – doctorant Toulouse INP-ENSEEIHT
  • FILLION Anthony – post-doc ANITI, Université fédérale Toulouse Midi
    Pyrénées
  • FLOQUET Pascal – enseignant-chercheur Toulouse INP-ENSIACET
  • GENDRE Xavier – enseignant-chercheur ISAE-SUPAERO
  • GRATON Serge – enseignant-chercheur Toulouse INP-ENSEEIHT
  • HAGIMONT Daniel – enseignant-chercheur Toulouse INP-ENSEEIHT
  • JEATSA Armel – doctorant Toulouse INP-ENSEEIHT
  • LAURENT Béatrice – enseignant-chercheur INSA Toulouse
  • RACHELSON Emmanuel – enseignant-chercheur ISAE-SUPAERO
  • RAJHI Hela – doctorante Université Toulouse1 Capitole (UT1), Institut de recherche en Informatique de Toulouse (IRIT)
  • ROUSTANT Olivier – enseignant-chercheur INSA Toulouse
  • SIMON Ehouarn – enseignant-chercheur Toulouse INP-ENSEEIHT
  • SOURTY Raphaël – doctorant Renault Groupe, Institut de recherche en Informatique de Toulouse (IRIT)
  • TEABE Boris – enseignant-chercheur Toulouse INP-ENSEEIHT
Contact

certificatbigdata.tech@univ-toulouse.fr
Tél : +33 (0)5 61 00 91 20

Categories:

fr_FRFrench