Cette formation de niveau « sensibilisation/initiation » s’adresse aux personnes qui souhaitent mieux comprendre les enjeux liés aux données et découvrir quelques outils et méthodes applicables aux problèmes de données.

Objectifs

  • découvrir et maîtriser les aspects fondamentaux du Big Data
  • être en capacité de dialoguer avec des data scientists
  • découvrir les outils et méthodes applicables aux problèmes de données

Pré-requis

Avoir des connaissances de base en statistiques, probabilités, calcul différentiel et algèbre linéaire numérique. Il est également demandé des connaissances de base de l’environnement Linux et de la programmation (R, python), ainsi que la gestion de structures de données dans ces langages.

Program

La formation s’articule autour de trois modules :

  • un module de sensibilisation, pour être initié aux fondamentaux des sciences des données et comprendre ce que c’est que le big data
    • introduction à R, introduction à Python, exploration multidimensionnelle, apprentissage statistique, algorithmes classiques d’optimisation, techniques de virtualisation et containérisation (AWS).
  • un module immersion, pour aller un peu plus loin dans les méthodes et les outils utilisés dans ce domaine, sans pour autant devenir autonome
    • infrastructures logicielles pour le Big Data (MapReduce, Hadoop, Spark), méthodes d’apprentissage (arbre binaire de décision, réseaux de neurones, support vector machines, agrégation d’arbres), algorithmes stochastiques plus sophistiqués (optimisation parcimonieuse, factorisation non négative de matrice).
  • Un module cycle de conférences pour découvrir l’application concrète du Big Data dans différents métiers/secteurs d’activités et réfléchir aux questionnements autour du Big Data et de l’IA (éthiques, environnementaux, etc).

Compétences

Langage de programmation R :

  • notions de calcul statistique avec outil informatique R (statistiques élémentaires, estimation et test, analyse descriptive uni et bidimensionnelle) ;
  • utilisation des outils de classification en R.

Langage de programmation Python :

  • compétences de mise en oeuvre d’une analyse exploratoire de données multidimensionnelle et des premiers pas de la modélisation statistique à l’aide de la librairie Scikit Learn de Python ;
  • compétences de mise en oeuvre d’une analyse exploratoire de données complexe et de diverses méthodes de classification supervisée de ces données (données fonctionnelles ou en grande dimension) à l’aide de la librairie Scikit Learn de Python ;
  • compétences de mise en oeuvre d’algorithmes standards en optimisation numérique (sans contrainte, avec contraintes d’égalité) ainsi que d’algorithmes utilisés pour l’apprentissage ;
  • connaissance théorique des principales méthodes d’apprentissage et l’utilisation pratique de ces méthodes en Python.

Les infrastructures logicielles pour le big data :

  • connaissance des bases du traitement de données massives dans des infrastructures de calcul ;
  • capacité de concevoir une application de traitement avec Spark ;
  • connaissance des techniques de virtualisation des infrastructures et capacité d’utiliser une infrastructure virtualisée.

Inscription

certificatbigdata.tech@univ-toulouse.fr
Tél : +33 (0)5 61 00 91 18

Niveau
Cycle
Langue

Français

Lieu

La formation se déroule sur plusieurs établissements (ISAE-SUPAERO,
Toulouse INP-ENSEEIHT, INSA Toulouse)

Durée et dates

Pour consulter le calendrier, cliquez ici.

Tarif
  • 2500 €
  • Remise de 30% pour les partenaires ANITI
Modalités

En présentiel : 2 sessions d’une journée complète + 6 sessions d’une demi-journée (formation à distance possible)

La formation est dispensée en blended-learning :
– à distance/ travail en autonomie : 24 heures d’enseignements en e-learning, 20 heures de projets.
– en présentiel : 36 heures de cours et TP (soit 10 demi-journées),
Un cycle de conférence est associé.

Publics

CEO, cadres dirigeants, managers, consultant métiers, organismes publics et entreprises privées

Intervenants
    • ALBERT Mélisande – enseignante-chercheure INSA Toulouse
    • GENDRE Xavier – enseignant-chercheur ISAE-SUPAERO
    • HAGIMONT Daniel – enseignant-chercheur Toulouse INP-ENSEEIHT
    • OUARET Rachid – enseignant-chercheur Toulouse INP-ENSIACET
    • ROUSTANT Olivier – enseignant-chercheur INSA Toulouse
    • SIMON Ehouarn – enseignant-chercheur Toulouse INP-ENSEEIHT
    • TEABE Boris – enseignant-chercheur Toulouse INP-ENSEEIHT
    • VASSEUR Xavier – enseignant-chercheur ISAE-SUPAERO
    • ZHANG Sixin – enseignant-chercheur Toulouse INP-ENSEEIHT
Contact

certificatbigdata.tech@univ-toulouse.fr
Tél : +33 (0)5 61 00 91 18

Categories:

en_GBEnglish