Machine Learning bases

Analyse
Data Science
Open Source
Intra-entreprise
Présentiel
Distanciel
Français
Anglais

Objectifs

  • Comprendre les bases de l’apprentissage artificiel et du machine learning sur des données structurées, appliquer des méthodes standard de réduction de dimension et de clustering, savoir mettre en oeuvre un modèle de régression en contrôlant le surajustement et en validant les prédictions du modèle, comprendre les bases du text mining.
  • À l’issue de cette formation, le participant sera en mesure de déterminer le type de techniques à appliquer en fonction des questions posées et de réaliser des pré-traitements élaborés afin de mettre en oeuvre des modèles prédictifs.

Prérequis :

  • Avoir suivi Outils de base Python ou niveau équivalent
  • Aisance avec les outils informatiques, disposer d’une connexion Internet

Moyens pédagogiques et d’encadrement :

  • Séances avec le formateur
  • Support pédagogiques format numérique,
  • Alternance entre théorique et pratique
  • Cas concrets

Dispositif de suivi et d’évaluation des acquis :

  • Mise en pratique et exercices, Appréciation de la formation à chaud

Résultats & compétences attendus à l’issue de la formation :

  • À l’issue de cette formation, le participant sera en mesure de déterminer le type de techniques à appliquer en fonction des questions posées et de réaliser des pré-traitements élaborés afin de mettre en oeuvre des modèles prédictifs

Programme de la formation

 JOUR 1

  • Introduction aux méthodes non supervisées :
    • L’analyse en composantes principales (PCA)
    • La classification automatique (k-means),
    • Les règles d’association (apriori, eclat)
  • Introduction aux méthodes supervisées :
    • Les modèles de régression linéaire et logistique avec régularisation (ridge régression),
    • Les arbres de décision (régression et classification)

JOUR 2

  • Les méthodes standards pour mettre en œuvre des modèles prédictifs :
    • Feature engineering : apprendre à réduire la complexité d’un problème,
    • Sélection de variables,
    • Validation croisée,
    • Calibration d’un modèle prédictif
    • Text Mining et web scraping
Durée
14 heures
Niveau
Débutant
Public
Toute personne souhaitant découvrir les principes de base du Machine Learning.
Participants
8 personnes maximum
Nous contacter pour un devis personnalisé

Vous recherchez des informations sur une formation ?

Vous souhaitez mettre en place une session de formation sur mesure ?

Contactez notre équipe pédagogique !

Stata
Rapide, précis et facile à utiliser, le logiciel Stata est la référence pour le traitement et l'analyse de données statistiques et de data science. Il répond à tous vos besoins en matière de science des données : manipulation des données, visualisation, statistiques et rapports automatisés.