Outils avancés – Python

Analyse
Data Science
Open Source
Intra-entreprise
Présentiel
Distanciel
Anglais
Français

Objectifs

  • Approfondir les outils permettant de représenter et manipuler des données complexes, utiliser efficacement la librairie pandas, importer des sources de données (CSV, JSON, XML, SQL), réaliser un modèle de régression linéaire simple ou multiple avec la librairie statmodels, perfectionner ses connaissances de matplotlib et savoir utiliser seaborn ou plotly

Prérequis :

Moyens pédagogiques et d’encadrement :

  • Séances avec le formateur, Support pédagogiques format numérique, alternance entre théorique et pratique, cas concrets.

Dispositif de suivi et d’évaluation des acquis :

  • Mise en pratique et exercices, Appréciation de la formation à chaud

Résultats & compétences attendus à l’issue de la formation :

  • À l’issue de cette formation, le participant doit être en mesure d’importer voire de fusionner des sources structurées ou non structurées de données, d’appliquer des traitements avancés sur les données quantitatives et qualitatives et de construire des graphiques statiques ou dynamiques élaborés.

 

 

Programme de la formation

JOUR 1 

  • Les traitements avancés des données :
    • La librairie numpy :
      • les fonctions avancées (views, slices)
      • l’interface avec scipy
    • La librairie pandas :
      • L’importation de sources de données externes,
      • L’agrégation de données,
      • Le reshaping,
      • L’indexation,
      • La fusion de sources de données
    • La librairie statmodels :
      • La régression simple et multiple,
      • Les tests des coefficients de régression,
      • Le diagnostic du modèle,
      • La prédiction ponctuelle et par intervalle
    • Le traitement des chaînes de caractères, regex
    • Le traitement des dates et gestion des séries chronologiques

JOUR 2

  • Les générateurs, itertools, lazy evaluation
  • L’interface base de données (SQL, NoSQL)
  • Le package Seaborn : les fonctionnalités graphiques avancées (graphiques en trellis, distributions statistiques, heatmap)

 

Durée
14 heures
Niveau
Intermédiaire
Public
Personne souhaitant découvrir les outils avancés Python
Participants
8 personnes maximum
Nous contacter pour un devis personnalisé.

Vous recherchez des informations sur une formation ?

Vous souhaitez mettre en place une session de formation sur mesure ?

Contactez notre équipe pédagogique !

Stata
Rapide, précis et facile à utiliser, le logiciel Stata est la référence pour le traitement et l'analyse de données statistiques et de data science. Il répond à tous vos besoins en matière de science des données : manipulation des données, visualisation, statistiques et rapports automatisés.