Outils avancés – R

Analyse
Data Science
Open Source
Inter-entreprise
Intra-entreprise
Présentiel
Distanciel
Français
Anglais

Objectifs

  • Approfondir les outils permettant de représenter et manipuler des données complexes, découvrir les packages dplyr et data.table pour optimiser les traitements de données, importer des sources de données (CSV, JSON, XML, SQL), réaliser un modèle de régression linéaire simple ou multiple avec le package {stats}, perfectionner ses connaissances des graphiques et savoir utiliser ggplot2 ou plotly.
  • À l’issue de cette formation, le participant doit être en mesure d’importer voire de fusionner des sources structurées ou non structurées de données, d’appliquer des traitements avancés sur les données quantitatives et qualitatives et de construire des graphiques statiques ou dynamiques élaborés.a

Pré-requis

Moyens pédagogiques et d’encadrement

Plateforme digitale de formation dédiée (LMS)
Séances avec le formateur, Support pédagogiques format numérique, alternance entre théorique et pratique, cas concrets.

Dispositif de suivi et d’évaluation des acquis

Mise en pratique et exercices, Appréciation de la formation à chaud

Résultats & compétences attendus à l’issue de la formation

À l’issue de cette formation, le participant doit être en mesure d’importer voire de fusionner des sources structurées ou non structurées de données, d’appliquer des traitements avancés sur les données quantitatives et qualitatives et de construire des graphiques statiques ou dynamiques élaborés.

Programme de la formation

JOUR 1

  • L’ importation de sources de données externes avec les packages {base}, {foreign} et {haven}
  • Les outils pour optimiser les traitements de données, {data.table} et {dplyr} :
    • La manipulation avancée des data frames,
    • L’aggrégation de données,
    • Le reshaping,
    • L’indexation,
    • La fusion de sources de données
  • La réalisation d’un modèle de régression linéaire simple ou multiple avec le package {stats} :
    • La régression simple et multiple,
    • Les tests des coefficients de régression,
    • Le diagnostic du modèle,
    • La prédiction ponctuelle et par intervalle

JOUR 2

  • Le traitement des chaînes de caractères, regex
  • Le traitement des dates et gestion des séries chronologiques
  • L’approche fonctionnelle et lazy evaluation
  •  L’interface base de données (SQL, NoSQL)
  • Les fonctionnalités graphiques avancées avec le package {ggplot2} :
    • Les graphiques en trellis,
    • Les distributions statistiques,
    • Représentation de données avec le heatmap
  • Construction de graphiques statiques ou dynamiques élaborés interactifs avec les packages {ggvis} et {plotly}
Durée
14 heures
Niveau
Intermédiaire
Public
Personne souhaitant découvrir les outils avancés R
Participants
8 personnes maximum
Nous contacter pour un devis personnalisé

Vous recherchez des informations sur une formation ?

Vous souhaitez mettre en place une session de formation sur mesure ?

Contactez notre équipe pédagogique !

Stata
Stata est un logiciel complet et intégré qui répond à tous vos besoins en matière de science des données : manipulation des données, visualisation, statistiques et rapports automatisés.