Outils avancés – R

Analyse
Data Science
Open Source
Inter-entreprise
Intra-entreprise
Présentiel
Distanciel
Français
Anglais

Objectifs

  • Approfondir les outils permettant de représenter et manipuler des données complexes, découvrir les packages dplyr et data.table pour optimiser les traitements de données, importer des sources de données (CSV, JSON, XML, SQL), réaliser un modèle de régression linéaire simple ou multiple avec le package {stats}, perfectionner ses connaissances des graphiques et savoir utiliser ggplot2 ou plotly.
  • À l’issue de cette formation, le participant doit être en mesure d’importer voire de fusionner des sources structurées ou non structurées de données, d’appliquer des traitements avancés sur les données quantitatives et qualitatives et de construire des graphiques statiques ou dynamiques élaborés.a

Pré-requis :

Moyens pédagogiques et d’encadrement :

  • Séances avec le formateur
  • Support pédagogiques format numérique
  • Alternance entre théorique et pratique, cas concrets.

Dispositif de suivi et d’évaluation des acquis :

  • Mise en pratique et exercices
  • Appréciation de la formation à chaud

Résultats & compétences attendus à l’issue de la formation :

À l’issue de cette formation, le participant doit être en mesure d’importer voire de fusionner des sources structurées ou non structurées de données, d’appliquer des traitements avancés sur les données quantitatives et qualitatives et de construire des graphiques statiques ou dynamiques élaborés.

Programme de la formation

JOUR 1

  • L’ importation de sources de données externes avec les packages {base}, {foreign} et {haven}
  • Les outils pour optimiser les traitements de données, {data.table} et {dplyr} :
    • La manipulation avancée des data frames,
    • L’aggrégation de données,
    • Le reshaping,
    • L’indexation,
    • La fusion de sources de données
  • La réalisation d’un modèle de régression linéaire simple ou multiple avec le package {stats} :
    • La régression simple et multiple,
    • Les tests des coefficients de régression,
    • Le diagnostic du modèle,
    • La prédiction ponctuelle et par intervalle

JOUR 2

  • Le traitement des chaînes de caractères, regex
  • Le traitement des dates et gestion des séries chronologiques
  • L’approche fonctionnelle et lazy evaluation
  •  L’interface base de données (SQL, NoSQL)
  • Les fonctionnalités graphiques avancées avec le package {ggplot2} :
    • Les graphiques en trellis,
    • Les distributions statistiques,
    • Représentation de données avec le heatmap
  • Construction de graphiques statiques ou dynamiques élaborés interactifs avec les packages {ggvis} et {plotly}
Durée
14 heures
Niveau
Intermédiaire
Public
Personne souhaitant découvrir les outils avancés R
Participants
8 personnes maximum
Nous contacter pour un devis personnalisé

Vous recherchez des informations sur une formation ?

Vous souhaitez mettre en place une session de formation sur mesure ?

Contactez notre équipe pédagogique !

ChemDraw
ChemDraw s’est imposé depuis longtemps comme la référence des logiciels de dessin de structures moléculaires. Afin de proposer à chaque utilisateur l’outil adapté à ses besoins, le logiciel existe maintenant en trois versions : ChemDraw Prime, ChemDraw Professional et Signals ChemDraw. Cette déclinaison permet de satisfaire les besoins de tous les chercheurs, étudiants et professeurs impliqués dans la chimie et les domaines connexes. ChemDraw Professional pour Mac et Signals ChemDraw intègrent maintenant un cahier de laboratoire électronique accessible via le cloud, permettant de collaborer facilement et sans contraintes.