Initiation à R pour les analyses statistiques de base avec l’aide des IA Génératives (Débutant)

Intelligence Artificielle Générative
Data Science
Open Source
Publication
Statistiques théoriques et appliquées
Intra-entreprise
Inter-entreprise
Distanciel
Présentiel
Français

Objectifs

  • Découvrir les fondamentaux de R et des outils d’IA génératives.
  •  Acquérir les bases des analyses statistiques descriptives et les appliquer à des jeux de
    données concrets.
  • Apprendre à automatiser des tâches courantes en R grâce aux IA génératives.
  • Maîtriser la création de visualisations simples et la présentation de données.
  • S’initier aux concepts de régressions simples et de tests d’hypothèses.
  • Générer des workflows et des rapports automatisés avec R Markdown.

Prérequis :

  • Une formation en statistiques de bases
  • Affinité pour le codage
  • Aisance avec les outils informatiques, disposer d’une connexion Internet

Moyens pédagogiques et d’encadrement :

  • Séances guidées par le formateur
  • Supports numériques interactifs
  • Ateliers pratiques sur des cas concrets
  • Utilisation d’une IA pour assister l’apprentissage

Dispositif de suivi et d’évaluation des acquis :

  • Exercices pratiques et études de cas
  • QCM et tests d’évaluation à chaud
  • Feedback individuel sur les exercices

Programme de la formation

Demi-journée 1 : Initiation aux IA génératives et leur application en analyse statistique

1. Introduction aux IA génératives

  • Définition et principes fondamentaux
  • Fonctionnement des modèles d’IA génératives
  • Forces et limites des IA génératives dans le traitement des données

2. Comment les IA génératives peuvent simplifier l’apprentissage des outils statistiques

3. Cas d’usage pratique pour débuter

  • Générer des exemples de données fictives pour illustrer des concepts
    statistiques
  • Proposer des explications simplifiées pour des notions de base (moyenne, écart-type, etc.)
  • Structurer une approche pas-à-pas pour une analyse statistique simple

 

Demi-journée 2 : Premiers pas avec R

1. Installation et prise en main de l’interface RStudio.

2. Premiers scripts : découverte des principaux types d’objets dans R

3. Introduction aux packages essentiels : dplyr, tidyr, ggplot2

4. Exploration d’un jeu de données simple.

 

Demi-journée 3 : Valoriser et visualiser ses données efficacement

1. Analyses descriptives : moyennes, médianes, écarts-types, fréquences.

2. Création de visualisations (histogrammes, boxplots, graphiques en barres).

3. Étude de cas : analyse et visualisation d’un jeu de données réel.

4. Introduction à l’automatisation : utilisation d’une IA pour générer des scripts de
visualisation simple.

 

Demi-journée 4 : Introduction aux régressions et tests d’hypothèses

1. Régressions linéaires simples : concepts et mise en œuvre.

2. Initiation aux tests d’hypothèses.

3. Atelier pratique sur des jeux de données simulés ou réels.

 

Demi-journée 5 : Automatisation des analyses avec R et les IA génératives

1. Prompt engineering pour automatiser des analyses avec R

  • Rédaction de prompts simples pour générer du code R.
  • Automatisation des étapes clés : chargement, nettoyage, analyse et visualisation
    des données.

2. Exemple pratique : création d’un workflow automatisé avec R et une IA générative

  • Charger un fichier de données.
  • Résumer les données et produire des visualisations simples.
  • Générer un rapport automatisé (HTML ou PDF) à l’aide de R Markdown
Durée
17 heures
Niveau
Débutant
Public
Professionnels, étudiants, chercheurs débutants ou personnes en reconversion professionnelle souhaitant s’initier à l’analyse de données avec R et les outils d’IA génératives.
Participants
8 personnes maximum

Formateur

Salima
Docteur en économie de l'Université Paris 1 Panthéon-Sorbonne, Salima a coeur d'accompagner nos clients autour des formations logiciels mais aussi métiers.
Sessions inter-entreprise 2025 - [sur 1 journée entière et 3 demi-journées prévues en distanciel] en français :

- 31 mars [09h00/12h30 – 13h30/17h00]
- 01 Avril [14h/17h30]
- 02 et 03 Avril [09h00/12h30]

- 19 Mai [09h00/12h30 – 13h30/17h00]
- 20-22 et 23 Mai [9h00/12h30]

1750 EUR HT/personne.

Intra-entreprise : nous contacter pour un devis personnalisé.
Prochaine session : 
31 mars 2025

Vous recherchez des informations sur une formation ?

Vous souhaitez mettre en place une session de formation sur mesure ?

Contactez notre équipe pédagogique !

Stata
Rapide, précis et facile à utiliser, le logiciel Stata est la référence pour le traitement et l'analyse de données statistiques et de data science. Il répond à tous vos besoins en matière de science des données : manipulation des données, visualisation, statistiques et rapports automatisés.