Environnement de développement en Data Science

Data Science
Ingénierie et développement
Open Source
Intra-entreprise
Présentiel
Distanciel
Français
Anglais

Objectifs

Comprendre l’écosystème de la data science et connaître les outils afférents à la réalisation d’un projet en data science.

Programme de la formation

 

Prérequis

Aisance avec les outils informatiques, disposer d’une connexion Internet

Programme détaillé de la formation

JOUR 1

  • L’environnement unix, l’interaction avec un shell, les outils open source (sed, awk, grep, jq, csvkit, etc.), R et Python, SQL et NoSQL
  • Le contrôle de révision et travail collaboratif avec Git
  • La méthodologie de gestion d’un projet en data science
  • Les principes de base du génie logiciel et bonnes pratiques

JOUR 2

  • Le recueil et traitement de l’information (plans d’expérience et essais cliniques, enquête et sondages, données web, open data)
  • L’architecture distribuées et base de données, map-reduce, big data, Apache Spark

 

Moyens pédagogiques et d’encadrement :

  • Plateforme digitale de formation dédiée (LMS).
  • Séances avec le formateur, Support pédagogiques format numérique, alternance entre théorique et pratique.

Dispositif de suivi et d’évaluation des acquis:

Mise en pratique et exercices, Appréciation de la formation à chaud.

Résultats & compétences attendus à l’issue de la formation :

À l’issue de cette formation, le participant aura une idée précise de ce que représente la data science, les outils disponibles pour mettre en oeuvre des projets de data science, quel langage de programmation choisir et comment organiser son travail.

Mis à jour le : 13/04/2021

Durée
14 heures
Niveau
Débutant
Public
Toute personne souhaitant découvrir l’écosystème de la data science.
Participants
8 personnes maximum
Nous consulter pour un devis personnalisé.

Vous recherchez des informations sur une formation ?

Vous souhaitez mettre en place une session de formation sur mesure ?

Contactez notre équipe pédagogique !

Stata
Stata est un logiciel complet et intégré qui répond à tous vos besoins en matière de science des données : manipulation des données, visualisation, statistiques et rapports automatisés.