Environnement de développement en Data Science

Data Science
Ingénierie et développement
Open Source
Intra-entreprise
Présentiel
Distanciel
Français
Anglais

Objectifs

  • Comprendre l’écosystème de la data science
  • Connaître les outils afférents à la réalisation d’un projet en data science.

Prérequis :

  • Aisance avec les outils informatiques
  • Disposer d’une connexion Internet

Moyens pédagogiques et d’encadrement :

  • Séances avec le formateur
  • Support pédagogiques format numérique
  • Alternance entre théorique et pratique.

Dispositif de suivi et d’évaluation des acquis :

  • Mise en pratique et exercices
  • Appréciation de la formation à chaud.

Résultats & compétences attendus à l’issue de la formation :

  • À l’issue de cette formation, le participant aura une idée précise de ce que représente la data science, les outils disponibles pour mettre en oeuvre des projets de data science, quel langage de programmation choisir et comment organiser son travail.

Programme de la formation

JOUR 1

  • L’environnement unix, l’interaction avec un shell, les outils open source (sed, awk, grep, jq, csvkit, etc.), R et Python, SQL et NoSQL
  • Le contrôle de révision et travail collaboratif avec Git
  • La méthodologie de gestion d’un projet en data science
  • Les principes de base du génie logiciel et bonnes pratiques

JOUR 2

  • Le recueil et traitement de l’information (plans d’expérience et essais cliniques, enquête et sondages, données web, open data)
  • L’architecture distribuées et base de données, map-reduce, big data, Apache Spark
Durée
14 heures
Niveau
Débutant
Public
Toute personne souhaitant découvrir l’écosystème de la data science.
Participants
8 personnes maximum
Nous consulter pour un devis personnalisé.

Vous recherchez des informations sur une formation ?

Vous souhaitez mettre en place une session de formation sur mesure ?

Contactez notre équipe pédagogique !

Stata
Rapide, précis et facile à utiliser, le logiciel Stata est la référence pour le traitement et l'analyse de données statistiques et de data science. Il répond à tous vos besoins en matière de science des données : manipulation des données, visualisation, statistiques et rapports automatisés.