2.+syllabus Data Engineer
2.+syllabus Data Engineer
2.+syllabus Data Engineer
Data Engineer
Notre histoire
Leader français de la formation en Data Science, DataScientest offre
un apprentissage d’excellence orienté emploi pour professionnels et
particuliers.
2
DataScientest
en chiffres
3 000 99 %
taux de
alumnis complétion
+ de 30groupes
du CAC40 formés
2 000 h 94 %
contenu taux de
spécialisé satisfaction
3
Nos partenaires
DataScientest c’est également de nombreux partenaires académiques. Notre
plateforme est notamment utilisée par les Masters Data Science de plusieurs
écoles de commerce et d’ingénieur. Voici nos différents partenariats :
Nos formateurs
L’équipe pédagogique de DataScientest est formée de professeurs
internes à l’organisme. Ils se consacrent entièrement à l’enseignement
et à la recherche pour nos différentes formations et cursus experts.
Tous nos professeurs sont en permanence présents pour vous. Ils
ont créé et actualisent l’ensemble de nos parcours. Ils vous accom-
pagnent par visio-conférence et sur notre plateforme. Ils travaillent
pour que vous soyez accompagnés tout au long de votre formation.
Forts d’un parcours académiques d’excellence et d’expériences profes-
sionnelles variées, ce sont les experts en Data Science qui vous permet-
tront d’intégrer l’équipe Data dans le secteur qui vous intéresse (Banque
& Assurance, Industrie, Finance, Médical et bien d’autres encore).
Charles S
Responsable Académique
Thomas B
Responsable formation Data Scientist
Après son cursus à l’École des Mines de Paris, Thomas a vite rejoint
les rangs de DataScientest. Il est en charge de nos cursus experts
NLP et computer vision. Ces quatre dernières années, Thomas a
formé plus de 400 apprenants à la Data Science
5
L’équipe
Paul D
Responsable formation Data Engineer
Diplomé de Centrale-Supelec et du Master in Data Science & Business
Analytics en double diplôme Centrale Supelec - ESSEC, Paul est
spécialisé dans le Big Data. Il est à la tête de notre formation Data
Engineer et du cursus expert Machine Learning Engineer.
Raphaël K
Responsable formation Data Analyst
Daniel
Pendant votre formation, vous progressez sur notre plateforme. Cependant, vous
ne serez jamais seul, Daniel est là pour vous. L’ensemble de nos professeurs se
relaient pour vous répondre en live à l’ensemble de vos questions par Slack. Avec
un accompagnement tous les jours de la semaine, de 9h00 à 18h00, vous êtes
guidés tout au long de votre parcours.
6
Notre pédagogie
Format hybride
DataScientest offre une formation 100%
en distanciel en format hybride :
15 % du temps, vous êtes accompagnés par
votre professeur et votre cohorte pour des
15% sessions de visioconférence. Pour les 85 %
masterclass
restants, vous travaillez sur notre plateforme
d’enseignement et vous êtes guidés via slack
Cours en distanciel
par nos data scientists. Ce format vous donne
la flexibilité nécessaire pour vous organiser
85%
de coaching individuel
à votre manière. Nous suivons aussi votre
progression et vous accompagnons pour
assurer la bonne complétion de votre formation.
MASTERCLASS
7
Notre pédagogie
C’est aussi un projet fortement apprécié par les entreprises. Il confirme vos
compétences et connaissances acquises à l’issue de la formation de Data Engineer.
Vous pourrez alors justifier d’un projet en data science abouti pendant vos entretiens.
En Bootcamp ou en continu
1
Le Bootcamp
Formez-vous rapidement,
en suivant un programme intensif
de 11 semaines.
Durée
11 semaines
Rythme
Temps plein (35h)
2
La formation
continue
Flexible, c’est le format adapté
à l’exercice d’une profession
en parallèle.
Durée
9 mois
Rythme
8 à 10h / Semaine
15% heures fixes, 85% libres
Le parcours formation du
Data Engineer
10
Le cursus
Programmation
Durée : 40h
2
PYTHON & PYTHON
ORIENTÉ OBJET
Maîtrise des variables et des types
Présentation des divers opérateurs et de leurs
1 applications
LES COMPÉTENCES
ACQUISES À L’ISSUE
Maîtriser le système d’exploitation Comprendre et utiliser la
Linux programmation orientée objet
Apprendre à utiliser un Terminal Créer des scripts complexes avec
Python
Créer et gérer des exécutables Bash
Maîtriser le langage Python et toutes
ses applications
Bases de données
Durée : 50h
4 NEO4J
1 SQL Introduction aux bases de données
Introduction aux bases de données orientées graphes
relationnelles
Mise en place d’un premier graphe
Présentation de SQL Alchemy et ap- Initiation au langage de requête
plications Cypher
Initiation aux bases du langage SQL Chargement de données dans
Neo4J
Approndissement de SQL et de ses
applications Utilisation d’un client Python
pour Neo4J
2 MONGODB
LES COMPÉTENCES
Introduction aux bases de données
NoSQL (bases de données orientées
ACQUISES À L’ISSUE
documents, colonnes, graphes)
Savoir choisir un système de gestion de
Présentation de MongoDB bases de données en fonction du cas
d’utilisation
Familiarisation avec la syntaxe
des requêtes MongoDB Comprendre la notion de schémas et de
leur implémentation dans une base de
données relationnelles
Comprendre comment requêter un SGBDR
3 ELASTICSEARCH (système de gestion de base de données
Description d’un moteur de recherche relationnelles ) avec le langage SQL
Data Science
Durée : 50h
3
DATAVIZ
1 AVEC MATPLOTLIB
STATISTIQUES Présentation des différents
types de graphes :
Exploration des variables
numériques Graphiques en barres
(Barplots)
Exploration des variables
Nuages de points (Scatter
catégorielles
plots)
Étude des relations entre Histogrammes
les variables Boîtes à Moustaches (Box
Plots)
Camemberts (Pie Plots)
2
MACHINE LEARNING LES COMPÉTENCES
ACQUISES À L’ISSUE
Pré-traitement de données
Sélection et optimisation d’un Comprendre les bases des principaux
algorithme de Machine Learning algorithmes de Machine Learning
CI/CD 3
QUALITY
Durée : 25h
ASSURANCE
Découverte de la plateforme Github
pour le travail collaboratif sur Git
1 Présentation des fonctionnalités
GIT majeures de GitHub :
Fork
Introduction au système de Pull Request
gestion de version Git Issues
Initialisation d’un dépôt Git Partager ses modifications avec pull
et push
Présentation et approfondissement
des concepts git : Participation à l’amélioration de projet
Branches public (open source)
Tag
Présentation des principaux
Merge
workflows git
LES COMPÉTENCES
ACQUISES À L’ISSUE
2
GITHUB Maîtriser les outils de versionning
Travailler de manière collaborative et
Mise en place de tests unitaires
versionner les projets avec Git et GitHub
avec Pytest
Être capable de mettre en place des
Introduction aux Tests
tests unitaires
d’intégration et leurs fonctions
Appliquer des méthodes adaptées en
Présentation des avantages des
fonction des différentes problématiques
tests : gain de temps, lisibilité,
qualité et amélioration de code Vérifier le fonctionnement d’unités
de code indépendantes lors du
développement
1 2
ARCHITECTURE KAFKA
DE STREAMING
Prise en main de Spark Streaming
Gestion de flux de données en
pour le traitement de données
temps réel
temps réel
Conception d’une architecture Big
Présentation du mini-batch
Data hybride (batch et temps réel)
streaming nécessaire pour le
Mise en place d’une architecture fonctionnement de Spark Streaming
Lambda
3 LES COMPÉTENCES
SPARK STREAMING ACQUISES À L’ISSUE
Automatisation et Déploiement
Durée : 40h
2 AIRFLOW
Découverte des concepts d’Airflow :
1
APIs Présentation des principes de
l’orchestration et utilité
Introduction aux APIs et découverte Graphe orienté acycliques ou DAG
des architectures micro services (Directed Acyclic Graphs)
Présentation des différentes Opérateurs
méthodes HTTP et de leurs fonctions Gestion des tâches par le biais
Utilisation des librairies FastAPI d’Operators spécifiques
et Flask pour développer des API Monitoring des DAGs via l’interface
RESTful graphique d’Airflow
Documentation d’une API avec la
spécification OpenAPI
Gestion des erreurs et des
performances d’une API 4 KUBERNETES
Déployer et gérer des conteneurs
3 DOCKER
Présentation de la conteneurisation et
de son utilité par rapport à la virtualisation
LES COMPÉTENCES
ACQUISES À L’ISSUE
Initiation au fonctionnement de Docker
Manipulation des images et des Comprendre les APIs
conteneurs Apprendre à créer une Api avec Flask
Communication avec les conteneurs et FastApi
ÉTAPE 1
Après votre inscription sur le site, nous vous contactons
une première fois pour une présentation détaillée de
notre offre et une compréhension de votre parcours et
vos souhaits.
L’idée est d’aligner dès le départ vos attentes avec nos
formations .
ÉTAPE 2
Après avoir précisé votre projet de formation,
vous rentrez en communication avec notre équipe
admission. Vous abordez les questions financières
et administratives. Plusieurs modalités de
financement sont disponibles (CPF, aides de pôle
emploi ou encore l’OPCO de votre entreprise). Le
reste à charge peut être échelonné jusqu’à 12 fois
ÉTAPE 3
Une fois ce test passé, un membre de l’équipe d’admission
prend contact avec vous pour échanger sur votre résultat,
vos motivations, et la pertinence de votre projet.
La communauté alumni
Beta-test
Afin de gagner en connaissances data et d’assurer la veille technologique
même après la fin de la formation, tout alumni
a accès en avant-première à tout nouveau
module de formation.
Veille technologique
En parallèle, des newsletters élaborées par nos
data scientists sont régulièrement envoyées
et sont une source fiable d’informations
spécialisées en Data Science.
Communauté Alumni
Enfin, la communauté DataScientest ne cesse
de s’agrandir, et avec elle l’ensemble de ses alumnis. Pour garder le contact
et permettre aux anciens élèves de communiquer entre eux, DataScientest a
mis en place la communauté DatAlumni, un groupe qui partage et échange sur
divers thèmes autour de la Data Science. Vous serez invité à la rejoindre en
début de votre formation! Au programme : vieille technologique, opportunités
business, networking, événements (afterworks, salons, data challenges …).
Amir ABBASZADEH
Cofounder and CEO at Oilifina Consulting
Ayant une formation d’ ingénieur, Amir a commencé sa carrière en conseil en stratégie
chez McKinsey puis en M&A dans une banque d’investissement. Suite à une expérience
entrepreneuriale, il a senti un vrai besoin technique en traitement des données mais son profil
100% business restait un frein pour se lancer dans l’aventure.
"
Datascientest a complètement effacé et personne ne s’ennuie en plein milieu
cette inquiétude dans ma tête et m’a de cours. Le bonus de cette formation
permis de réaliser mon projet. Pour moi, est la disponibilité incroyable des
ce qui distingue Datascientest des autres experts pour nous aider. Aujourd’hui
c’est avant tout le contenu parfaitement j’ai créé mon entreprise grâce à cette
opérationnel ainsi que le méthode formation et nous sommes 8 dont
d’apprentissage live! 3 datascientists :) "
Ce qui donne toujours envie de continuer
Alina Vornicu
Responsable du Pôle Data de l’Inspection Générale de LCL
Après un master Économétrie et Statistiques Appliquées à l’Université d’Orléans, Alina a intégré
en 2010 Crédit Agricole Consumer Finance en tant que Chargée d’études statistiques dans
l’équipe Prévention du Risque et innovation puis LCL en 2015, en tant qu’Ingénieure d’études
statistiques et actuarielles dans l’équipe Data de l’Inspection Générale qu’elle a eu l’honneur de
manager depuis novembre 2019.
Stefania Di Tommaso
Data Scientist at IsCool entertainment
" À la recherche d’un nouveau travail potentiel. Chose encore plus importante,
ainsi que d’un nouveau défi intellectuel, j’ai eu la possibilité de connaître des
j’ai commencé ma formation de data professionnels du secteur, travaillant
scientist chez DataScientest. En 3 mois, dans les milieux des plus différents.
grâce à un suivi constant, j’ai appris Cette formation fut une véritable
les bases en programmation sur R fenêtre ouverte sur un monde qui
et Python. J’ai également découvert m’était inconnu et dont maintenant je
plusieurs algorithmes de ML et leur fais partie !"
Caroline Uge
Data Scientist chez Back Market
J’ai assisté au bootcamp DataScientest data scientist. Cette formation m’a permis
il y a un peu plus de deux ans. A cette d’acquérir les connaissances techniques
époque, j’avais quitté un emploi de et mathématiques nécessaires pour
gestion de projet qui ne me convenait débuter en data science. Par la suite, j’ai
pas. Je m’intéressais beaucoup à l’analyse intégré une entreprise de conseil en data
de données que j’avais pu légèrement science au sein de laquelle j’ai pu mettre en
pratiquer. Je cherchais de ce fait un pratique mes acquis et affiner mon projet
poste de data analyst, dans l’optique professionnel. Aujourd’hui, je travaille
d’évoluer par la suite en data scientist. chez Back Market : j’exerce un métier
Malheureusement, mes entretiens que j’aime dans une entreprise en accord
n’aboutissaient pas par manque de avec mes valeurs. Ce bootcamp a donné
connaissances techniques. un gros coup de pouce à ma carrière et
Datascientest a été l’opportunité parfaite largement facilité ma reconversion, je le
pour monter en compétences et ainsi recommande chaudement !
prétendre directement à un poste de
Pour répondre à cette question, nous avons mené notre propre enquête auprès d’une
quarantaine d’entreprises partenaires.
En fonction du secteur et de l’entreprise le salaire d’un data engineer junior est de 45
119 € par an.
Après 4 ans d’expérience, ce salaire augmente considérablement et atteint 55 714
euros.
Si vous êtes inscrit chez Pôle Emploi, vous êtes potentiellement éligible à l’AIF.
Soit une aide allant jusqu’à 2000€. DataScientest est également éligible au CPF.
Enfin si vous êtes actuellement en entreprise, vous pouvez être éligible à une aide du
FNE ou toute l’année via l’OPCO.
Quoi qu’il en soit nos équipes sont là pour vous guider dans vos démarches
administratives d’inscription aux différentes aides de financement.
contact@datascientest.com
www.datascientest.com
+33 9 80 80 79 49
Contactez contact@datascientest.com