Formation Spark pour développeurs

Taux de satisfaction :

8.5/10

Taux de réussite

Nombre de participants 2024 :

Formation Spark pour développeurs

Cette formation a pour objectif de vous fournir l’ensemble des connaissances et compétences nécessaires pour utiliser Apache Spark dans vos projets de Data Engineering au quotidien. Elle vous donnera les fondamentaux théoriques nécessaires pour comprendre son fonctionnement interne et sa philosophie, et vous permettra de développer une expertise hands’on sur ses principaux concepts et cas d’utilisation, allant de l’ingestion de données au déploiement.

Intra entreprise HT

9000€

Inter entreprises HT

1500€

nous contacter

2 jours

7 participants

chez Hymaïa

s'inscrire

*finançable par l'OPCO En savoir plus

Objectifs

Expliquer l'architecture et les concepts fondamentaux de Spark
Identifier les cas d'usage appropriés pour l'utilisation de Spark
Manipuler les RDDs (Resilient Distributed Datasets) et comprendre leurs opérations
Utiliser les DataFrames et DataSets Spark pour le traitement de données structurées
Optimiser les performances des jobs Spark (partitionnement, caching, tuning)
Implémenter des pipelines de traitement de données avec Spark SQL
Déboguer et monitorer des applications Spark

Public cible

Data Engineers
Software Engineers
ML Engineers
Data Scientists

Prérequis

Une connaissance initiale de la programmation en Python ou Scala est recommandée.
Quelques intuitions sur le Big Data de manière générale est aussi un plus, mais n’est pas obligatoire.

Programme détaillé

Télécharger

L’apparition du Big Data

Croissance verticale et horizontale
Les systèmes distribués
Map Reduce

Les concepts de base de Spark

Partitionning
Lineage
Optimisation
Parallélisation

Ma première application Spark

Batch, Streaming et ML
Créer une application Spark
Comment traiter la donnée : RDD, Dataset, DataFrame
Le format parquet
Les systèmes de stockage

Transformer sa donnée (les bases)

Opérations Map
Opérations Reduce
Les fonctions sur colonne
L’objet colonne

Tester son application Spark

Tests unitaires
Tests d’intégrations
Préparer ses jeux de données

Fonctionnement interne de Spark

Le cache
Les jointures
Le shuffle
La mémoire

Les opérations de transformations de données avancées

UDF
UDAF
Window functions

Déployer un job Spark

Choisir son environnement
Spark-submit
Configurer son job Spark

Ce qu’ils en disent…

Modalités

Modalités d'évaluation

Un questionnaire d'auto-évaluation est envoyé aux participants avant et après la formation pour mesurer leur progression.

Pendant la formation :

Les acquis sont évalués tout au long de la formation par les formateurs sous forme de Quizz en ligne, questions réponses ou tour de table.

Le participant se verra délivrer une attestation de fin de formation à l’issue de la session

Organisation

Cette formation est en groupe de 6 à 12 personne en présentielle en intra-entreprise ou inter-entreprise en fonction du format souhaité par le commanditaire.

‍

Modalités d'accès

Les sessions peuvent être programmées jusqu’ à 7 jours avant la date retenue, sous condition d’un formateur disponible et de la réception de la convention signée avant la session pour des groupes de 6 à 12 personnes .

Formateur(s)

Franck Cussac

Senior Data Engineer

Photos

No items found.

Financer votre formation par un OPCO

En tant qu'organisme certifié Qualopi, les formations que nous vous proposons sont finançables par l'OPCO. Trouvez l'OPCO dont vous dépendez ici

Contacts

Contact pédagogique et technique

training@hymaia.com

Contact PSH

adaptation@hymaia.com

Accès

Formation Data Engineering sur AWS

📅

nous contacter

⏱️

2 jours

👯

10 participants

💶

1500€ HT/pers ou 9000€HT en Intra

en détail

DataFrames PySpark & Pandas : très similaires à l'usage, mais un fonctionnement interne très différent

📅

11/2/2025

⏱️

10 mn

🌶️

experts

lire

Poetry: enfin l’outil pour charmer Python ?

📅

11/2/2025

⏱️

10 mn

🌶️

experts

lire

Optimiser son job Spark

📅

11/2/2025

⏱️

10 mn

🌶️

confirmés

lire

Nous vous accompagnons dans vos projets Data & IA

De la stratégie à la mise en oeuvre en passant par l'acculturation de vos équipes, nous vous aidons à chaque étape dans la réalisation de vos projets. Découvrez nos offres en détail pour trouver la solution qui correspond à vos besoins.

Les prochains événements Hymaïa

Hymanight - Data & AI Product Management Paris meetup #2

📅

4/10/2025

en détail

Formation Spark pour développeurs

Objectifs

Public cible

Prérequis

Programme détaillé

L’apparition du Big Data

Les concepts de base de Spark

Ma première application Spark

Transformer sa donnée (les bases)

Tester son application Spark

Fonctionnement interne de Spark

Les opérations de transformations de données avancées

Déployer un job Spark

Ce qu’ils en disent…

Modalités

Modalités d'évaluation

Modalités d'accès

Formateur(s)

Franck Cussac

Photos

Financer votre formation par un OPCO

Contacts

Les formations Data & IA

Formation Data Engineering sur AWS

Les articles du blog

DataFrames PySpark & Pandas : très similaires à l'usage, mais un fonctionnement interne très différent

Poetry: enfin l’outil pour charmer Python ?

Optimiser son job Spark

Nous vous accompagnons dans vos projets Data & IA

Les prochains événements Hymaïa

Hymanight - Data & AI Product Management Paris meetup #2