Chap3 Spark
Chap3 Spark
Chap3 Spark
CHAP 3 : Spark
Modèle d’exécution
Problème de performance:
soit les données sont très grandes
soit besoin de faire des opérations itératives
Spark Vs. Hadoop
Modèle d’exécution
Spark Vs. Hadoop
Modèle de programmation:
Hadoop propose seulement 2 opérations: Map et
Reduce
Spark propose un modèle plus souple: Map, filter,
groupBy, sort, join, reduce, count, reduceByKey,
groupByKey, take, …
Spark : Caractéristiques
Le cluster manager :
responsable de l'allocation des ressources, surtout
dans le cas ou plusieurs applications concurrentes
sont exécutées sur le cluster Spark.
Spark : Le Fonctionnement