Description
Préparez-vous pour le cours complet Apache Spark avec Python. Familiarisez-vous avec les détails du cours et les sujets conçus pour vous aider à réussir.
Apache Spark™ est un moteur multilingue permettant d’exécuter l’ingénierie des données, la science des données et l’apprentissage automatique sur des machines ou des clusters à nœud unique. Ce cours est conçu pour les étudiants, les professionnels et les personnes occupant des postes non techniques qui souhaitent développer un pipeline et une application d’ingénierie de données à l’aide d’Apache Spark. Les managers et les architectes, qui ne sont pas directement impliqués dans le processus de mise en œuvre de Spark, constituent un autre groupe de personnes. Pourtant, ils collaborent avec ceux qui mettent réellement Apache Spark en pratique.
Apprenez Apache Spark avec des ateliers pratiques
Le cours Spark Programming in Python est un cours pratique conçu pour vous enseigner les concepts de base et intermédiaires de Spark via une démonstration pratique au travers de laboratoires pratiques. Le cours comprend environ 22 laboratoires partant des bases et évoluant vers des niveaux élevés en termes de complexité.
Qui devrait suivre ce cours ?
Le cours est destiné aux développeurs de logiciels qui souhaitent créer un pipeline et une application d’ingénierie de données basés sur Apache Spark. Les architectes de données et les ingénieurs de données chargés de créer l’architecture centrée sur les données de l’entreprise peuvent également en bénéficier. Les managers et les architectes, qui ne sont pas directement impliqués dans le processus de mise en œuvre de Spark, constituent un autre groupe de personnes. Pourtant, ils collaborent avec ceux qui mettent réellement Apache Spark en pratique.
Exigences
● Connaissances de base en programmation utilisant le langage Python
● Une machine Windows/Mac/Linux 64 bits récente avec 8 Go de RAM
À qui s’adresse ce cours:
● Ingénieurs logiciels et architectes désireux de concevoir et de développer des projets d’ingénierie Big Data à l’aide d’Apache Spark.
● Programmeurs et développeurs qui aspirent à évoluer et à apprendre l’ingénierie des données à l’aide d’Apache Spark.
Ce que vous apprendrez
● Connaissance de base d’Apache Spark
● Installation et configuration d’Apache Spark sur la machine locale ainsi que sur le cloud
● Comment utiliser Spar-shell
● Installation du cluster multi-nœuds sur Google Cloud Platform
● Utilisation de clusters dans les notebooks
● Création et configuration d’une session Spark
● Création de la configuration de build du projet Spark
● Configuration des journaux d’application Spark
● Comment charger différents formats de fichiers dans une trame de données
● Transformations de dataframes et d’ensembles de données
● Agrégations en étincelle
● Jointures de dataframe Spark
Y a-t-il des exigences ou des prérequis en matière de cours ?
● Connaissances de base en programmation utilisant le langage Python
● Une machine Windows/Mac/Linux 64 bits récente avec 8 Go de RAM
À qui s’adresse ce cours:
● Ingénieurs logiciels et architectes désireux de concevoir et de développer des projets d’ingénierie Big Data à l’aide d’Apache Spark.
● Programmeurs et développeurs qui aspirent à évoluer et à apprendre l’ingénierie des données à l’aide d’Apache Spark.
À qui s’adresse ce cours:
- Ingénieurs logiciels et architectes désireux de concevoir et de développer des projets d’ingénierie Big Data à l’aide d’Apache Spark.
- Programmeurs et développeurs qui aspirent à grandir et à apprendre l’ingénierie des données à l’aide d’Apache Spark
Exigences
- Connaissances de base en programmation utilisant le langage Python
- Une machine Windows/Mac/Linux 64 bits récente avec 8 Go de RAM
Dernière mise à jour 7/2023
Liens de téléchargement
Téléchargement direct
Programmation Spark en Python pour les débutants – Apache Spark 3.zip (840,7 Mo) | Miroir