Bewertung:

Derzeit gibt es keine Leserbewertungen. Die Bewertung basiert auf 5 Stimmen.
Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark Sql, Structured Streaming and Spark Machine Learning Library
Entwickeln Sie Anwendungen für die Big-Data-Landschaft mit Spark und Hadoop. Dieses Buch erklärt auch die Rolle von Spark bei der Entwicklung skalierbarer maschineller Lern- und Analyseanwendungen mit Cloud-Technologien. Beginning Apache Spark 2 gibt Ihnen eine Einführung in Apache Spark und zeigt Ihnen, wie Sie damit arbeiten können.
Dabei lernen Sie belastbare verteilte Datensätze (RDDs) kennen, verwenden Spark SQL für strukturierte Daten, lernen die Stream-Verarbeitung und erstellen Echtzeitanwendungen mit Spark Structured Streaming. Darüber hinaus lernen Sie die Grundlagen von Spark ML für maschinelles Lernen und vieles mehr.
Nach der Lektüre dieses Buches verfügen Sie über die Grundlagen, um Apache Spark zu beherrschen und zu wissen, wann und wie Sie es für Ihre Big-Data-Anwendungen einsetzen können.
(Was Sie lernen werden)
⬤ Verstehen Sie die einheitliche Datenverarbeitungsplattform Spark.
⬤ Wie man Spark in Spark Shell oder Databricks ausführt.
⬤ RDDs verwenden und manipulieren.
⬤ Umgang mit strukturierten Daten mit Spark SQL durch seine Operationen und erweiterten Funktionen.
⬤ Erstellen von Echtzeitanwendungen mit Spark Structured Streaming.
⬤ Entwickeln Sie intelligente Anwendungen mit der Spark Machine Learning-Bibliothek.
Für wen ist dieses Buch gedacht?
Programmierer und Entwickler, die in den Bereichen Big Data, Hadoop und Java tätig sind, aber keine Erfahrung mit der Apache Spark-Plattform haben.