Bewertung:

Das Buch wird von einigen als unterhaltsame und praktische Einführung in Hadoop und Spark positiv bewertet, während andere kritisieren, dass es oberflächlich ist und kein vertieftes Wissen zu den Themen vermittelt.
Vorteile:⬤ Gut geschrieben
⬤ angenehm zu lesen
⬤ bietet eine gute Einführung in Hadoop/Spark
⬤ deckt praktische Anwendungsfälle in der Datenwissenschaft ab
⬤ geeignet für diejenigen mit einigen Vorkenntnissen.
⬤ Es fehlt an Tiefe und signifikanter Abdeckung von Hadoop/Spark
⬤ wird als zu oberflächlich und allgemein angesehen
⬤ irreführender Titel
⬤ teuer für den bereitgestellten Inhalt
⬤ nicht geeignet für Anfänger, die umfassendes Wissen suchen.
(basierend auf 8 Leserbewertungen)
Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale
Der vollständige Leitfaden zu Data Science mit Hadoop - für technische Fachleute, Geschäftsleute und Studenten
Die Nachfrage nach Fachleuten, die echte Data-Science-Probleme mit Hadoop und Spark lösen können, steigt rasant. Practical Data Science with Hadoop(R) and Spark ist Ihr kompletter Leitfaden, um genau das zu tun. Auf der Grundlage ihrer immensen Erfahrung mit Hadoop und Big Data haben drei führende Experten alles zusammengetragen, was Sie brauchen: Konzepte auf hohem Niveau, tiefgehende Techniken, reale Anwendungsfälle, praktische Anwendungen und praktische Anleitungen.
Die Autoren führen in die Grundlagen der Datenwissenschaft und das moderne Hadoop-Ökosystem ein und erläutern, wie sich Hadoop und Spark zu einer effektiven Plattform für die Lösung datenwissenschaftlicher Probleme in großem Maßstab entwickelt haben. Neben einer umfassenden Anwendungsabdeckung bieten die Autoren auch nützliche Anleitungen zu den wichtigen Schritten der Datenaufnahme, des Datenmangings und der Visualisierung.
Sobald die Grundlagen geschaffen sind, konzentrieren sich die Autoren auf spezifische Anwendungen, darunter maschinelles Lernen, prädiktive Modellierung für die Stimmungsanalyse, Clustering für die Dokumentenanalyse, Anomalieerkennung und die Verarbeitung natürlicher Sprache (NLP).
Dieser Leitfaden bietet eine solide technische Grundlage für diejenigen, die praktische Datenwissenschaft betreiben möchten, und enthält außerdem geschäftsorientierte Anleitungen für die Anwendung von Hadoop und Spark zur Optimierung des ROI von Datenwissenschaft-Initiativen.
Lernen Sie.
⬤ Was Datenwissenschaft ist, wie sie sich entwickelt hat und wie man eine Karriere in der Datenwissenschaft plant.
⬤ Wie Datenvolumen, -vielfalt und -geschwindigkeit die Anwendungsfälle der Datenwissenschaft beeinflussen.
⬤ Hadoop und sein Ökosystem, einschließlich HDFS, MapReduce, YARN und Spark.
⬤ Datenimport mit Hive und Spark.
⬤ Datenqualität, Vorverarbeitung, Vorbereitung und Modellierung.
⬤ Visualisierung: Aufzeigen von Erkenntnissen aus großen Datensätzen.
⬤ Maschinelles Lernen: Klassifizierung, Regression, Clustering und Anomalieerkennung.
⬤ Algorithmen und Hadoop-Tools für prädiktive Modellierung.
⬤ Clusteranalyse und Ähnlichkeitsfunktionen.
⬤ Erkennung von Anomalien im großen Maßstab.
⬤ NLP: Anwendung der Datenwissenschaft auf die menschliche Sprache.