Bewertung:

Das Buch ist ein umfassender Leitfaden für fortgeschrittene R-Benutzer, die Big Data-Analysen verstehen wollen. Es deckt wesentliche Konzepte, Werkzeuge und Methoden ab und bietet gleichzeitig praktische Einblicke. Einige Benutzer fanden es jedoch aufgrund veralteter Referenzen und Installationsproblemen mit R-Paketen frustrierend.
Vorteile:⬤ Gründliche Erklärungen von Big-Data-Konzepten und -Werkzeugen
⬤ Ausführliche Behandlung von R-Programmierfunktionen
⬤ Gut strukturiert sowohl für grundlegende als auch für fortgeschrittene Themen
⬤ Enthält interessante Fakten und historische Zusammenhänge
⬤ Sorgfältig illustrierte Beispiele, die das Verständnis verbessern
⬤ Sehr empfehlenswert für diejenigen, die ihre Data-Science-Kenntnisse erweitern.
⬤ Einige Verweise auf R-Pakete sind veraltet und mit der neuesten RStudio-Version nicht verfügbar
⬤ das Herunterladen von Daten von der Website des Verlags kann umständlich sein
⬤ aufgrund der technischen Tiefe möglicherweise nicht für die Lektüre während des Pendelns geeignet.
(basierend auf 9 Leserbewertungen)
Big Data Analytics with R: Leverage R Programming to uncover hidden patterns in your Big Data
Nutzen Sie R, um verborgene Muster in Ihren Big Data aufzudecken Über dieses Buch Führen Sie Berechnungsanalysen mit Big Data durch, um aussagekräftige Ergebnisse zu generieren Verschaffen Sie sich praktische Kenntnisse der Programmiersprache R, während Sie auf Big-Data-Plattformen wie Hadoop, Spark, H2O und SQL/NoSQL-Datenbanken arbeiten, Entdecken Sie schnelle, streamingfähige und skalierbare Datenanalysen mit den modernsten Technologien auf dem Markt Für wen dieses Buch gedacht ist Dieses Buch richtet sich an Datenanalysten, Wissenschaftler, Dateningenieure, Statistiker und Forscher, die R in ihre aktuellen oder zukünftigen Big-Data-Workflows integrieren möchten. Es wird davon ausgegangen, dass die Leser eine gewisse Erfahrung in der Datenanalyse und ein Verständnis für das Datenmanagement und die algorithmische Verarbeitung großer Datenmengen haben, ihnen jedoch möglicherweise spezifische Kenntnisse in Bezug auf R fehlen. Was Sie lernen werden Lernen Sie den aktuellen Stand der Big-Data-Verarbeitung mit der Programmiersprache R und ihre leistungsstarken statistischen Fähigkeiten kennen Setzen Sie Big-Data-Analyseplattformen mit ausgewählten Big-Data-Tools, die von R unterstützt werden, auf kostengünstige und zeitsparende Weise ein Wenden Sie die Sprache R auf reale Big-Data-Probleme auf einem Hadoop-Cluster mit mehreren Knoten an, z. B.
Untersuchung der Kompatibilität von R mit Hadoop, Spark, SQL- und NoSQL-Datenbanken sowie der H2O-Plattform Im Detail Big-Data-Analytik ist der Prozess der Untersuchung großer und komplexer Datensätze, die oft die Rechenkapazitäten übersteigen. R ist eine führende Programmiersprache der Datenwissenschaft, die über leistungsstarke Funktionen verfügt, um alle Probleme im Zusammenhang mit der Verarbeitung von Big Data zu bewältigen. Das Buch beginnt mit einer kurzen Einführung in die Big-Data-Welt und ihre aktuellen Industriestandards. Es wird eine Einführung in die Sprache R gegeben und ihre Entwicklung, Struktur, Anwendungen in der realen Welt und ihre Unzulänglichkeiten vorgestellt. Anschließend werden die wichtigsten R-Funktionen zur Datenverwaltung und -transformation überarbeitet. Der Leser erhält eine Einführung in Cloud-basierte Big-Data-Lösungen (z. B. Amazon EC2-Instanzen und Amazon RDS, Microsoft Azure und seine HDInsight-Cluster) und erhält eine Anleitung zur Konnektivität von R mit relationalen und nicht-relationalen Datenbanken wie MongoDB und HBase usw. Darüber hinaus werden Big Data-Tools wie das Apache Hadoop-Ökosystem, HDFS und MapReduce-Frameworks einbezogen. Auch andere R-kompatible Tools wie Apache Spark, seine Bibliothek für maschinelles Lernen Spark MLlib sowie H2O werden behandelt. Stil und Ansatz Dieses Buch dient als praktischer Leitfaden für die Bewältigung von Big-Data-Problemen mit der Programmiersprache R und ihrer statistischen Umgebung.
Jeder Abschnitt des Buches zeigt Ihnen in prägnanten und leicht nachvollziehbaren Schritten, wie Sie große Datensätze verarbeiten, umwandeln und analysieren können.".