Bewertung:

Das Buch bietet eine detaillierte Erkundung der Lambda-Architektur, ihrer Komponenten und ihrer Anwendung bei der Verarbeitung von Big Data. Während viele Rezensionen die Theorie und die Klarheit des Inhalts loben, gibt es Probleme mit der physischen Bindung des Buches und einige Bedenken hinsichtlich der praktischen Umsetzung.
Vorteile:⬤ Gut organisierte und detaillierte Erklärung der Lambda-Architektur und Big-Data-Konzepte.
⬤ Klare theoretische Einsichten bis hinunter auf die Byte-Ebene.
⬤ Hilfreich für das Verständnis der Komplexität von Big Data.
⬤ Sowohl für Anfänger als auch für erfahrene Entwickler geeignet; geht effektiv auf Probleme der realen Welt ein.
⬤ Bietet einen tiefen Einblick in die Batch-Schicht und Pseudo-Modelle.
⬤ Schlechte physische Bindung und Qualität der Zusammenstellung
⬤ Einige Exemplare fallen auseinander.
⬤ Begrenzte praktische Lösungen oder Aktualisierungen für die besprochene Architektur, so dass einige Inhalte veraltet erscheinen.
⬤ Einige Leser finden, dass es dem Ansatz an anwendbaren Implementierungsdetails für aktuelle Frameworks mangelt.
⬤ Nicht alle Leser verstehen die Konzepte leicht
⬤ einige fühlten sich verwirrt.
(basierend auf 60 Leserbewertungen)
Big Data: Principles and Best Practices of Scalable Realtime Data Systems
Zusammenfassung
Big Data zeigt Ihnen, wie Sie Big-Data-Systeme mit einer Architektur aufbauen, die die Vorteile von Cluster-Hardware zusammen mit neuen Tools nutzt, die speziell für die Erfassung und Analyse von Daten im Webmaßstab entwickelt wurden. Es beschreibt einen skalierbaren, leicht verständlichen Ansatz für Big-Data-Systeme, die von einem kleinen Team aufgebaut und betrieben werden können. Anhand eines realistischen Beispiels führt dieses Buch den Leser durch die Theorie von Big-Data-Systemen, ihre praktische Umsetzung und ihren Einsatz und Betrieb nach dem Aufbau.
Der Kauf des gedruckten Buches beinhaltet ein kostenloses eBook im PDF-, Kindle- und ePub-Format von Manning Publications.
Über das Buch
Web-Anwendungen wie soziale Netzwerke, Echtzeit-Analysen oder E-Commerce-Websites verarbeiten große Datenmengen, deren Volumen und Geschwindigkeit die Grenzen herkömmlicher Datenbanksysteme überschreiten. Diese Anwendungen erfordern Architekturen, die auf Maschinenclustern aufbauen, um Daten beliebiger Größe und Geschwindigkeit zu speichern und zu verarbeiten. Glücklicherweise schließen sich Größe und Einfachheit nicht gegenseitig aus.
Big Data zeigt Ihnen, wie Sie Big-Data-Systeme mit einer Architektur aufbauen, die speziell für die Erfassung und Analyse von Daten im Webmaßstab entwickelt wurde. Dieses Buch stellt die Lambda-Architektur vor, einen skalierbaren, leicht verständlichen Ansatz, der von einem kleinen Team aufgebaut und betrieben werden kann. Sie lernen die Theorie von Big-Data-Systemen kennen und erfahren, wie Sie diese in der Praxis umsetzen können. Sie lernen nicht nur einen allgemeinen Rahmen für die Verarbeitung von Big Data kennen, sondern auch spezifische Technologien wie Hadoop, Storm und NoSQL-Datenbanken.
Für dieses Buch sind keine Vorkenntnisse in der Analyse großer Datenmengen oder in NoSQL-Tools erforderlich. Vertrautheit mit traditionellen Datenbanken ist jedoch hilfreich.
Inhalt
⬤ Einführung in Big-Data-Systeme.
⬤ Echtzeit-Verarbeitung von Daten im Web-Maßstab.
⬤ Werkzeuge wie Hadoop, Cassandra und Storm.
⬤ Erweiterungen zu traditionellen Datenbankkenntnissen.
Über die Autoren
Nathan Marz ist der Schöpfer von Apache Storm und der Begründer der Lambda-Architektur für Big-Data-Systeme. James Warren ist ein Analytik-Architekt mit einem Hintergrund in maschinellem Lernen und wissenschaftlichem Rechnen.
Inhaltsverzeichnis
⬤ Ein neues Paradigma für Big Data.
TEIL 1 BATCH-SCHICHT.
⬤ Datenmodell für Big Data.
⬤ Datenmodell für Big Data: Illustration.
⬤ Datenspeicherung auf der Batch-Schicht.
⬤ Datenspeicherung auf der Chargenebene: Abbildung.
⬤ Batch-Schicht.
⬤ Batch-Schicht: Abbildung.
⬤ Ein Beispiel für eine Batch-Schicht: Architektur und Algorithmen.
⬤ Ein Beispiel für eine Batch-Schicht: Implementierung.
TEIL 2 SERVING-SCHICHT.
⬤ Serviceschicht.
⬤ Serviceschicht: Illustration.
TEIL 3 GESCHWINDIGKEITSEBENE.
⬤ Echtzeitansichten.
⬤ Echtzeit-Ansichten: Illustration.
⬤ Queuing und Stromverarbeitung.
⬤ Warteschlangen- und Stromverarbeitung: Illustration.
⬤ Micro-Batch-Stromverarbeitung.
⬤ Mikro-Stapelverarbeitung: Veranschaulichung.
⬤ Lambda-Architektur in der Tiefe.