Moderne Datenarchitekturen mit Python: Ein praktischer Leitfaden zur Erstellung und Bereitstellung von Datenpipelines, Data Warehouses und Data Lakes mit Python

Bewertung:   (4,7 von 5)

Moderne Datenarchitekturen mit Python: Ein praktischer Leitfaden zur Erstellung und Bereitstellung von Datenpipelines, Data Warehouses und Data Lakes mit Python (Brian Lipp)

Leserbewertungen

Zusammenfassung:

Das Buch bietet eine aufschlussreiche und gründliche Untersuchung moderner Datenarchitekturen, wobei der Schwerpunkt auf Delta-Architekturen, Data Governance und dem Aufbau von Datenprodukten innerhalb eines Data Mesh Frameworks liegt. Es betont auch die Bedeutung von Datenvisualisierungen und praktischen Anwendungen in realen Szenarien mit Python.

Vorteile:

Umfassende Abdeckung moderner Datenarchitekturen, praktische Beispiele in Python, aufschlussreiche Erforschung von Data Governance und Integrität, Schwerpunkt auf MLOps und Integration von Datenvisualisierungen, zugänglich für Ingenieure, Analysten und Manager.

Nachteile:

Könnte für Anfänger ohne Vorkenntnisse von Datenarchitekturen zu technisch sein, einige Leser könnten die Tiefe als überwältigend empfinden, und es werden möglicherweise nicht alle Themen im Detail behandelt.

(basierend auf 5 Leserbewertungen)

Originaltitel:

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Inhalt des Buches:

Aufbau skalierbarer und zuverlässiger Datenökosysteme mit Data Mesh, Databricks Spark und Kafka

Hauptmerkmale:

⬤ Entwickeln Sie moderne Datenkenntnisse, die in neuen Technologien verwendet werden.

⬤ Erlernen Sie pragmatische Design-Methoden wie Data Mesh und Data Lakehouses.

⬤ Gewinnen Sie ein tieferes Verständnis für Data Governance.

⬤ Der Kauf des gedruckten Buches oder des Kindle-Buches beinhaltet ein kostenloses PDF-EBook.

Buchbeschreibung:

In Modern Data Architectures with Python lernen Sie, wie Sie Ihre maschinellen Lern- und Data-Science-Arbeitsabläufe nahtlos in Ihre offenen Datenplattformen einbinden können. Sie lernen, wie Sie Ihre Daten nehmen und mit Hilfe bewährter Techniken, einschließlich der Medaillon-Architektur und Delta Lake, offene Lakehouses erstellen, die mit jeder Technologie funktionieren.

Dieses Buch beginnt mit den Grundlagen und hilft Ihnen, Pipelines auf Databricks, einer offenen Datenplattform, mit SQL und Python zu erstellen. Sie erhalten ein Verständnis für in Python geschriebene Notebooks und Anwendungen, die Standard-Software-Engineering-Tools wie Git, Pre-Commit, Jenkins und Github verwenden. Als Nächstes befassen Sie sich mit der Streaming- und Batch-basierten Datenverarbeitung mit Apache Spark und Confluent Kafka. Im weiteren Verlauf lernen Sie, wie Sie Ihre Ressourcen mithilfe von Infrastructure as Code bereitstellen und Ihre Arbeitsabläufe und Codeentwicklung automatisieren können. Da die Fähigkeit jeder Datenplattform, mit KI und ML zu arbeiten, eine wichtige Komponente ist, werden Sie auch die Grundlagen von ML erforschen und lernen, wie man mit modernen MLOps-Tools arbeitet. Schließlich werden Sie praktische Erfahrungen mit Apache Spark sammeln, einer der wichtigsten Datentechnologien auf dem heutigen Markt.

Am Ende dieses Buches werden Sie eine Fülle von praktischen und theoretischen Kenntnissen gesammelt haben, um Ihre Datenökosysteme aufzubauen, zu verwalten, zu orchestrieren und zu gestalten.

Was Sie lernen werden:

⬤ Verstehen Sie Datenmuster, einschließlich der Delta-Architektur.

⬤ Entdecken Sie, wie Sie die Leistung mit Spark-Interna steigern können.

⬤ Erfahren Sie, wie Sie kritische Datendiagramme entwerfen können.

⬤ Erforschen Sie MLOps mit Tools wie AutoML und MLflow.

⬤ Machen Sie sich mit der Erstellung von Datenprodukten in einem Datennetz vertraut.

⬤ Entdecken Sie Data Governance und schaffen Sie Vertrauen in Ihre Daten.

⬤ Führen Sie Datenvisualisierungen und Dashboards in Ihre Datenpraxis ein.

Für wen dieses Buch gedacht ist:

Dieses Buch richtet sich an Entwickler, Analytiker und Manager, die ein Datenökosystem in ihrem Unternehmen weiterentwickeln möchten. Grundlegende Python-Kenntnisse und Erfahrung im Umgang mit Daten sind zwar keine Voraussetzung, aber sie helfen Ihnen, die Beispiele zu lesen und ihnen zu folgen.

Weitere Daten des Buches:

ISBN:9781801070492
Autor:
Verlag:
Sprache:Englisch
Einband:Taschenbuch

Kauf:

Derzeit verfügbar, auf Lager.

Ich kaufe es!

Weitere Bücher des Autors:

Der Data Wrangling Workshop, zweite Ausgabe: Erstellen Sie Ihre eigenen verwertbaren Erkenntnisse...
Ein Einsteigerhandbuch zur Vereinfachung von...
Der Data Wrangling Workshop, zweite Ausgabe: Erstellen Sie Ihre eigenen verwertbaren Erkenntnisse mit Daten aus verschiedenen Rohdatenquellen - The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources
Moderne Datenarchitekturen mit Python: Ein praktischer Leitfaden zur Erstellung und Bereitstellung...
Aufbau skalierbarer und zuverlässiger...
Moderne Datenarchitekturen mit Python: Ein praktischer Leitfaden zur Erstellung und Bereitstellung von Datenpipelines, Data Warehouses und Data Lakes mit Python - Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Die Werke des Autors wurden von folgenden Verlagen veröffentlicht:

© Book1 Group - Alle Rechte vorbehalten.
Der Inhalt dieser Seite darf weder teilweise noch vollständig ohne schriftliche Genehmigung des Eigentümers kopiert oder verwendet werden.
Letzte Änderung: 2024.11.13 22:11 (GMT)