Daten-Pipelines mit Apache Airflow

Bewertung:   (4,5 von 5)

Daten-Pipelines mit Apache Airflow (P. Harenslak Bas)

Leserbewertungen

Zusammenfassung:

Das Buch ist als umfassende Ressource zum Erlernen und Verwenden von Apache Airflow sehr zu empfehlen, da es sowohl grundlegende als auch fortgeschrittene Themen effektiv abdeckt. Die Struktur des Buches ermöglicht es dem Leser, die Grundlagen schnell zu erfassen, während es gleichzeitig vertiefende Informationen für erfahrene Praktiker bietet. Es wurde jedoch angemerkt, dass das Thema Sicherheit erst in einem späteren Abschnitt behandelt wird, was einige Leser als störend empfinden.

Vorteile:

Detaillierte Erklärungen, Best Practices enthalten, anpassbare Code-Beispiele, deckt sowohl Grundlagen als auch fortgeschrittene Themen ab, gut geschrieben und strukturiert, ausgezeichnet sowohl für Einsteiger als auch für erfahrene Benutzer, enthält praktische Rezepte und realistische Beispiele, dient als hervorragendes Nachschlagewerk.

Nachteile:

Sicherheitsthemen werden erst spät im Buch behandelt (Seite 322), einige Leser haben das Gefühl, dass unmittelbare praktische Tipps für Anwendungen am Arbeitsplatz fehlen.

(basierend auf 12 Leserbewertungen)

Originaltitel:

Data Pipelines with Apache Airflow

Inhalt des Buches:

In Data Pipelines with Apache Airflow lernen Sie, wie Sie effektive Datenpipelines erstellen und pflegen.

Zusammenfassung

Eine erfolgreiche Pipeline bewegt Daten effizient, minimiert Pausen und Blockaden zwischen den Aufgaben und hält jeden Prozess entlang des Weges betriebsbereit. Apache Airflow bietet eine einzige anpassbare Umgebung für den Aufbau und die Verwaltung von Datenpipelines und macht damit ein Sammelsurium von Tools, Snowflake-Code und selbst entwickelten Prozessen überflüssig. Anhand von realen Szenarien und Beispielen lernen Sie in Data Pipelines with Apache Airflow, wie Sie Datenpipelines vereinfachen und automatisieren, den betrieblichen Aufwand reduzieren und alle Technologien in Ihrem Stack reibungslos integrieren können.

Der Kauf des gedruckten Buches beinhaltet ein kostenloses eBook im PDF-, Kindle- und ePub-Format von Manning Publications.

Über die Technologie

Datenpipelines verwalten den Datenfluss von der anfänglichen Erfassung über die Konsolidierung, Bereinigung, Analyse, Visualisierung und mehr. Apache Airflow bietet eine einzige Plattform, mit der Sie Ihre Pipelines entwerfen, implementieren, überwachen und pflegen können. Die benutzerfreundliche Oberfläche, die Plug-and-Play-Optionen und die flexible Python-Skripterstellung machen Airflow zur perfekten Lösung für jede Datenverwaltungsaufgabe.

Über das Buch

Data Pipelines with Apache Airflow zeigt Ihnen, wie Sie effektive Datenpipelines erstellen und pflegen. Sie werden die häufigsten Verwendungsmuster erkunden, einschließlich der Aggregation mehrerer Datenquellen, der Verbindung zu und von Data Lakes und der Cloud-Bereitstellung. Dieses praktische Handbuch, das zum Teil als Referenz und zum Teil als Tutorial dient, deckt jeden Aspekt der gerichteten azyklischen Graphen (DAGs) ab, die Airflow antreiben, und zeigt, wie Sie sie an die Anforderungen Ihrer Pipeline anpassen können.

Was ist drin?

Erstellen, Testen und Bereitstellen von Airflow-Pipelines als DAGs.

Automatisieren Sie das Verschieben und Umwandeln von Daten.

Analysieren Sie historische Datensätze mit Backfilling.

Entwickeln Sie benutzerdefinierte Komponenten.

Einrichten von Airflow in Produktionsumgebungen.

(Über den Leser)

Für DevOps, Dateningenieure, Ingenieure für maschinelles Lernen und Sysadmins mit mittleren Python-Kenntnissen.

Über den Autor

Bas Harenslak und Julian de Ruiter sind Dateningenieure mit umfangreicher Erfahrung im Einsatz von Airflow zur Entwicklung von Pipelines für große Unternehmen. Bas ist auch ein Airflow Committer.

Inhaltsverzeichnis

TEIL 1 - ERSTE SCHRITTE.

1 Treffen Sie Apache Airflow.

2 Anatomie einer Airflow-DAG.

3 Zeitplanung in Airflow.

4 Schablonieren von Aufgaben unter Verwendung des Airflow-Kontextes.

5 Definieren von Abhängigkeiten zwischen Aufgaben.

TEIL 2 - ÜBER DIE GRUNDLAGEN HINAUS.

6 Auslösen von Workflows.

7 Kommunikation mit externen Systemen.

8 Erstellen von benutzerdefinierten Komponenten.

9 Testen.

10 Ausführen von Aufgaben in Containern.

TEIL 3 - AIRFLOW IN DER PRAXIS.

11 Bewährte Praktiken.

12 Betrieb von Airflow in der Produktion.

13 Sichern von Airflow.

14 Projekt: Der schnellste Weg nach New York City.

TEIL 4 - IN DEN WOLKEN.

15 Airflow in den Wolken.

16 Airflow auf AWS.

17 Airflow auf Azure.

18 Airflow in GCP.

Weitere Daten des Buches:

ISBN:9781617296901
Autor:
Verlag:
Einband:Taschenbuch
Erscheinungsjahr:2021
Seitenzahl:480

Kauf:

Derzeit verfügbar, auf Lager.

Ich kaufe es!

Weitere Bücher des Autors:

Daten-Pipelines mit Apache Airflow - Data Pipelines with Apache Airflow
In Data Pipelines with Apache Airflow lernen Sie, wie Sie effektive Datenpipelines...
Daten-Pipelines mit Apache Airflow - Data Pipelines with Apache Airflow

Die Werke des Autors wurden von folgenden Verlagen veröffentlicht: