Bewertung:

Das Buch ist als umfassende Ressource zum Erlernen und Verwenden von Apache Airflow sehr zu empfehlen, da es sowohl grundlegende als auch fortgeschrittene Themen effektiv abdeckt. Die Struktur des Buches ermöglicht es dem Leser, die Grundlagen schnell zu erfassen, während es gleichzeitig vertiefende Informationen für erfahrene Praktiker bietet. Es wurde jedoch angemerkt, dass das Thema Sicherheit erst in einem späteren Abschnitt behandelt wird, was einige Leser als störend empfinden.
Vorteile:Detaillierte Erklärungen, Best Practices enthalten, anpassbare Code-Beispiele, deckt sowohl Grundlagen als auch fortgeschrittene Themen ab, gut geschrieben und strukturiert, ausgezeichnet sowohl für Einsteiger als auch für erfahrene Benutzer, enthält praktische Rezepte und realistische Beispiele, dient als hervorragendes Nachschlagewerk.
Nachteile:Sicherheitsthemen werden erst spät im Buch behandelt (Seite 322), einige Leser haben das Gefühl, dass unmittelbare praktische Tipps für Anwendungen am Arbeitsplatz fehlen.
(basierend auf 12 Leserbewertungen)
Data Pipelines with Apache Airflow
In Data Pipelines with Apache Airflow lernen Sie, wie Sie effektive Datenpipelines erstellen und pflegen.
Zusammenfassung
Eine erfolgreiche Pipeline bewegt Daten effizient, minimiert Pausen und Blockaden zwischen den Aufgaben und hält jeden Prozess entlang des Weges betriebsbereit. Apache Airflow bietet eine einzige anpassbare Umgebung für den Aufbau und die Verwaltung von Datenpipelines und macht damit ein Sammelsurium von Tools, Snowflake-Code und selbst entwickelten Prozessen überflüssig. Anhand von realen Szenarien und Beispielen lernen Sie in Data Pipelines with Apache Airflow, wie Sie Datenpipelines vereinfachen und automatisieren, den betrieblichen Aufwand reduzieren und alle Technologien in Ihrem Stack reibungslos integrieren können.
Der Kauf des gedruckten Buches beinhaltet ein kostenloses eBook im PDF-, Kindle- und ePub-Format von Manning Publications.
Über die Technologie
Datenpipelines verwalten den Datenfluss von der anfänglichen Erfassung über die Konsolidierung, Bereinigung, Analyse, Visualisierung und mehr. Apache Airflow bietet eine einzige Plattform, mit der Sie Ihre Pipelines entwerfen, implementieren, überwachen und pflegen können. Die benutzerfreundliche Oberfläche, die Plug-and-Play-Optionen und die flexible Python-Skripterstellung machen Airflow zur perfekten Lösung für jede Datenverwaltungsaufgabe.
Über das Buch
Data Pipelines with Apache Airflow zeigt Ihnen, wie Sie effektive Datenpipelines erstellen und pflegen. Sie werden die häufigsten Verwendungsmuster erkunden, einschließlich der Aggregation mehrerer Datenquellen, der Verbindung zu und von Data Lakes und der Cloud-Bereitstellung. Dieses praktische Handbuch, das zum Teil als Referenz und zum Teil als Tutorial dient, deckt jeden Aspekt der gerichteten azyklischen Graphen (DAGs) ab, die Airflow antreiben, und zeigt, wie Sie sie an die Anforderungen Ihrer Pipeline anpassen können.
Was ist drin?
Erstellen, Testen und Bereitstellen von Airflow-Pipelines als DAGs.
Automatisieren Sie das Verschieben und Umwandeln von Daten.
Analysieren Sie historische Datensätze mit Backfilling.
Entwickeln Sie benutzerdefinierte Komponenten.
Einrichten von Airflow in Produktionsumgebungen.
(Über den Leser)
Für DevOps, Dateningenieure, Ingenieure für maschinelles Lernen und Sysadmins mit mittleren Python-Kenntnissen.
Über den Autor
Bas Harenslak und Julian de Ruiter sind Dateningenieure mit umfangreicher Erfahrung im Einsatz von Airflow zur Entwicklung von Pipelines für große Unternehmen. Bas ist auch ein Airflow Committer.
Inhaltsverzeichnis
TEIL 1 - ERSTE SCHRITTE.
1 Treffen Sie Apache Airflow.
2 Anatomie einer Airflow-DAG.
3 Zeitplanung in Airflow.
4 Schablonieren von Aufgaben unter Verwendung des Airflow-Kontextes.
5 Definieren von Abhängigkeiten zwischen Aufgaben.
TEIL 2 - ÜBER DIE GRUNDLAGEN HINAUS.
6 Auslösen von Workflows.
7 Kommunikation mit externen Systemen.
8 Erstellen von benutzerdefinierten Komponenten.
9 Testen.
10 Ausführen von Aufgaben in Containern.
TEIL 3 - AIRFLOW IN DER PRAXIS.
11 Bewährte Praktiken.
12 Betrieb von Airflow in der Produktion.
13 Sichern von Airflow.
14 Projekt: Der schnellste Weg nach New York City.
TEIL 4 - IN DEN WOLKEN.
15 Airflow in den Wolken.
16 Airflow auf AWS.
17 Airflow auf Azure.
18 Airflow in GCP.