Bewertung:

Das Buch bietet einen umfassenden Leitfaden für die Implementierung von Machine Learning Operations (MLOps) mit Metaflow und kombiniert theoretische Erkenntnisse mit praktischen Beispielen, die auf den Aufbau skalierbarer Data Science Workflows abzielen.
Vorteile:⬤ Praktische Beispiele und Projekte, die die MLOps-Infrastruktur mit Metaflow effektiv vermitteln.
⬤ Klare Erklärungen von Konzepten, die auch für Personen ohne MLOps-Hintergrund verständlich sind.
⬤ Ein ausgewogenes Verhältnis zwischen Theorie und Praxis, mit Schwerpunkt auf praktischen Anwendungen und realen Anwendungsfällen.
⬤ Humorvolle Elemente und ansprechende Illustrationen verbessern das Leseerlebnis.
⬤ Bietet wertvolle Einblicke über die offizielle Metaflow-Dokumentation hinaus.
⬤ Das Buch konzentriert sich in erster Linie auf Metaflow, was seine Anwendbarkeit für diejenigen einschränken kann, die eine breitere Perspektive auf MLOps suchen, ohne Metaflow zu verwenden.
⬤ Einige Leser benötigen möglicherweise zusätzliche Ressourcen außerhalb des Buches, um die Metaflow-Infrastruktur einzurichten, da einige Einstellungen nur in der externen Dokumentation behandelt werden.
(basierend auf 7 Leserbewertungen)
Effective Data Science Infrastructure: How to Make Data Scientists Productive
Vereinfachen Sie die Data-Science-Infrastruktur, um Datenwissenschaftlern einen effizienten Weg vom Prototyp zur Produktion zu ermöglichen.
In Effective Data Science Infrastructure erfahren Sie, wie Sie:
eine produktivitätssteigernde Data-Science-Infrastruktur zu entwerfen.
Computing und Orchestrierung in der Cloud zu handhaben.
Maschinelles Lernen in der Produktion einsetzen.
Leistung und Ergebnisse überwachen und verwalten.
Cloud-basierte Tools zu einer kohärenten Data-Science-Umgebung zu kombinieren.
Entwicklung reproduzierbarer Data-Science-Projekte mit Metaflow, Conda und Docker.
Architektur komplexer Anwendungen für mehrere Teams und große Datensätze.
Anpassen und Erweitern der Data-Science-Infrastruktur.
Effektive Infrastruktur für Datenwissenschaft: How to make data scientists more productive" ist ein praktischer Leitfaden für den Aufbau einer Infrastruktur für Data Science- und Machine Learning-Anwendungen. Es zeigt die Prozesse auf, die bei Netflix und anderen datengesteuerten Unternehmen zur Verwaltung ihrer hochmodernen Dateninfrastruktur eingesetzt werden. Sie lernen skalierbare Techniken zur Datenspeicherung, Berechnung, Experimentverfolgung und Orchestrierung kennen, die für Unternehmen jeder Art und Größe relevant sind. Sie erfahren, wie Sie Ihre Datenwissenschaftler mit Ihrer vorhandenen Cloud-Infrastruktur, einer Reihe von Open-Source-Software und idiomatischem Python produktiver machen können.
Der Autor spendet den Erlös aus diesem Buch an Wohltätigkeitsorganisationen, die Frauen und unterrepräsentierte Gruppen in der Datenwissenschaft unterstützen.
Der Kauf des gedruckten Buches beinhaltet ein kostenloses eBook im PDF-, Kindle- und ePub-Format von Manning Publications.
Über die Technologie.
Das Wachstum von Data-Science-Projekten vom Prototyp bis zur Produktion erfordert eine zuverlässige Infrastruktur. Mit den leistungsstarken neuen Techniken und Werkzeugen in diesem Buch können Sie einen Infrastruktur-Stack aufbauen, der mit jeder Organisation skaliert, von Startups bis zu den größten Unternehmen.
Über das Buch.
Effective Data Science Infrastructure zeigt Ihnen, wie Sie Datenpipelines und Projektworkflows aufbauen, die Data Scientists und ihre Projekte optimal unterstützen. Basierend auf modernsten Tools und Konzepten, die den Datenbetrieb von Netflix antreiben, stellt dieses Buch einen anpassbaren, cloudbasierten Ansatz für die Modellentwicklung und MLOps vor, den Sie leicht an die spezifischen Anforderungen Ihres Unternehmens anpassen können. Wenn Sie diese praktischen Prozesse einführen, werden Ihre Teams bessere und schnellere Ergebnisse bei der Anwendung von Data Science und maschinellem Lernen auf eine breite Palette von Geschäftsproblemen erzielen.
Was ist drin?
Verwaltung von Datenverarbeitung und Orchestrierung in der Cloud.
Kombinieren Sie Cloud-basierte Tools zu einer kohärenten Data-Science-Umgebung.
Entwickeln Sie reproduzierbare Data-Science-Projekte mit Metaflow, AWS und dem Python-Datenökosystem.
Architektur komplexer Anwendungen, die große Datensätze und Modelle sowie ein Team von Datenwissenschaftlern erfordern.
Über den Leser.
Für Infrastrukturingenieure und technisch orientierte Datenwissenschaftler, die mit Python vertraut sind.
Über den Autor.
Bei Netflix hat Ville Tuulos Metaflow, ein Full-Stack-Framework für Data Science, entwickelt und aufgebaut. Derzeit ist er CEO eines Startups, das sich auf die Infrastruktur für Datenwissenschaftler konzentriert.
Inhaltsverzeichnis.
1 Einführung in die Infrastruktur der Datenwissenschaft.
2 Die Toolchain der Datenwissenschaft.
3 Einführung in Metaflow.
4 Skalierung mit der Berechnungsschicht.
5 Skalierbarkeit und Leistung in der Praxis.
6 In die Produktion gehen.
7 Verarbeitung von Daten.
8 Verwendung und Betrieb von Modellen.
9 Maschinelles Lernen mit dem gesamten Stack.