Datenwissenschaft mit Python und Dask

Bewertung:   (4,5 von 5)

Datenwissenschaft mit Python und Dask (Jesse Daniel)

Leserbewertungen

Zusammenfassung:

Das Buch dient als Einführung in Dask und seine Möglichkeiten, aber es hat gemischte Kritiken hinsichtlich seiner Zielgruppe und der Tiefe der Informationen. Es bietet zwar einen guten Überblick und Vergleiche zu Pandas, geht aber oft auf elementare Konzepte ein, die für die angesprochenen Leser nicht relevant sein könnten.

Vorteile:

Gute Einführung für Anfänger
starke Erklärungen der Datenstrukturen von Dask
effektiver Vergleich mit Pandas
wertvolle Ressource für das Verständnis von Data Science-Konzepten
klare Syntax und Anwendungsfälle.

Nachteile:

Zu grundlegend für fortgeschrittene Benutzer
enthält irrelevante elementare Konzepte
Layout und Struktur könnten verbessert werden
einige technische Probleme wurden festgestellt
der Inhalt ist möglicherweise zu detailliert für die beabsichtigte Zielgruppe.

(basierend auf 6 Leserbewertungen)

Originaltitel:

Data Science with Python and Dask

Inhalt des Buches:

Zusammenfassung

Dask ist ein natives paralleles Analysewerkzeug, das so konzipiert ist, dass es sich nahtlos in die von Ihnen bereits verwendeten Bibliotheken wie Pandas, NumPy und Scikit-Learn integrieren lässt. Mit Dask können Sie große Datensätze verarbeiten und mit den Tools arbeiten, die Sie bereits haben. Data Science with Python and Dask ist Ihr Leitfaden zur Nutzung von Dask für Ihre Datenprojekte, ohne dass Sie Ihre Arbeitsweise ändern müssen.

Der Kauf des gedruckten Buches beinhaltet ein kostenloses eBook im PDF-, Kindle- und ePub-Format von Manning Publications. Eine Anleitung zur Registrierung finden Sie im Inneren des gedruckten Buches.

Über die Technologie

Eine effiziente Datenpipeline ist entscheidend für den Erfolg eines Data-Science-Projekts. Dask ist eine flexible Bibliothek für parallele Berechnungen in Python, mit der sich auf einfache Weise intuitive Workflows für die Aufnahme und Analyse großer, verteilter Datensätze erstellen lassen. Dask bietet dynamische Aufgabenplanung und parallele Sammlungen, die die Funktionalität von NumPy, Pandas und Scikit-learn erweitern und es den Benutzern ermöglichen, ihren Code mit Leichtigkeit von einem einzelnen Laptop auf einen Cluster mit Hunderten von Rechnern zu skalieren.

Über das Buch

In Data Science mit Python und Dask lernen Sie, skalierbare Projekte zu erstellen, die große Datenmengen verarbeiten können. Nachdem Sie das Dask-Framework kennengelernt haben, werden Sie Daten in der NYC Parking Ticket-Datenbank analysieren und DataFrames verwenden, um Ihren Prozess zu rationalisieren. Anschließend erstellen Sie Modelle für maschinelles Lernen mit Dask-ML, erstellen interaktive Visualisierungen und bauen Cluster mit AWS und Docker auf.

Was ist drin?

⬤ Arbeiten mit großen, strukturierten und unstrukturierten Datensätzen.

⬤ Visualisierung mit Seaborn und Datashader.

⬤ Eigene Algorithmen implementieren.

⬤ Erstellung von verteilten Anwendungen mit Dask Distributed.

⬤ Paketieren und Bereitstellen von Dask-Anwendungen.

(Über den Reader)

Für Datenwissenschaftler und Entwickler mit Erfahrung im Umgang mit Python und dem PyData-Stack.

Über den Autor

Jesse Daniel ist ein erfahrener Python-Entwickler. Er lehrte Python für Data Science an der University of Denver und leitet ein Team von Datenwissenschaftlern bei einem Medientechnologieunternehmen in Denver.

Inhaltsverzeichnis

TEIL 1 - Die Bausteine des skalierbaren Rechnens.

⬤ Warum skalierbares Rechnen wichtig ist.

⬤ Einführung in Dask.

TEIL 2 - Arbeiten mit strukturierten Daten mit Dask DataFrames.

⬤ Einführung in Dask DataFrames.

⬤ Laden von Daten in DataFrames.

⬤ Bereinigen und Transformieren von DataFrames.

⬤ Zusammenfassen und Analysieren von DataFrames.

⬤ Visualisierung von DataFrames mit Seaborn.

⬤ Visualisierung von Standortdaten mit Datashader.

TEIL 3 - Erweitern und Bereitstellen von Dask.

⬤ Arbeiten mit Bags und Arrays.

⬤ Maschinelles Lernen mit Dask-ML.

⬤ Skalieren und Bereitstellen von Dask.

Weitere Daten des Buches:

ISBN:9781617295607
Autor:
Verlag:
Einband:Taschenbuch
Erscheinungsjahr:2019
Seitenzahl:296

Kauf:

Derzeit verfügbar, auf Lager.

Ich kaufe es!

Weitere Bücher des Autors:

Datenwissenschaft mit Python und Dask - Data Science with Python and Dask
Zusammenfassung Dask ist ein natives paralleles Analysewerkzeug, das so konzipiert...
Datenwissenschaft mit Python und Dask - Data Science with Python and Dask

Die Werke des Autors wurden von folgenden Verlagen veröffentlicht: