Bewertung:

Das Buch bietet einen umfassenden Überblick über Data Science und dient sowohl als Einführung als auch als praktischer Leitfaden für alle, die sich für diesen Bereich interessieren. Es enthält Einblicke von Branchenexperten und bietet eine Mischung aus Theorie und praktischen Anwendungen. Kritik gibt es jedoch für schlecht aufbereitete Code-Beispiele und das Fehlen detaillierter praktischer Schritte für absolute Anfänger.
Vorteile:⬤ Schöne Präsentation mit ausgezeichneten Referenzen
⬤ großartige Einführung in die Datenwissenschaft
⬤ in einem informellen, ansprechenden Stil geschrieben
⬤ enthält Beispiele aus der Praxis und Einblicke von Datenwissenschaftlern
⬤ deckt eine breite Palette von Themen ab
⬤ gute Balance zwischen Theorie und praktischer Anwendung.
⬤ Code-Beispiele sind schlecht aufbereitet und können problematisch sein
⬤ nicht umfassend für Anfänger ohne Vorkenntnisse
⬤ einige Leser finden es zu informell mit übermäßigen Hintergrundinformationen
⬤ es fehlt eine tiefgreifende technische Untersuchung
⬤ von einigen eher als eine lockere Unterhaltung als ein praktischer Leitfaden empfunden.
(basierend auf 89 Leserbewertungen)
Doing Data Science
Jetzt, da den Menschen bewusst ist, dass Daten den Unterschied bei einer Wahl oder einem Geschäftsmodell ausmachen können, gewinnt der Beruf des Datenwissenschaftlers an Bedeutung. Aber wie kann man in einem weitreichenden, interdisziplinären Bereich arbeiten, der so von einem Hype umwölkt ist? Dieses aufschlussreiche Buch, das auf dem Kurs "Einführung in die Datenwissenschaft" der Columbia University basiert, sagt Ihnen, was Sie wissen müssen.
In vielen dieser kapitellangen Vorlesungen stellen Datenwissenschaftler aus Unternehmen wie Google, Microsoft und eBay neue Algorithmen, Methoden und Modelle vor, indem sie Fallstudien und den von ihnen verwendeten Code präsentieren. Wenn Sie mit linearer Algebra, Wahrscheinlichkeitsrechnung und Statistik vertraut sind und über Programmiererfahrung verfügen, ist dieses Buch eine ideale Einführung in die Datenwissenschaft.
Die Themen umfassen:
⬤ Statistische Inferenz, explorative Datenanalyse und der datenwissenschaftliche Prozess.
⬤ Algorithmen.
⬤ Spamfilter, Naive Bayes und Datenverarbeitung.
⬤ Logistische Regression.
⬤ Finanzielle Modellierung.
⬤ Empfehlungsmaschinen und Kausalität.
⬤ Datenvisualisierung.
⬤ Soziale Netzwerke und Datenjournalismus.
⬤ Datentechnik, MapReduce, Pregel und Hadoop.
Doing Data Science ist eine Zusammenarbeit zwischen der Kursleiterin Rachel Schutt, Senior VP of Data Science bei News Corp, und der Data-Science-Beraterin Cathy O'Neil, einer leitenden Datenwissenschaftlerin bei Johnson Research Labs, die den Kurs besucht und darüber gebloggt hat.