Bewertung:

Das Buch wird für seine Klarheit und Nützlichkeit bei der Datenbereinigung anerkannt, wobei der Schwerpunkt auf beispielbasiertem Lernen liegt. Allerdings wird es wegen seines hohen Preises, der fehlenden Online-Unterstützung für Datensätze und kleinerer Probleme mit der Druckqualität kritisiert.
Vorteile:Leicht zu lesen, gutes Nachschlagewerk für Datenbereinigungskurse, sehr detailliert, beispielorientiert mit Codeschnipseln.
Nachteile:Teuer für seine Länge, unscharfe Druckqualität auf einigen Seiten, keine Online-Unterstützung für Datensätze, fehlender Zugang zu verwandten Codes und Datensätzen, beschönigt schwierige Schritte.
(basierend auf 6 Leserbewertungen)
Data Science Using Python and R
Lernen Sie Datenwissenschaft, indem Sie Datenwissenschaft betreiben
Data Science Using Python and Rmacht Sie mit den beiden weltweit am weitesten verbreiteten Open-Source-Plattformen für Data Science vertraut: Python und R.
Datenwissenschaft ist angesagt. Bloomberg bezeichnete Datenwissenschaftler als "den heißesten Job in Amerika". Python und R sind die beiden weltweit führenden Open-Source-Tools für die Datenwissenschaft. In Data Science Using Python and R lernen Sie Schritt für Schritt, wie Sie mit modernsten Techniken praktische Lösungen für reale Unternehmensprobleme erstellen können.
Data Science Using Python and R richtet sich an den allgemeinen Leser, der keine Vorkenntnisse im Bereich Analytik oder Programmierung hat. Ein ganzes Kapitel ist dem Erlernen der Grundlagen von Python und R gewidmet. Anschließend werden in jedem Kapitel Schritt-für-Schritt-Anleitungen und Komplettlösungen für datenwissenschaftliche Probleme mit Python und R vorgestellt.
Diejenigen, die bereits über Analyseerfahrung verfügen, werden es zu schätzen wissen, dass sie eine zentrale Anlaufstelle haben, um zu lernen, wie man mit Python und R Data Science betreibt. Zu den behandelten Themen gehören Datenvorbereitung, explorative Datenanalyse, Vorbereitung der Datenmodellierung, Entscheidungsbäume, Modellbewertung, Fehlklassifizierungskosten, Na ve Bayes-Klassifikation, neuronale Netze, Clustering, Regressionsmodellierung, Dimensionsreduktion und Assoziationsregel-Mining.
Außerdem werden spannende neue Themen wie Random Forests und allgemeine lineare Modelle behandelt. Das Buch legt den Schwerpunkt auf datengesteuerte Fehlerkosten, um die Rentabilität zu erhöhen, und vermeidet so die üblichen Fallstricke, die ein Unternehmen Millionen von Dollar kosten können.
Data Science Using Python and R bietet Übungen am Ende jedes Kapitels, insgesamt über 500 Übungen in diesem Buch. Die Leser werden also reichlich Gelegenheit haben, ihre neu erworbenen Fähigkeiten und Kenntnisse im Bereich der Datenwissenschaft zu testen. In den praktischen Analyseübungen werden die Leser herausgefordert, interessante Geschäftsprobleme mit realen Datensätzen zu lösen.