Bewertung:

Dieses Buch wird von den Nutzern für seine Klarheit und Nützlichkeit beim Erlernen von Python für Data Science gelobt und ist sowohl für Anfänger als auch für fortgeschrittene Programmierer geeignet. Es bietet praktische Beispiele und Übungen, obwohl einige Nutzer es aufgrund der Druckqualität und Programmierfehler als frustrierend empfanden.
Vorteile:⬤ Klar und prägnant
⬤ ideal für Anfänger und Fortgeschrittene
⬤ praktische Beispiele
⬤ hilfreich für das Erlernen von Data-Science-Konzepten
⬤ endet mit Übungen zum Verständnis
⬤ geeignet als Handbuch.
⬤ In Schwarz-Weiß gedruckt, was die Übersichtlichkeit der Grafiken beeinträchtigt
⬤ einige Codeschnipsel funktionieren nicht richtig
⬤ pädagogische Probleme
⬤ erfordert Python-Vorkenntnisse für ein optimales Verständnis.
(basierend auf 9 Leserbewertungen)
Data Science Essentials in Python: Collect - Organize - Explore - Predict - Value
Mit dieser Kurzreferenz für den vielbeschäftigten Datenwissenschaftler gelangen Sie von unordentlichen, unstrukturierten Artefakten, die in SQL- und NoSQL-Datenbanken gespeichert sind, zu einem ordentlichen, gut organisierten Datensatz. Verstehen Sie Text Mining, maschinelles Lernen und Netzwerkanalyse; verarbeiten Sie numerische Daten mit den Modulen NumPy und Pandas; beschreiben und analysieren Sie Daten mit statistischen und netzwerktheoretischen Methoden; und sehen Sie sich konkrete Beispiele für die Datenanalyse bei der Arbeit an. Diese One-Stop-Lösung deckt das Wesentliche der Datenwissenschaft in Python ab, das Sie benötigen.
Die Datenwissenschaft ist eine der am schnellsten wachsenden Disziplinen in Bezug auf akademische Forschung, Studenteneinschreibung und Beschäftigung. Python hat mit seiner Flexibilität und Skalierbarkeit die Sprache R bei datenwissenschaftlichen Projekten schnell überholt. Mit dieser modularen Kurzreferenz zu den Werkzeugen, die zum Erfassen, Bereinigen, Analysieren und Speichern von Daten verwendet werden, haben Sie die datenwissenschaftlichen Konzepte in Python immer griffbereit.
Diese Komplettlösung deckt die wichtigsten Bereiche von Python, Datenbanken, Netzwerkanalyse, Verarbeitung natürlicher Sprache, Elemente des maschinellen Lernens und Visualisierung ab. Greifen Sie auf strukturierte und unstrukturierte Text- und numerische Daten aus lokalen Dateien, Datenbanken und dem Internet zu. Anordnen, Umordnen und Bereinigen der Daten. Arbeiten mit relationalen und nicht-relationalen Datenbanken, Datenvisualisierung und einfachen prädiktiven Analysen (Regressionen, Clustering und Entscheidungsbäume). Sehen Sie, wie typische Datenanalyseprobleme behandelt werden. Und versuchen Sie sich an eigenen Lösungen für eine Vielzahl von mittelgroßen Projekten, die Spaß machen und sich gut in Ihrem Lebenslauf machen.
Diese handliche Kurzanleitung können Sie als Student, als Einsteiger in die Datenwissenschaft, der von R auf Python umsteigt, oder als erfahrener Python-Entwickler, der nicht jede Funktion und Option auswendig lernen möchte, immer zur Hand haben.
Was Sie brauchen:
Sie benötigen eine anständige Distribution von Python 3. 3 oder höher, die mindestens NLTK, Pandas, NumPy, Matplotlib, Networkx, SciKit-Learn und BeautifulSoup enthält. Eine großartige Distribution, die diese Anforderungen erfüllt, ist Anaconda, kostenlos erhältlich unter www.continuum. io. Wenn Sie vorhaben, Ihre eigenen Datenbankserver einzurichten, benötigen Sie außerdem MySQL (www.mysql.com) und MongoDB (www.mongodb.com). Beide Pakete sind kostenlos und laufen auf Windows, Linux und Mac OS.