
Thinking Data Science: A Data Science Practitioner's Guide
Dieser Leitfaden für Machine Learning-Projekte gibt Antworten auf die Probleme, die angehende oder erfahrene Datenwissenschaftler häufig haben: Sie sind unsicher, welche Technologie Sie für Ihre ML-Entwicklung verwenden sollen? Soll ich GOFAI, ANN/DNN oder Transfer Learning verwenden? Kann ich mich bei der Modellentwicklung auf AutoML verlassen? Was ist, wenn der Kunde mir Gigabytes und Terabytes an Daten für die Entwicklung von Analysemodellen zur Verfügung stellt? Wie gehe ich mit dynamischen Hochfrequenz-Datensätzen um? Dieses Buch bietet dem Praktiker eine Konsolidierung des gesamten Data Science-Prozesses in einem einzigen "Spickzettel".
Die Herausforderung für einen Datenwissenschaftler besteht darin, aus riesigen Datensätzen aussagekräftige Informationen zu extrahieren, die dazu beitragen, bessere Strategien für Unternehmen zu entwickeln. Viele Algorithmen für maschinelles Lernen und neuronale Netze sind für die Analyse solcher Datensätze konzipiert.
Für einen Datenwissenschaftler ist es eine schwierige Entscheidung, welchen Algorithmus er für einen bestimmten Datensatz verwenden soll. Obwohl es auf diese Frage keine einfache Antwort gibt, ist ein systematischer Ansatz zur Problemlösung erforderlich. In diesem Buch werden die verschiedenen ML-Algorithmen konzeptionell beschrieben und ein Prozess für die Auswahl von ML/DL-Modellen definiert/erörtert.
Die Konsolidierung der verfügbaren Algorithmen und Techniken für den Entwurf effizienter ML-Modelle ist der Schlüsselaspekt dieses Buches. Thinking Data Science wird praktizierenden Datenwissenschaftlern, Akademikern, Forschern und Studenten helfen, ML-Modelle mit den geeigneten Algorithmen und Architekturen zu erstellen, unabhängig davon, ob die Daten klein oder groß sind.