Bewertung:

Dieses Buch ist ein umfassender und einsteigerfreundlicher Leitfaden, der sich auf die Datenbereinigung und -vorbereitung für maschinelles Lernen konzentriert. Es bietet praktische Übungen, wertvolle Einblicke und praktische Techniken, die in anderen Quellen oft fehlen. Während es für seine klaren Erklärungen und nützlichen Beispiele hoch bewertet wird, gibt es Hinweise darauf, dass es bei einigen fortgeschrittenen Themen an Tiefe fehlen könnte.
Vorteile:⬤ Umfassende und klare Erläuterungen zu Datenbereinigungs- und -aufbereitungstechniken.
⬤ Praktische Übungen und Code-Beispiele sind auf GitHub verfügbar.
⬤ Großartig für Anfänger und als solide Referenz für erfahrene Benutzer.
⬤ Fesselnder und zugänglicher Schreibstil; wirkt sympathisch.
⬤ Konzentriert sich auf die wertvollsten Techniken, die zu Ergebnissen beim maschinellen Lernen führen.
⬤ Es fehlt an Tiefe bei fortgeschrittenen Themen wie Deep Learning und Fehleranalyse.
⬤ Einige Leser wünschen sich ein breiteres Toolkit für komplexe Modellierungsanwendungen.
⬤ Konzentriert sich eher auf Inhalte für Einsteiger, was erfahrene Datenwissenschaftler, die nach fortgeschrittenen Erkenntnissen suchen, möglicherweise nicht zufriedenstellt.
(basierend auf 7 Leserbewertungen)
Data Cleaning and Exploration with Machine Learning: Get to grips with machine learning techniques to achieve sparkling-clean data quickly
Erforschen Sie hochentwickelte maschinelle Lerntechniken, um Ihre Datenwäscheladungen zu bewältigen.
Hauptmerkmale:
⬤ Lernen Sie, wie Sie Daten für maschinelle Lernverfahren vorbereiten können.
⬤ Verstehen Sie, welche Algorithmen auf Vorhersagezielen und den Eigenschaften der Daten basieren.
⬤ Erfahren Sie, wie Sie die Ergebnisse des maschinellen Lernens interpretieren und auswerten können.
Buchbeschreibung:
Viele Personen, die wissen, wie man Algorithmen des maschinellen Lernens ausführt, haben kein gutes Gespür für die statistischen Annahmen, die sie treffen, und dafür, wie man die Eigenschaften der Daten auf den Algorithmus abstimmt, um die besten Ergebnisse zu erzielen.
Zu Beginn dieses Buches werden die Modelle sorgfältig ausgewählt, um Ihnen zu helfen, die zugrundeliegenden Daten zu verstehen, einschließlich der Bedeutung von Merkmalen und Korrelationen sowie der Verteilung von Merkmalen und Zielen. In den ersten beiden Teilen des Buches werden Sie mit Techniken zur Vorbereitung von Daten für ML-Algorithmen vertraut gemacht, wobei Sie nicht davor zurückschrecken, einige ML-Techniken zur Datenbereinigung einzusetzen, einschließlich der Erkennung von Anomalien und der Auswahl von Merkmalen. Das Buch hilft Ihnen dann, dieses Wissen auf eine Vielzahl von ML-Aufgaben anzuwenden. Sie lernen gängige überwachte und unüberwachte Algorithmen kennen, erfahren, wie Sie Daten für diese Algorithmen vorbereiten und wie Sie sie auswerten können. Als Nächstes werden Sie Modelle erstellen und die Beziehungen in Ihren Daten verstehen, sowie Bereinigungs- und Erkundungsaufgaben mit diesen Daten durchführen. Sie werden schnell Fortschritte bei der Untersuchung der Verteilung von Variablen, der Identifizierung von Anomalien und der Untersuchung von bivariaten Beziehungen machen, da Sie sich in diesem Buch mehr auf die Genauigkeit von Vorhersagen konzentrieren.
Am Ende dieses Buches werden Sie in der Lage sein, mit komplexen Datenproblemen umzugehen, indem Sie unüberwachte ML-Algorithmen wie Hauptkomponentenanalyse und k-means Clustering verwenden.
Was Sie lernen werden:
⬤ Lernen Sie die wichtigsten Datenbereinigungs- und Explorationstechniken kennen, die vor der Ausführung der gängigsten Algorithmen für maschinelles Lernen anzuwenden sind.
⬤ Verstehen, wie man Vorverarbeitung und Merkmalsauswahl durchführt und wie man die Daten für Tests und Validierung einrichtet.
⬤ Modellierung kontinuierlicher Ziele mit überwachten Lernalgorithmen.
⬤ Modellierung von binären und Multiklassen-Zielen mit Algorithmen des überwachten Lernens.
⬤ Clustering und Dimensionsreduktion mit unüberwachten Lernalgorithmen durchführen.
⬤ Verstehen, wie man Regressionsbäume zur Modellierung eines kontinuierlichen Ziels verwendet.
Für wen dieses Buch gedacht ist:
Dieses Buch richtet sich an professionelle Datenwissenschaftler, insbesondere an diejenigen, die sich in den ersten Jahren ihrer Karriere befinden, oder an erfahrenere Analysten, die relativ neu im Bereich des maschinellen Lernens sind. Die Leser sollten über Vorkenntnisse von Konzepten in der Statistik verfügen, die üblicherweise in einem Einführungskurs für Studenten gelehrt werden, sowie über Anfängererfahrung in der programmatischen Bearbeitung von Daten.