Bewertung:

Das Buch wird für seine zugängliche Einführung in die Statistik und seinen praktischen Fokus auf simulationsbasierte Inferenzmethoden gelobt, insbesondere für Anfänger und angehende Datenwissenschaftler, die R und Tidyverse verwenden. Während es für seinen praktischen Ansatz gefeiert wird, kritisieren einige Rezensenten die Druckqualität und das Fehlen von prägnanten Beispielen für die Implementierung statistischer Tests.
Vorteile:⬤ Zugängliche Einführung in die Statistik für Anfänger und angehende Datenwissenschaftler.
⬤ Betont praktisches, praxisnahes Lernen mit Anwendungen aus der Praxis.
⬤ Konzentriert sich auf simulationsbasierte Inferenz und ist gut mit R und Tidyverse verknüpft.
⬤ Bietet klare Erklärungen und ausgezeichnete Werkzeuge, einschließlich des Pakets 'infer'.
⬤ Ermutigt zur Erforschung und zum Verständnis statistischer Konzepte durch wiederholte Verweise und praktische Beispiele.
⬤ Die Druckqualität wird als schlecht kritisiert, ähnlich der 'Xerox-Qualität'.
⬤ Einige fanden das Buch trügerisch schwierig und es fehlten prägnante Beispiele für die Durchführung verschiedener statistischer Tests.
⬤ Einige Rezensenten merkten an, dass das Buch eher für Oberstufenschüler oder Studenten zu Beginn des Studiums geeignet sei als für fortgeschrittene Lernende.
⬤ Ein Rezensent erwähnte den Wunsch nach mehr Diskussionen über statistische Methoden und Kompromisse.
(basierend auf 9 Leserbewertungen)
Statistical Inference via Data Science: A ModernDive into R and the Tidyverse
Statistical Inference via Data Science: A ModernDive into R and the Tidyverse bietet einen Weg zum Erlernen statistischer Schlussfolgerungen unter Verwendung von Data-Science-Tools, die in der Industrie, im akademischen Bereich und in Behörden weit verbreitet sind. Es stellt die tidyverse-Suite von R-Paketen vor, einschließlich des ggplot2-Pakets für die Datenvisualisierung und des dplyr-Pakets für die Datenverarbeitung. Nachdem der Leser mit diesen Data-Science-Tools ausgestattet wurde, um effektive explorative Datenanalysen durchzuführen, deckt das Buch traditionelle einführende statistische Themen wie Konfidenzintervalle, Hypothesentests und multiple Regressionsmodellierung ab, wobei der Schwerpunkt auf der Visualisierung liegt.
Merkmale:
● Setzt minimale Voraussetzungen voraus, insbesondere keine Vorkenntnisse in Kalkül oder Programmierung.
● Motiviert die Theorie anhand von realen Daten, einschließlich aller Inlandsflüge, die New York City im Jahr 2013 verließen, dem Gapminder-Projekt und der datenjournalistischen Website FiveThirtyEight.com.
● Konzentriert sich auf simulationsbasierte Ansätze für statistische Schlussfolgerungen anstelle von mathematischen Formeln.
● Verwendet das infer-Paket für "ordentliche" und transparente statistische Schlussfolgerungen, um Konfidenzintervalle zu konstruieren und Hypothesentests mithilfe der Bootstrap- und Permutationsmethoden durchzuführen.
Alle Codes und Ausgaben sind direkt in den Text eingebettet und auch in der Online-Version auf moderndive.com verfügbar.
Dieses Buch richtet sich an Personen, die gleichzeitig mit der Entwicklung ihrer Data-Science-Toolbox beginnen und sich mit den in der modernen Forschung verwendeten Inferenz- und Modellierungswerkzeugen vertraut machen möchten. Das Buch kann im Rahmen von Methoden- und Datenwissenschaftskursen sowie in ersten Statistikkursen sowohl im Grund- als auch im Hauptstudium verwendet werden.