Bewertung:

Das Buch ist ein umfassendes Nachschlagewerk über Data-Mining-Methoden, verfasst von einem bekannten Team aus Stanford. Es wird zwar für seine Klarheit und die Abdeckung sowohl der Theorie als auch der praktischen Anwendungen gelobt, aber manche Leser finden die Sprache schwierig und die Erklärungen für bestimmte Algorithmen unzureichend.
Vorteile:Klar und prägnant geschrieben, deckt Theorie und praktische Aspekte des Data Mining ab, geeignet für fortgeschrittene Studenten und angehende Doktoranden, gute Referenz für beliebte Algorithmen.
Nachteile:Schwierige Sprache in einigen Abschnitten, schlampig geschriebene Teile, unvollständige Abdeckung einiger Algorithmen, nicht als primäre Lernquelle geeignet.
(basierend auf 3 Leserbewertungen)
Mining of Massive Datasets
Dieses Buch wurde von führenden Autoritäten auf dem Gebiet der Datenbank- und Webtechnologien verfasst und ist für Studenten und Praktiker gleichermaßen eine unverzichtbare Lektüre. Die Popularität des Webs und des Internethandels liefert viele extrem große Datensätze, aus denen Informationen durch Data Mining gewonnen werden können.
Dieses Buch konzentriert sich auf praktische Algorithmen, die zur Lösung von Schlüsselproblemen im Data Mining verwendet wurden und selbst auf die größten Datensätze erfolgreich angewendet werden können. Es beginnt mit einer Diskussion des MapReduce-Frameworks, einem wichtigen Werkzeug zur automatischen Parallelisierung von Algorithmen. Die Autoren erklären die Tricks des ortsabhängigen Hashings und der Stream-Processing-Algorithmen für das Mining von Daten, die für eine erschöpfende Verarbeitung zu schnell ankommen.
Weitere Kapitel befassen sich mit der PageRank-Idee und verwandten Tricks zur Organisation des Webs, den Problemen bei der Suche nach häufigen Elementen und dem Clustering. Diese dritte Auflage enthält neue und erweiterte Abschnitte über Entscheidungsbäume, Deep Learning und die Auswertung von Graphen sozialer Netzwerke.