Bewertung:

Das Buch erhält gemischte Kritiken, gelobt für seine theoretische Abdeckung und Organisation, aber kritisiert für einen Mangel an praktischen Beispielen und praktischen Anleitungen für die Implementierung von Data-Mining-Techniken. Einige Leser fanden es aufgrund seines abstrakten mathematischen Inhalts schwierig, während andere den umfassenden Überblick schätzten, den es bietet.
Vorteile:⬤ Bietet eine solide theoretische Grundlage im Data Mining.
⬤ Gut gegliederte Struktur mit klaren Erklärungen statistischer Konzepte.
⬤ Deckt ein breites Spektrum von Data-Mining-Algorithmen und -Methoden ab, einschließlich moderner Ansätze.
⬤ Gut geeignet für diejenigen, die über ein gutes statistisches Hintergrundwissen verfügen und nach einer Vertiefung suchen.
⬤ Enthält wertvolle Vorschläge für weiterführende Literatur am Ende jedes Kapitels.
⬤ Es fehlt an praktischen Beispielen und konkreten Anwendungen, was die Umsetzung erschwert.
⬤ Der abstrakte mathematische Inhalt kann für Leser ohne fundierte Statistikkenntnisse eine Herausforderung darstellen.
⬤ Einige Rezensenten fanden den Titel des Buches irreführend und behaupteten, es konzentriere sich mehr auf Statistik als auf Data-Mining-Techniken.
⬤ Fehlen von Übungen zur Vertiefung des Gelernten.
(basierend auf 15 Leserbewertungen)
Principles of Data Mining
Der erste wirklich interdisziplinäre Text über Data Mining, der die Beiträge der Informationswissenschaft, der Informatik und der Statistik vereint.
Das wachsende Interesse an Data Mining ist durch ein gemeinsames Problem in allen Disziplinen motiviert: Wie lassen sich sehr große Datensätze speichern, abrufen, modellieren und schließlich beschreiben und verstehen? In der Vergangenheit wurden verschiedene Aspekte des Data Mining unabhängig voneinander von unterschiedlichen Disziplinen behandelt. Dies ist der erste wirklich interdisziplinäre Text über Data Mining, der die Beiträge der Informationswissenschaft, der Informatik und der Statistik miteinander verbindet.
Das Buch besteht aus drei Abschnitten. Der erste Teil, Grundlagen, bietet einen Überblick über die Prinzipien, die den Data-Mining-Algorithmen und ihrer Anwendung zugrunde liegen. Der Schwerpunkt der Darstellung liegt eher auf Intuition als auf Strenge. Der zweite Abschnitt, Data-Mining-Algorithmen, zeigt, wie Algorithmen konstruiert werden, um bestimmte Probleme auf prinzipielle Weise zu lösen. Zu den behandelten Algorithmen gehören Bäume und Regeln für Klassifizierung und Regression, Assoziationsregeln, Glaubensnetze, klassische statistische Modelle, nichtlineare Modelle wie neuronale Netze und lokale „gedächtnisbasierte“ Modelle. Der dritte Abschnitt zeigt, wie die vorangegangene Analyse bei der Anwendung auf reale Data-Mining-Probleme zusammenpasst. Zu den Themen gehören die Rolle von Metadaten, der Umgang mit fehlenden Daten und die Vorverarbeitung von Daten.