Bewertung:

Derzeit gibt es keine Leserbewertungen. Die Bewertung basiert auf 2 Stimmen.
Elementary Cluster Analysis: Four Basic Methods That (Usually) Work
Die Verfügbarkeit von Clustering-Programmen bedeutet, dass jeder, der über Daten verfügt, problemlos Clusteranalysen durchführen kann. Aber viele Nutzer dieser Technologie sind sich der vielen versteckten Gefahren nicht bewusst. In der heutigen Welt der "grab and go"-Algorithmen besteht ein Teil meiner Motivation, dieses Buch zu schreiben, darin, den Nutzern eine Reihe von warnenden Geschichten über die Clusteranalyse zu erzählen, denn sie ist sowohl eine Kunst als auch eine Wissenschaft, und man kann leicht stolpern, wenn man ihre Fallstricke nicht versteht. Und selbst wenn man sie kennt, kann man leicht über sie stolpern! Das Klammerwort "in der Regel" in der Überschrift ist sehr wichtig, da alle Clusteralgorithmen von Zeit zu Zeit versagen können und dies auch tun.
Die moderne Clusteranalyse ist technisch so kompliziert geworden, dass es für Anfänger oder Nichtfachleute oft schwer ist, ihre vielen versteckten Gefahren zu erkennen und zu verstehen. Yogi Berra hat es folgendermaßen ausgedrückt, und er hatte Recht:
In der Theorie gibt es keinen Unterschied zwischen Theorie und Praxis. In der Praxis gibt es Yogi Berra.
Dieses Buch ist ein Schritt zurück zu vier klassischen Methoden für das Clustering in kleinen, statischen Datensätzen, die alle den Tests der Zeit standgehalten haben. Die jüngste der vier Methoden ist inzwischen fast 50 Jahre alt:
Gaußsche Mischungszerlegung (GMD, 1898)
SAHN Clustering (vor allem Single Linkage (SL, 1909))
Hard c-means (HCM, 1956, auch bekannt als (aka) "k-means")
Fuzzy c-means (FCM, 1973, reduziert auf HCM in einer bestimmten Grenze)
Bei den Daten handelt es sich um die ersten (mir jedenfalls bekannten) Schriften über diese vier Modelle. Ich bezeichne HCM, FCM, GMD und SL (mit Verlaub: Marvel Comics) gerne als die Fantastischen Vier.
Die Clusteranalyse ist ein umfangreiches Thema. Das Gesamtbild des Clustering ist ziemlich überwältigend, so dass jeder Versuch, am tiefen Ende des Pools zu schwimmen, selbst in einem sehr spezialisierten Teilbereich, eine Menge Training erfordert. Aber wir alle fangen am flachen Ende an (oder zumindest sollten wir dort anfangen!), und dieses Buch ist genau darauf ausgerichtet, Kleinkindern die Angst vor dem Wasser zu nehmen. Es gibt keinen Abschnitt in diesem Buch, der, wenn er wirklich vertieft wird, nicht in einen eigenen Band aufgenommen werden könnte. Wenn Sie also eine eingehende Behandlung aller neuesten Entwicklungen zu einem der Themen in diesem Band benötigen, kann ich Sie bestenfalls zum Pool führen und Ihnen zeigen, wo Sie hinein springen können.