
Minimum-Distortion Embedding
Einbettungen liefern konkrete numerische Darstellungen von ansonsten abstrakten Elementen, die in nachgelagerten Aufgaben verwendet werden können. Ein Biologe könnte zum Beispiel nach Unterfamilien verwandter Zellen suchen, indem er Einbettungsvektoren, die mit einzelnen Zellen verbunden sind, zu Clustern zusammenfasst, während ein Fachmann für maschinelles Lernen Vektordarstellungen von Wörtern als Merkmale für eine Klassifizierungsaufgabe verwenden könnte.
In dieser Monographie stellen die Autoren einen allgemeinen Rahmen für die treue Einbettung vor, der als Minimum-Distortion-Embedding (MDE) bezeichnet wird und die üblichen Fälle verallgemeinert, in denen Ähnlichkeiten zwischen Elementen durch Gewichte oder Abstände beschrieben werden. Der MDE-Rahmen ist einfach, aber allgemein. Er umfasst eine Vielzahl spezifischer Einbettungsmethoden, darunter spektrale Einbettung, Hauptkomponentenanalyse, multidimensionale Skalierung, euklidische Distanzprobleme usw.
Die Autoren liefern eine detaillierte Beschreibung des Einbettungsproblems mit minimaler Verzerrung und beschreiben die Theorie, die hinter der Erstellung von Lösungen für alle Aspekte steht. Sie beschreiben auch detailliert die Algorithmen zur Berechnung von Einbettungen mit minimaler Verzerrung.
Schließlich geben sie Beispiele dafür, wie man viele MDE-Probleme mit realen Datensätzen annähernd lösen kann, darunter Bilder, Co-Autorenschaftsnetzwerke, demografische Daten von Landkreisen in den USA, Populationsgenetik und mRNA-Transkriptome von Einzelzellen. Ein begleitendes Open-Source-Softwarepaket, PyMDE, macht es den Praktikern leicht, mit verschiedenen Einbettungen zu experimentieren, indem sie unterschiedliche Verzerrungsfunktionen und Beschränkungssätze wählen.
Die in diesem Buch beschriebenen und veranschaulichten Theorien und Techniken sind für Forscher und Praktiker von Interesse, die an modernen Systemen arbeiten, die modernste künstliche Intelligenz einsetzen wollen.