
The Design and Implementation of Modern Column-Oriented Database Systems
Die Leistung von Datenbanksystemen steht in direktem Zusammenhang mit der Effizienz des Systems bei der Speicherung von Daten auf dem Primärspeicher (z. B.
Festplatte) und der Übertragung in CPU-Register zur Verarbeitung. Aus diesem Grund gibt es in der Datenbankgemeinschaft eine lange Geschichte der Forschung, die sich mit Alternativen zur physischen Speicherung befasst, einschließlich ausgefeilter Indizierung, materialisierter Ansichten und vertikaler und horizontaler Partitionierung. In den letzten Jahren ist das Interesse an so genannten spaltenorientierten Systemen, manchmal auch als Spaltenspeicher bezeichnet, wieder gestiegen.
Spaltenspeichersysteme partitionieren eine Datenbank vollständig vertikal in eine Sammlung von einzelnen Spalten, die separat gespeichert werden. Indem jede Spalte separat auf der Festplatte gespeichert wird, ermöglichen diese spaltenbasierten Systeme, dass Abfragen die benötigten Attribute nachjustieren können, anstatt ganze Zeilen von der Festplatte lesen und nicht benötigte Attribute verwerfen zu müssen, sobald sie im Speicher sind.
The Design and Implementation of Modern Column-Oriented Database Systems behandelt moderne spaltenorientierte Datenbanksysteme, ihre Architektur und Entwicklung sowie die Vorteile, die sie bei der Datenanalyse bieten können. Ein besonderer Schwerpunkt liegt dabei auf drei einflussreichen Forschungsprototypen, MonetDB, MonetDB/X100 und C-Store. Diese Systeme haben die Grundlage für mehrere bekannte kommerzielle Column-Store-Implementierungen gebildet.
Ihre Gemeinsamkeiten und Unterschiede werden beschrieben und ihre spezifischen architektonischen Merkmale für Komprimierung, späte Materialisierung, Join-Verarbeitung, Vektorisierung und adaptive Indexierung (Datenbank-Cracking) diskutiert. The Design and Implementation of Modern Column-Oriented Database Systems ist ein hervorragendes Nachschlagewerk zum Thema für Datenbankforscher und -praktiker.