
Data Science for Genomics
Data Science for Genomics stellt die grundlegenden Konzepte der Datenwissenschaft vor, die sich auf die Genomik beziehen und den Prozess der Überprüfung, Reinigung, Umwandlung und Modellierung von Daten mit dem Ziel umfassen, nützliche Informationen zu entdecken, Schlussfolgerungen zu ziehen und die Entscheidungsfindung zu unterstützen. Die Abschnitte behandeln Data Science, maschinelles Lernen, Deep Learning, Datenanalyse und Visualisierungstechniken.
Anschließend stellen die Autoren die Grundlagen der Genomik, Genetik, Transkriptome und Proteome als grundlegende Konzepte der Molekularbiologie vor, zusammen mit der DNA und den wichtigsten Merkmalen des menschlichen Genoms sowie der Genome von Eukaryoten und Prokaryoten. Techniken, die speziell für die Untersuchung von Genomen verwendet werden, werden dann in der Reihenfolge beschrieben, in der sie in einem Genomprojekt eingesetzt werden, einschließlich Methoden zur Erstellung genetischer und physikalischer Karten.
Die Methodik der DNA-Sequenzierung und die Strategien, die zur Zusammenstellung einer zusammenhängenden Genomsequenz verwendet werden, sowie Methoden zur Identifizierung von Genen in einer Genomsequenz und zur Bestimmung der Funktionen dieser Gene in der Zelle. Der Leser erfährt, wie die im Genom enthaltenen Informationen freigesetzt und der Zelle zur Verfügung gestellt werden, und lernt Methoden kennen, die sich auf das Klonen und die PCR konzentrieren.