Bewertung:

Derzeit gibt es keine Leserbewertungen. Die Bewertung basiert auf 4 Stimmen.
Big Data Science & Analytics: A Hands-On Approach
Daten und Informationen sind der Treibstoff dieses neuen Zeitalters, in dem leistungsstarke Analysealgorithmen diesen Treibstoff verbrennen, um Entscheidungen zu treffen, die eine intelligentere und effizientere Welt für uns alle schaffen sollen. Dieser neue Technologiebereich wurde als Big Data Science and Analytics definiert, und die Industrie und die akademischen Kreise erkennen, dass es sich hierbei um eine wettbewerbsfähige Technologie handelt, die erheblichen neuen Wohlstand und neue Möglichkeiten schaffen kann.
Unter Big Data versteht man Sammlungen von Datensätzen, deren Volumen, Geschwindigkeit oder Vielfalt so groß ist, dass es schwierig ist, die Daten mit herkömmlichen Datenbanken und Datenverarbeitungswerkzeugen zu speichern, zu verwalten, zu verarbeiten und zu analysieren. Big-Data-Wissenschaft und -Analytik befasst sich mit der Erfassung, Speicherung, Verarbeitung und Analyse von Massendaten. Branchenerhebungen, beispielsweise von Gartner und e-Skills, sagen voraus, dass allein für Ingenieure und Wissenschaftler, die im Bereich der Datenwissenschaft und -analyse ausgebildet sind, mehr als 2 Millionen offene Stellen zu erwarten sind und dass der Arbeitsmarkt in diesem Bereich jährlich um 150 Prozent wächst.
Wir haben dieses Lehrbuch als Teil unserer wachsenden "A Hands-On Approach"(TM)-Reihe geschrieben, um diesen Bedarf an Hochschulen und Universitäten zu decken, aber auch für Big-Data-Dienstleister, die daran interessiert sind, ihren Kunden und Entwicklern eine breitere Perspektive dieses aufstrebenden Feldes zu bieten, um ihre Schulungsprogramme zu begleiten. Der typische Leser sollte einige Kurse in der Programmierung mit traditionellen Hochsprachen auf Hochschulniveau absolviert haben und entweder ein Senior oder ein angehender Doktorand in einem der Bereiche Wissenschaft, Technologie, Ingenieurwesen oder Mathematik (MINT) sein. Eine begleitende Website zu diesem Buch enthält zusätzliche Unterstützung für den Unterricht und das Lernen (www.big-data-analytics-book.com)
Das Buch ist in drei Hauptteile gegliedert, die insgesamt zwölf Kapitel umfassen. Teil I bietet eine Einführung in Big Data, Anwendungen von Big Data sowie Big-Data-Wissenschafts- und -Analyse-Muster und -Architekturen. Es wird eine neuartige Methodik für das Design von Data Science- und Analytics-Anwendungen vorgeschlagen und ihre Umsetzung durch die Verwendung von Open-Source-Big-Data-Frameworks beschrieben. Diese Methodik beschreibt Big-Data-Analytik-Anwendungen als Realisierung der vorgeschlagenen Alpha-, Beta-, Gamma- und Delta-Modelle, die Tools und Frameworks zum Sammeln und Einlesen von Daten aus verschiedenen Quellen in die Big-Data-Analytik-Infrastruktur, verteilte Dateisysteme und nicht-relationale (NoSQL-)Datenbanken für die Datenspeicherung sowie Verarbeitungs-Frameworks für Batch- und Echtzeit-Analysen umfassen. Diese neue Methodik bildet die pädagogische Grundlage dieses Buches.
Teil II führt den Leser in verschiedene Tools und Frameworks für Big-Data-Analysen sowie in die architektonischen und programmiertechnischen Aspekte dieser Frameworks ein, mit Beispielen in Python. Wir beschreiben Publish-Subscribe-Messaging-Frameworks (Kafka & Kinesis), Source-Sink-Konnektoren (Flume), Datenbankkonnektoren (Sqoop), Messaging-Queues (RabbitMQ, ZeroMQ, RestMQ, Amazon SQS) und kundenspezifische REST-, WebSocket- und MQTT-basierte Konnektoren. Der Leser erhält eine Einführung in die Datenspeicherung, Batch- und Echtzeitanalyse und interaktive Abfrage-Frameworks wie HDFS, Hadoop, MapReduce, YARN, Pig, Oozie, Spark, Solr, HBase, Storm, Spark Streaming, Spark SQL, Hive, Amazon Redshift und Google BigQuery. Außerdem werden Datenbanken (MySQL, Amazon DynamoDB, Cassandra, MongoDB) und das Django Python Web Framework beschrieben.
Teil III führt den Leser in verschiedene Algorithmen des maschinellen Lernens mit Beispielen unter Verwendung der Spark MLlib und H2O-Frameworks sowie Visualisierungen unter Verwendung von Frameworks wie Lightning, Pygal und Seaborn ein.