Verstärkungslernen und stochastische Optimierung: Ein einheitlicher Rahmen für sequenzielle Entscheidungen

Bewertung:   (4,2 von 5)

Verstärkungslernen und stochastische Optimierung: Ein einheitlicher Rahmen für sequenzielle Entscheidungen (B. Powell Warren)

Leserbewertungen

Zusammenfassung:

Das Buch ist ein umfassender und gründlicher Leitfaden zur stochastischen dynamischen Programmierung und zum Verstärkungslernen, geeignet für Fachleute im Bereich Operations Research. Es verbindet erfolgreich verschiedene Bereiche, einschließlich des Verstärkungslernens und der Kontrolltheorie, und bietet gleichzeitig einen einheitlichen Rahmen für sequenzielle Entscheidungsfindung. Allerdings leidet es unter zahlreichen Tippfehlern und einem Schreibstil, den manche als unübersichtlich empfinden könnten.

Vorteile:

Umfassende Abdeckung der Konzepte der sequentiellen Entscheidungsfindung.
Gut geschrieben und zugänglich für Leser mit unterschiedlichem Hintergrund.
Verbindet verschiedene Bereiche effektiv und bietet wertvolle Einblicke.
Bietet einen einheitlichen Rahmen für mehrere Gemeinschaften, die mit sequentiellen Entscheidungen zu tun haben.
Nützliche Übungen und ein gutes Nachschlagewerk für Fachleute.

Nachteile:

Hohe Anzahl von Tippfehlern und zweifelhafte Notationswahlen.
Fehlende Ableitungen für einige mathematische Ergebnisse, die der Leser selbst überprüfen oder neu ableiten muss.
Der Schreibstil kann für manche Leser unübersichtlich sein, was das Lesen ermüdend macht.
Der Inhalt ist stark auf Operations Research fokussiert, was Personen mit einem anderen Hintergrund, z. B. maschinelles Lernen, abschrecken könnte.

(basierend auf 12 Leserbewertungen)

Originaltitel:

Reinforcement Learning and Stochastic Optimization: A Unified Framework for Sequential Decisions

Inhalt des Buches:

VERSTÄRKUNGSLERNEN UND STOCHASTISCHE OPTIMIERUNG

Lichtung im Dschungel der stochastischen Optimierung

Sequentielle Entscheidungsprobleme, die aus "Entscheidung, Information, Entscheidung, Information" bestehen, sind allgegenwärtig und erstrecken sich auf praktisch alle menschlichen Aktivitäten, von Geschäftsanwendungen über das Gesundheitswesen (persönliche und öffentliche Gesundheit und medizinische Entscheidungsfindung), die Energie, die Wissenschaften, alle Bereiche des Ingenieurwesens, das Finanzwesen und den elektronischen Handel. Die Vielfalt der Anwendungen hat die Aufmerksamkeit von mindestens 15 verschiedenen Forschungsbereichen auf sich gezogen, die acht verschiedene Notationssysteme verwenden, die eine breite Palette von Analyseinstrumenten hervorgebracht haben. Ein Nebeneffekt ist, dass leistungsstarke Werkzeuge, die in einer Gemeinschaft entwickelt wurden, anderen Gemeinschaften unbekannt sein können.

Reinforcement Learning and Stochastic Optimization bietet einen einzigen kanonischen Rahmen, der jedes sequentielle Entscheidungsproblem mit fünf Kernkomponenten modellieren kann: Zustandsvariablen, Entscheidungsvariablen, exogene Informationsvariablen, Übergangsfunktion und Zielfunktion. Dieses Buch hebt zwölf Arten von Ungewissheit hervor, die in jedes Modell einfließen können, und fasst die verschiedenen Methoden zur Entscheidungsfindung, die als Strategien bekannt sind, in vier grundlegende Klassen zusammen, die alle in der akademischen Literatur vorgeschlagenen oder in der Praxis verwendeten Methoden umfassen.

Reinforcement Learning and Stochastic Optimization ist das erste Buch, das eine ausgewogene Behandlung der verschiedenen Methoden zur Modellierung und Lösung von sequentiellen Entscheidungsproblemen bietet und dabei dem Stil der meisten Bücher über maschinelles Lernen, Optimierung und Simulation folgt. Die Darstellung richtet sich an Leser mit einem Kurs in Wahrscheinlichkeit und Statistik und einem Interesse an Modellierung und Anwendungen. Die lineare Programmierung wird gelegentlich für bestimmte Problemklassen verwendet. Das Buch richtet sich sowohl an Leser, die neu auf dem Gebiet sind, als auch an solche, die bereits Erfahrung mit der Optimierung unter Unsicherheit haben.

Im gesamten Buch finden die Leser Verweise auf über 100 verschiedene Anwendungen, die von reinen Lernproblemen über dynamische Ressourcenzuweisungsprobleme und allgemeine zustandsabhängige Probleme bis hin zu hybriden Lern-/Ressourcenzuweisungsproblemen reichen, wie sie bei der COVID-Pandemie auftraten. Es gibt 370 Übungen, die in sieben Gruppen eingeteilt sind, die von Wiederholungsfragen, Modellierung, Berechnung, Problemlösung, Theorie, Programmierübungen und einem "Tagebuchproblem" reichen, das der Leser zu Beginn des Buches auswählt und das als Grundlage für die Fragen im Rest des Buches verwendet wird.

Weitere Daten des Buches:

ISBN:9781119815037
Autor:
Verlag:
Einband:Hardcover
Erscheinungsjahr:2022
Seitenzahl:1136

Kauf:

Derzeit verfügbar, auf Lager.

Ich kaufe es!

Weitere Bücher des Autors:

Ungefähres dynamisches Programm - Approximate Dynamic Programmin
(Lob für die erste Ausgabe)"Endlich ein Buch, das sich der dynamischen Programmierung widmet und in...
Ungefähres dynamisches Programm - Approximate Dynamic Programmin
Sequentielle Entscheidungsanalyse und Modellierung: Modellierung mit Python - Sequential Decision...
Sequentielle Entscheidungsprobleme treten in...
Sequentielle Entscheidungsanalyse und Modellierung: Modellierung mit Python - Sequential Decision Analytics and Modeling: Modeling with Python
Ein moderner Ansatz für den Unterricht zur Einführung in die Optimierung - A Modern Approach to...
Optimierung sollte die Wissenschaft vom Treffen...
Ein moderner Ansatz für den Unterricht zur Einführung in die Optimierung - A Modern Approach to Teaching an Introduction to Optimization
Verstärkungslernen und stochastische Optimierung: Ein einheitlicher Rahmen für sequenzielle...
VERSTÄRKUNGSLERNEN UND STOCHASTISCHE OPTIMIERUNG ...
Verstärkungslernen und stochastische Optimierung: Ein einheitlicher Rahmen für sequenzielle Entscheidungen - Reinforcement Learning and Stochastic Optimization: A Unified Framework for Sequential Decisions

Die Werke des Autors wurden von folgenden Verlagen veröffentlicht: