Bewertung:

Das Buch ist ein umfassender und gründlicher Leitfaden zur stochastischen dynamischen Programmierung und zum Verstärkungslernen, geeignet für Fachleute im Bereich Operations Research. Es verbindet erfolgreich verschiedene Bereiche, einschließlich des Verstärkungslernens und der Kontrolltheorie, und bietet gleichzeitig einen einheitlichen Rahmen für sequenzielle Entscheidungsfindung. Allerdings leidet es unter zahlreichen Tippfehlern und einem Schreibstil, den manche als unübersichtlich empfinden könnten.
Vorteile:⬤ Umfassende Abdeckung der Konzepte der sequentiellen Entscheidungsfindung.
⬤ Gut geschrieben und zugänglich für Leser mit unterschiedlichem Hintergrund.
⬤ Verbindet verschiedene Bereiche effektiv und bietet wertvolle Einblicke.
⬤ Bietet einen einheitlichen Rahmen für mehrere Gemeinschaften, die mit sequentiellen Entscheidungen zu tun haben.
⬤ Nützliche Übungen und ein gutes Nachschlagewerk für Fachleute.
⬤ Hohe Anzahl von Tippfehlern und zweifelhafte Notationswahlen.
⬤ Fehlende Ableitungen für einige mathematische Ergebnisse, die der Leser selbst überprüfen oder neu ableiten muss.
⬤ Der Schreibstil kann für manche Leser unübersichtlich sein, was das Lesen ermüdend macht.
⬤ Der Inhalt ist stark auf Operations Research fokussiert, was Personen mit einem anderen Hintergrund, z. B. maschinelles Lernen, abschrecken könnte.
(basierend auf 12 Leserbewertungen)
Reinforcement Learning and Stochastic Optimization: A Unified Framework for Sequential Decisions
VERSTÄRKUNGSLERNEN UND STOCHASTISCHE OPTIMIERUNG
Lichtung im Dschungel der stochastischen Optimierung
Sequentielle Entscheidungsprobleme, die aus "Entscheidung, Information, Entscheidung, Information" bestehen, sind allgegenwärtig und erstrecken sich auf praktisch alle menschlichen Aktivitäten, von Geschäftsanwendungen über das Gesundheitswesen (persönliche und öffentliche Gesundheit und medizinische Entscheidungsfindung), die Energie, die Wissenschaften, alle Bereiche des Ingenieurwesens, das Finanzwesen und den elektronischen Handel. Die Vielfalt der Anwendungen hat die Aufmerksamkeit von mindestens 15 verschiedenen Forschungsbereichen auf sich gezogen, die acht verschiedene Notationssysteme verwenden, die eine breite Palette von Analyseinstrumenten hervorgebracht haben. Ein Nebeneffekt ist, dass leistungsstarke Werkzeuge, die in einer Gemeinschaft entwickelt wurden, anderen Gemeinschaften unbekannt sein können.
Reinforcement Learning and Stochastic Optimization bietet einen einzigen kanonischen Rahmen, der jedes sequentielle Entscheidungsproblem mit fünf Kernkomponenten modellieren kann: Zustandsvariablen, Entscheidungsvariablen, exogene Informationsvariablen, Übergangsfunktion und Zielfunktion. Dieses Buch hebt zwölf Arten von Ungewissheit hervor, die in jedes Modell einfließen können, und fasst die verschiedenen Methoden zur Entscheidungsfindung, die als Strategien bekannt sind, in vier grundlegende Klassen zusammen, die alle in der akademischen Literatur vorgeschlagenen oder in der Praxis verwendeten Methoden umfassen.
Reinforcement Learning and Stochastic Optimization ist das erste Buch, das eine ausgewogene Behandlung der verschiedenen Methoden zur Modellierung und Lösung von sequentiellen Entscheidungsproblemen bietet und dabei dem Stil der meisten Bücher über maschinelles Lernen, Optimierung und Simulation folgt. Die Darstellung richtet sich an Leser mit einem Kurs in Wahrscheinlichkeit und Statistik und einem Interesse an Modellierung und Anwendungen. Die lineare Programmierung wird gelegentlich für bestimmte Problemklassen verwendet. Das Buch richtet sich sowohl an Leser, die neu auf dem Gebiet sind, als auch an solche, die bereits Erfahrung mit der Optimierung unter Unsicherheit haben.
Im gesamten Buch finden die Leser Verweise auf über 100 verschiedene Anwendungen, die von reinen Lernproblemen über dynamische Ressourcenzuweisungsprobleme und allgemeine zustandsabhängige Probleme bis hin zu hybriden Lern-/Ressourcenzuweisungsproblemen reichen, wie sie bei der COVID-Pandemie auftraten. Es gibt 370 Übungen, die in sieben Gruppen eingeteilt sind, die von Wiederholungsfragen, Modellierung, Berechnung, Problemlösung, Theorie, Programmierübungen und einem "Tagebuchproblem" reichen, das der Leser zu Beginn des Buches auswählt und das als Grundlage für die Fragen im Rest des Buches verwendet wird.