
Optimal Adaptive Control and Differential Games by Reinforcement Learning Principles
Adaptive Regler und optimale Regler sind zwei unterschiedliche Methoden für den Entwurf automatischer Steuerungssysteme.
Adaptive Regler lernen online und in Echtzeit, wie Systeme zu steuern sind, liefern aber keine optimale Leistung, während optimale Regler offline mit vollständiger Kenntnis der Systemdynamik entworfen werden müssen. Dieses Buch zeigt, wie die approximative dynamische Programmierung - eine Technik des maschinellen Lernens mit Verstärkung, die durch Lernmechanismen in biologischen und tierischen Systemen motiviert ist - verwendet werden kann, um eine Familie von adaptiven optimalen Steuerungsalgorithmen zu entwerfen, die in Echtzeit zu optimalen Steuerungslösungen konvergieren, indem sie Daten entlang der Systemtrajektorien messen.
Das Buch beschreibt auch, wie man Methoden der approximativen dynamischen Programmierung einsetzt, um Differentialspiele mit mehreren Spielern online zu lösen. Differentialspiele haben sich als wichtig für die robuste Hinfinity-Steuerung zur Störungsunterdrückung und für die Koordinierung von Aktivitäten zwischen mehreren Agenten in vernetzten Teams erwiesen. Der Schwerpunkt dieses Buches liegt auf zeitkontinuierlichen Systemen, deren dynamische Modelle direkt aus physikalischen Prinzipien abgeleitet werden können, die auf Hamiltonscher oder Lagrangescher Dynamik basieren.
Im gesamten Buch werden Simulationsbeispiele gegeben, und es werden mehrere Methoden beschrieben, die keine vollständigen Informationen über die Zustandsdynamik erfordern. Optimal Adaptive Control and Differential Games by Reinforcement Learning Principles ist eine unverzichtbare Ergänzung für die Bücherregale von Maschinenbau-, Elektro- und Luft- und Raumfahrtingenieuren, die sich mit der Entwicklung von Regelsystemen beschäftigen.