
Chance and Decision. Stochastic Control in Discrete Time
Die mathematische Theorie der zeitdiskreten Entscheidungsprozesse, auch bekannt als stochastische Kontrolle, basiert auf zwei Hauptideen: Rückwärtsinduktion und Konditionierung. Sie hat eine große Anzahl von Anwendungen in fast allen Zweigen der Naturwissenschaften.
Das Ziel dieser Notizen ist es, eine in sich geschlossene Einführung in diese Theorie und ihre Anwendungen zu geben. Unsere Absicht war es, ein umfassendes und mathematisch präzises Bild des Themas zu vermitteln und gut motivierte Beispiele zu präsentieren. Wir behandeln sowohl Systeme mit vollständiger oder partieller Information als auch mit vollständiger oder partieller Beobachtung.
Wir haben versucht, verschiedene Themen wie Gleichungen der dynamischen Programmierung, Halteprobleme, Stabilisierung, Kalman-Bucy-Filter, lineare Regler, adaptive Steuerung und Optionspreise auf einheitliche Weise darzustellen. Die Notizen diskutieren eine große Vielfalt von Modellen, anstatt sich auf allgemeine Existenztheoreme zu konzentrieren.