Приведем рекуррентные соотношения для этого случая. Уравнения состояний для прямого хода удобно записывать в виде
(7)
Введем в рассмотрение условные максимумы показателя эффективности за k шагов, от 1-го до k-го включительно, - величину . Повторив приведенные рассуждения, придем к следующей системе уравнений Беллмана:
;
(8)
В результате решения этих уравнений получим последовательности
; (9)
Далее определим безусловное оптимальное управление по цепочке [3]
(10)
ЛИТЕРАТУРА
Беллман Р., Динамическое программирование, пер. с англ., М., 1960. В.Г. Карманов.
Беллман Р., Энджел Э. Динамическое программирование и уравнения в частных производных ИЗДАТЕЛЬСТВО «МИР» МОСКВА 1974.
Беллман [Bellman R.E.] Дрейфус С.Е. [Dreyfus S.E.]` Прикладные задачи динамического программирования 1965.
Достарыңызбен бөлісу: |