8.4. Общая схема применения метода динамического программирования

Приведем общую схему применения метода ДП.

Предположим, что все требования, предъявляемые к задаче динамического программирования, выполнены. Построение метода ДП для решения сводится к следующим моментам:

1) Выбирается способ деления процесса управления на шаги.

2) Определяются параметры состояния Sk и переменные управления Xk на каждом шаге.

3) Записываются уравнения состояний.

4) Вводятся целевые функции K-го шага и суммарная целевая функция.

5) Вводятся в рассмотрение условные максимумы (минимумы) Z*K(Sk-1) и условное оптимальное управление на K-м шаге: X*K(Sk-1), K =N, N-1, …, 2, 1.

6) Записываются основные для вычислительной схемы ДП Беллмана для Z*N(Sn-1) и Z*K(Sk-1), K=N-1, …, 1.

7) Решаются последовательно уравнения Беллмана (условная оптимизация), и получаются две последовательности функций: {Z*K(Sk-1)}, {X*K(Sk-1)}.

8) После выполнения условной оптимизации определяется оптимальное решение для конкретного начального состояния S0:

А) Zmax = Z*1(s0) (здесь Zmax = max Z)

Б) по цепочке

Оптимальное управление: Х* =(Х1*, Х2*, …, ХN*).

< Предыдущая		Следующая >