Уравнение Веллмана как необходимое условие оптимальности получено в предположении, что функция Веллмана является гладкой (непрерывно дифференцируемой). Однако это допущение не вытекает из условия задачи оптимального управления и часто не выполняется. Поэтому применительно к задачам оптимального управления метод динамического программирования требует обоснования. В тех случаях, когда нет обоснования, он может быть использован как эвристический прием. При определенных условиях метод динамического программирования дает достаточное условие оптимальности.
Пусть S (x, t) — гладкое решение уравнения Веллмана (9.46) при граничном условии (9.47) и управление и*(х,?), найденное из условия
порождает единственную траекторию х*(?), удовлетворяющую уравнениям и граничным условиям задачи (9.44), вдоль которой функция и*(t) = u*(x*(t), t) кусочно непрерывна.
Тогда функция u*(x, t) является оптимальным управлением задачи (9.44).
Докажем это утверждение. В силу определения функции u*(x, t) в каждой точке ее непрерывности справедливо равенство.
Проинтегрируем обе части по t от to до t/:
откуда с учетом граничного условия (9.47) и равенства х*(?0) = х° находим
Рассмотрим допустимую пару (и (?), х (?)), где и (?) — произвольное допустимое управление. В силу определения функции и*(?) = = и*(x*(t), t) справедливо неравенство.
Интегрируя обе части по t от to до получим.
или, с учетом граничного условия (9.47) и равенства х (?о) = х°,.
Из этого неравенства и соотношения (9.49) следует, что при и = = и*(х, t) критерий оптимальности принимает минимальное значение, т. е. это управление является оптимальным.