Исследование и вычисление гарантированного результата в задачах позиционного управления

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Содержание

I. Предварительные сведения из теории позиционных дифференциальных игр
2. Сопряженные производные
3. Функция-унификатор
4. Оператор стабильного поглощения
5. " Построение стабильных мостов
6. Пример
- 7. 0. двух формализациях позиционных стратегий

Исследование и вычисление гарантированного результата в задачах позиционного управления (реферат, курсовая, диплом, контрольная)

В диссертации рассматриваются задачи управления, в которых требуется построить позиционную стратегию (управление по принципу обратной связи), гарантирующую определенное качество управляемого процесса при любой неизвестной заранее помехе. Задачи такого типа исследуются в рамках теории дифференциальных игр. Создание этой теории было обусловлено запросами практики. Быстрому ее развитию способствовали достижения математической теории оптимального управления. Современный облик теории дифференциальных игр в значительной мере определяется основополагающими работами советских математиков Н. Н, Красовского и Л. С, Понтрягина. Среди широкого круга зарубежных исследований следует выделить работы Р, Айзеке, а и У. Флеминга, которые были среди первых в этой области.

В последнее время в теории дифференциальных игр значите льное внимание уделяется исследованиям, направленным на развитие вычислительных методов. Конечной целью этих исследований должна быть разработка вычислительных программ для решения на ЭВМ различных задач, относящихся к теории дифференциальных игр. В частности, важной проблемой является задача построения стабильных мостов, т. е. таких множеств в пространстве позиций, из которых разрешима задача гарантированного управления.

Существующие в настоящее время алгоритмы для решения этой проблемы базируются на так называемой попятной конструкции (конструкции альтернированного интеграла). Эта конструкция изучалась во мшгих работах (см., например, [20,36,40,58,603), где она использовалась, в основном, для теоретических построений. Доведение этой конструкции до практически реализуемых алгоритмов потребовало дополнительных исследований. Существующие в настоящее время программы позволяют строить стабильные мосты для управляемых систем второго и третьего порядка (см., например, 17,8,28,31,35,48, 503). Ограничения m размерность системы вызваны большим объемом вычислений и памяти, необходимых при реализации попятной конструкции.

Важную роль в решении задач управления играют также исследования, подготавливающие базу для новых вычислительных методов. Как известно, функция цены и границы стабильных мостов лишь в редких случаях обладают гладкостью. Однако, как правило, они являются кусочно-гладкими. Поэтому представляет интерес изучение свойств кусочно-гладких границ стабильных мостов и функций цены. Такое исследование может подсказать новые направления для разработки экономичных вычислительных методов, использующих современный аппарат теории приближения функций, в частности, сплайнов.

В настоящей диссертации представлены как исследования общих свойств функции цены, которые могут оказаться полезными при создании базы для новых вычислительных алгоритмов, так и исследования, дающие непосредственный выход на разработку численных методов.

Материал диссертации разбит на семь параграфов. Леммы и теоремы в параграфах нумеруются двумя цифрами, первая из которых указывает номер параграфа, вторая — номер утверждения. Аналогичная нумерация принята и для формул.

Первый параграф носит вводный характер. Здесь изложены необходимые сведения из теории дифференциальных игр.

Во втором параграфе введены понятия верхних и нижних сопряженных производных локальш-липшицевых функций. Они определяются как результат известной в выпуклом анализе операции сопряжения, выполняемой над нижними или верхними производными исходной фикции. Изучены некоторые свойства сопряженных производных. Для описания динамики управляемой системы используется понятие функции-унификатора. Доказана теореш, утверждающая, что функция-унификатор является мажорантой, (минорантой) для нижней (верхней) сопряже иной производной лока ль но-липшицев ой функции цены дифференциальной игры. Эта теореш содержит необходимые и достаточные условия, которым должна удовлетворять функция цены, и продолжает исследования по унификации дифференциальных игр [17,183 •.

В § 3 рассматриваются некоторые приложения теорем, полученных в § 2, и выясняется роль функции-унификатора. Установлено, что необходимые и достаточные условия из § 2 являются обобщением известюго уравнения Айзекса-Беллмана. Показано, что с помощью теорем из § 2 можно получить новое простое доказательство следующего известюго факта теории дифференциальных игр. Если функции-унификаторы двух дифференциальных игр с одинаковыми функциями платы связаны опредеданным неравенством (равенством), то соответ ствующие функции цены будут связаны тем же соотношением. Указан вид необходимых и достаточных условий, которым должна удовлетворять функция цены, в случае, когда невыполнено условие седловой точки в маленькой игре. Демонстрируется возможность применения полученных теорем для исследования структуры сингулярных поверхностей, в точках которых функция цены недифференцируема. На основе результатов из § 2 выводится условие регулярности функции про-граммюго (детерминированного) максимина. Это условие получается в форме, которая была предложена Н. Н. Красовским на семинаре по теории управления в Институте математики и механики УНЦ АН СССР. Доказана эквивалентность необходимых и достаточных условий из § 2 и условий, фигурирующих в определении вязкого решения уравнения Айзекса-Беллмана (Гамильтона-Якоби), из работ С56,57] .

В четвертом и пятом параграфах рассматривается вопрос о построении множества позиционного поглощения в задаче сближения с компактной целью в фиксированный момент времени.

В § 4 предлагается форма оператора стабильного поглощения, которая является достаточно общей и в то же время удобной для разработки вычислительных алгоритмов. Для этого вводится многозначное отображение, определенное на пространстве позиций и удовлетворяющее ряду условий. Основным условием является соотношение, связывающее это отображение и функцию-унификатор управляемой системы, Оператор стабильного поглощения определяется в терминах упомянутого многозшчного отображения. Приводятся примеры, демонстрирующие полезные качества введенной конструкции.

В § 5 вводятся понятия аппроксимирующего оператора стабильного поглощения и системы множеств, аппроксимирующей множество позиционного поглощения. Эти понятия нацелены на приближенное вычисление максимальных стабильных мостов. Дается определение предела аппроксимирующей системы множеств при шаге попятной процедуры, стремящемся к нулю, и доказывается, что таким пределом является множество позиционного поглощения. Результаты §§ 4 и 5 с&ли использованы при разработке алгоритмов построения стабильных мостов для систем второго порядка. Эти алгоритмы реализованы в виде программ, составленных на языке Фортран. Изложение одного из них содержится в [483. В конце пятого параграфа приведены расчеты, выполненные программой, которая основана на предложенной конструкции.

Материал §§ 4 и 5 примыкает к исследованиям [17,21,50,511 .

В § 6 рассмотрен пример нерегулярной дифференциальной игры, для которого с помощью процедуры, обоснованной в четвертом и пятом параграфах, получено аналитическое описание функции цены. Задача построения функции цены даже для систем с простой динамикой является достаточно сложной. Это обстоятельство объясняется тем, что, как правило, в пространстве позиций имеются так называемые сингулярные множества, на которых функция цены недифференцируема. Структура же сингулярных поверхностей обычно бывает весьма елокной. Хотя в исследованном примере уравнения движения и функционал платы довольно просты, тем не менее, он в полной мере демоштрирует упомянутые трудгости вычисления функции цены. Доказано, что необходимые и достаточные условия, полученные в [44,45]^{условия,} изложенные в § 2 настоящей работы, могут служить эффективным инструментом для проверки того, что сконструированная функция позиции есть цена игры,.

В последнем, седьмом параграфе рассматривается вопрос о сравнении оптимальных гарантированных результатов задачи управления для двух формализаций позиционных стратегий, В первой формализации позиционные стратегии отождествляются с произвольными функциями, а соответствующие им движения определяются предельным переходом от пошаговых движений (ломаных Эйлера), Известно, что оптимальный результат, который могут гарантировать такие стратегии, совпадает с оптимальным результатом в противоположной задаче, которая рассматривается в классе контрстратегий (теорема об альтернативе в минимаксной дифференциальной игре С203), Во второй формализации позиционные стратегии отождествляются с функциями Каратеодори. Движения, порожденные такого рода стратегиями, определяются как решения (в смысле Каратеодори) соответствующих дифференциальных уравнений. Показано, что результат, который можно обеспечить в рамках второй формализации, нв лучше, чем результат, достижимый в рамках первой формализации. Доказательство этого факта требует специальных построений вследствие того, что позиционные стратегии, рассматриваемые в рамках второй формализации, и контрстратегии из первой формализации, вообще говоря, несовместны.

1. Айзеке Р. Дифференциальные игры. — М.: Мир, 1967. — 479 с.

2. Алексейчик М. И. Дальнейшая формализация основных элементов антагонистической дифференциальной игры. В кн.: Мат. анализ и его прилож., т. 7. Ростов-на-Дону: Ростов, ун-т. 1975, с. I9I-I99.

3. Альбрехт Э. Г. О встрече квазилинейных объектов в регулярном случае. Прикл. математика и механика, 1971, т. 35, вып. 4, с. 569−574.

4. Альбрехт Э. Г., Логинов М. И. О непрерывной зависимости жнейной игры сближения от параметра. Прикл. математика и механика, 1976, т. 40, вып. 2, с. 208−212.

5. Батухтин В. Д. О дифференцируемости цены дифференциальной игры сближения. Дифференц. уравнения, 1972, т. 8, $ 12, с. 21 402 148.

6. Батухтин В. Д., Ченцов А. Г. Об одной программной конструкции в позиционной дифференциальной игре. Изв. АН СССР, Серия матем., 1975, т. 39, Л 4, с. 926−936.

7. Боткин Н. Д. Оценка погрешности численных построений в дифференциальной игре с фиксированным моментом окончания. Пробл. управления и теории информ., 1982, т. II, JS 4, с, 283−295.

8. Боткин Н. Д., Пацко B.C. Позиционное управление в линейной дифференциальной игре. Изв. АН СССР, Техн. кибернетика, 1983, й 4, с. 75−78.

9. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977. — 624 с.

10. Григоренко Н. Л. О нелинейной задаче преследования несколькими объектами. Вестник Москов. Унив. Сер. Вычисл. Матем.Кибернет. 1981, В I, с. 60−69.

11. Григоренко Н. Л. Игра простого преследования-убегания группыпреследователей и одного убегающего. Вестник Москов. У нив. Сер. Вычисл. Матем. Кибернет., 1983, I I, с. 41−47.

12. Демьянов В. Ф. Минимакс: дифференцируемоеть по направлениям. -Л.: Изд-во ЛГУ, 1974. 112 с.

13. Демьянов В. Ф., Васильев JT.B. Недифференцируемая оптимизация.-М.: Наука, 1981. 384 с.

14. Красовский А. Н. Дифференциальная игра для позиционного фу несционала. Докл. АН СССР, 1980, т. 253, 6, с. 1303−1307.

15. Красовский А. Н., Красовский Н. Н., Третьяков В. Е. Стохастический программный синтез для детерминированной позиционной дифференциальной игры. Прикл. математика и механика, 1981, т. 45, вып. 4, с. 579−586.

16. Красовский Н. Н. Игровые задачи о встрече движений. М.: Наука, 1970. — 420 с.

17. Красовский Н. Н. К задаче унификации дифференциальных игр, -Докл. АН СССР, 1976, т. 226, Я 6, с. 1260−1263.

18. Красовский Н. Н. Унификация дифференциальных игр. В кн.: Игровые задачи управления. Свердловск: УНЦ АН СССР, 1977, с. 3244.

19. Красовский Н. Н. Дифференциальные игры, Аппроксимационные и формальные модели. Матем. сборник, 1978, т. 107(149), 15 4 (12), с, 541−571.

20. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974. — 456 с.

21. Красовский Н. Н., Субботин А. И. Аппроксимация в дифференциальной игре. Прикл. математика и механика, 1973, т. 37, вып.2, с. 197−204.

22. Красовский Н. Н., Субботин А. И., Ушаков В. Н. Минимаксная дифференциальная игра. Докл. АН СССР, 1972, т. 206, 13 2, с, 277−280.

23. Красовский Н. Н., Третьяков В. Е. Стохастический программный синтез для позиционной дифференциальной игры. Докл. АН СССР, 1981, т. 259, J& I, с. 24−27.

24. Красовский Н. Н., Третьяков В. Е. Одна задача оптимального управления на минимум гарантированного результата. Изв. АН СССР, Техн. кибернетика, 1983, В 2, с. 6−23.

25. Кряжимский А. В, Альтернатива в линейной игре сближения-уклонения с неполной информацией. Докл. АН СССР, 1976, т. 230, JS 4, с. 773−776.

26. Кряжимский А. В. К теории позиционных дифференциальных игр сближения-уклонения. Докл. АН СССР, 1978, т. 239, ti 4, с. 779−782.

27. Куржанекий А. Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. — 392 с.

28. Никольский М. С. Некоторые вычислительные аспекты 1-го прямого метода Понтрягина в дифференциальных играх. Вестник Москов. У нив. Сер. Вычисл.Матем.Кибернет., 1980, № 4, с. 2732.

29. Никольский М, С. Об альтернированном интеграле Л. С. Понтрягина. Матем. сборник, 1981, т. 116(158), В 1(9), с. 136−144.

30. Никольский М. С. Об одном прямом методе решения линейных дифференциальных игр преследования-убегания. Матем. заметки, 1983, т. 33, JS 6, с. 885−891.

31. Остапенко В. В. Приближенное решение задач с ближе ния-у к лонения в дифференциальных играх, Докл. АН СССР, 1982, т. 263, & I, с. 30−34.

32. Остапенко В. В. Методы решения одного класса задач сближения-уклонения. Автоматика и телемеханика, 1984, й 6, с. 42−46. < I • «t.

33. Пацко B.C., Тарасова С. И. Дифференциальная игра сближения сфиксированным моментом окончания, Свердловск, 1983, — П2с.- Рукопись представлена Ин-том математики и механики УЩ АН СССР. Деп. в ВИНИТИ 26 сент. 1983, JS 5320−83.

34. Петров Н. Н. Существование значения игры преследования. -Дифференц. уравнения, 1971, т. 7, 15, с. 827−839.

35. Пономарев А. П. Оценка погрешности численного метода построения альтернированного интеграла Понтрягина. Вестник Мое ков. У нив. Сер. Вычисл. Матем. Кибернет., 1978, й 4, с. 37−43.

36. Понтрягин Л. С. 0 линейных дифференциальных играх. I. Докл. АН СССР, 1967, т. 174, В 6, с. 1278−1280.

37. Понтрягин Л. С. 0 линейных дифференциальных играх. 2. Докл. АН СССР, 1967, т. 175, й 4, с. 764−766.

38. Понтрягин JT.C. Линейные дифференциальные игры преследования.- Матем. сборник, 1980, т. 112, J5 3, с. 307−330.

39. Пшеничный Б. Н. Выпуклый анализ и экстрешльные задачи. М.: Наука, 1980. — 319 с.

40. Пшеничный Б. Н, Структура дифференциальных игр. Докл. АН СССР, 1969, т. 184, й 2, с. 285−287.

41. Пшеничный Б. Н, Сагайдак М. И. О дифференциальных играх с фиксированным временем. Кибернетика, 1970, JS 2, с. 54−63.

42. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. — 469 с.

43. Субботин А. И. Обобщение основного уравнения теории дифференциальных игр. Докл. АН СССР, 1980, т. 254, Г&- 2, с. 293−297.

44. Субботин А. И., Субботина Н. Н. Необходимые и достаточные условия для кус очно-гладкой цены дифференциальной игры. Докл. АН СССР, 1978, т. 243, JS 4, с. 862−865.

45. Субботин А. И., Субботина Н. Н. Свойства потенциала дифференциальной игры. Прикл. математика и механика, 1982, т. 46, вып. 2, с. 204−211.

46. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981. — 288 с.

47. Тарасьев A.M. О построении функции цены в одной нерегулярной дифференциальной игре с фиксированным моментом окончания. -Свердловск, 1983. 42 с. — Рукопись представлена Урал. ун-том Деп. в ВИНИТИ 5 мая 1983, № 2455−83.

48. Тарасьев A.M., Ушаков В. Н. Построение системы множеств, аппроксимирующей максимальный минимаксно Uстабильный мост. В сб.: Алгоритмы и программы решения линейных дифференциальных игр. Свердловск: УНЦ АН СССР, 1984, с.159−190.

49. Тарасьев A.M., Ушаков В. Н. О построении стабильных мостов в минимаксной игре сближения-уклонения. Свердловск, 1983. -60 с. — Рукопись представлена Урал. ун-том. Деп. в ВИНИТИ5 мая 1983, № 2454−83.

50. Ушаков В. Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения. Изв. АН СССР, Техн. кибернетика, 1980, № 4, с.29−36.

51. Ушаков В. Н. К теории минимаксных дифференциальных игр. I. -Свердловск, 1980. 187 с. Рукопись представлена Ин-том математики и механики УНЦ АН СССР. Деп. в ВИНИТИ I сент. 1980, Ш 4425−80.

52. Федоренко Р. П. О задаче Коши в теории преследования. Журнал вычисл. матем. и матем. физики, 1969, т.9, № 5, с.1036−1045.

53. Ченцов А. Г. Об игровых задачах сближения-уклонения. Прикл. математика и механика, 1974, т.38, вып.2, с.211−223.

54. Ченцов А. Г. К игровой задаче наведения. Докл. АН СССР, 1976, т.226, Ш I, с.73−76.

55. Черноусько Ф. Л., Меликян А. А. Игровые задачи управления и поиска. М.: Наука, 1978. — 270 с.

56. Barron Е.П., Evans L.C., Jensen R. Viscosity solutions of Isaacs' equations and differential games with Lipschitz controls.- J. Different. Equat., 1984, vol.53, no.2, p.213−233.

57. Crandall M.G., Lions P.L. Viscosity solutions of Hamilton-Jacobi equations.- Trans. Amer. Math. Soc., 1983, vol.277, no.1, p.1−42.

58. Fleming W.H. The convergence problem for differential games. J. Math. Analysis & Appl., 1961, vol.3, no.1, p.102−116.

59. Fleming W.H. The convergence problem for differential games, II.- Ann. Math. Studies, 1964, no.52, p.195−210.

60. Friedman A. Differential games.- New York: Wiley Intersci., 1971. 350 p.

Показать весь текст

Заполнить форму текущей работой