Стохастические задачи динамического программирования

РефератПомощь в написанииУзнать стоимостьмоей работы

Показывает, что будущие решения основываются только на состоянии системы в данный момент и не зависят от ее предыстории. Где (j=1,2,…, m) — вероятности m возможных дискретных состояний, которые может принимать случайный вектор. Для стохастического процесса можно схематично записать последовательность преобразований: Позволяет упростить функциональное уравнение, описывающее процесс, а свойство… Читать ещё >

Стохастические задачи динамического программирования (реферат, курсовая, диплом, контрольная)

В практике планирования довольно часто встречаются задачи, в которых на состояние системы и на значение критерия заметное влияние оказывают случайные факторы. В таких задачах управляемый процесс не полностью определяется начальным состоянием системы и выбранным управлением, а в какой-то мере зависит от случая. Такие задачи называются стохастическими и вероятностными.

Для нахождения оптимального решения многоэтапных экстремальных стохастических задач с аддитивным критерием можно использовать метод динамического программирования. В стохастической модели преобразование от i-го этапа к (i-1)-му содержит некоторую неопределенность. В результате преобразования известный вектор состояния переходит в случайный вектор состояния с функцией распределения, которая зависит от известного состояния, случайного состояния и управления. Поэтому, прежде чем принять решение на (i-1)-м этапе, необходимо положить, что действительное значение вектора состояния наблюдалось и известно.

Для стохастического процесса можно схематично записать последовательность преобразований:

Но нельзя с помощью обратной подстановки выразить конечное состояние как функцию начального. Это обусловлено тем, что результаты преобразований известны только после непосредственных наблюдений.

Величины являются случайными, поэтому управления также случайны в том смысле, что их применение дает неопределенный результат для величины критерия.

Критерий.

Стохастические задачи динамического программирования.

как функция случайных величин также является случайной величиной, поэтому говорить о его оптимальном значении не имеет смысла. В связи с этим в роли меры качества проведения используют среднюю характеристику возможных результатов. Такой характеристикой является среднее арифметическое, т. е. математическое ожидание. Свойство линейности.

M (X1+X2+…+Xn)=M (X1)+M (X2)+…+M (Xn).

Позволяет упростить функциональное уравнение, описывающее процесс, а свойство линейности.

M[M (X1)+M (X2)+…+M (Xn)]= M (X1)+M (X2)+…+M (Xn).

Показывает, что будущие решения основываются только на состоянии системы в данный момент и не зависят от ее предыстории.

Пусть — максимум математического ожидания величины критерия по в N-этапном процессе, начинающемся с состояния, при использовании оптимальной стратегии; тогда.

Откуда для дискретного случая получаем.

Где (j=1,2,…, m) — вероятности m возможных дискретных состояний, которые может принимать случайный вектор

0<=<=1, .

Показать весь текст

Заполнить форму текущей работой

Другие работы

Экспортирование компонентов и систем

Названные модели экспертизы разработаны в рамках фундаментального проекта ГГ1 и диссертационного исследования О. А. Слабоспицкой. Результаты исследований изложены в технических отчетах данного проекта и в защищенной диссертации под руководством автора и в ряде монографий (twirpx, com), которая пользуется большим спросом в странах СНГ. Модели адаптированы для семейства систем ПС и описаны…

Реферат

Подробнее...

Обзор аналогичных систем и средств

Traffic Inspector позволяет полностью контролировать работу пользователей в сети, назначая лимиты по трафику, расписания доступа, ограничения по скорости, сессиям, видам соединений, типам и размерам файлов. Трафиком можно гибко управлять: разрешать, запрещать, ограничивать или перенаправлять на другое подключение, делать бесплатным. Ведется учет трафика не только по пользователям…

Реферат

Подробнее...

Модели и методы ролевого и сессионного контроля доступа. Вопросы идентификации ролей и сессий

Для заданной системы состояние Д, = (Д> О0″ ^о) следует считать безопасным относительно некоторого права R, если не существует применимой к Qoi последовательности действий, в результате выполнения которых ролью Д приобретается право R доступа к объекту О0, исходно отсутствующее в ячейке матрицы М0. Если же право R, отсутствующее в ячейке матрицы М0, приобретается ролью Д, то следует говорить, что…

Реферат

Подробнее...

Заключение. Проектирование внутренней схемы БД

База Данных — это одно из ключевых понятий, связанных с программированием и компьютерами в целом. Ведь, если рассуждать сугубо с точки зрения обычного пользователя, который не является ни математиком, ни физиком, главная функция компьютера как такового — хранение и предоставление в нужный момент определенных данных. БД имеют огромное прикладное значения, широко применяются в производстве…

Реферат

Подробнее...

Создание сообщений на основе шаблонов

Инструмент Правила Outlook может выполнять те же перемещения, что и Быстрые действия, но только автоматически, что делает работу с почтой быстрее и исключает ошибки систематизации почты. Иногда можно ошибиться в процессе перетаскивания сообщений из одной папки в другую. А последующий поиск может занять неопределенное время, а иногда и вообще не увенчаться успехом, поскольку могут быть допущены…

Реферат

Подробнее...

Повышение качества изображения путем пространственно — частотной фильтрации

Для улучшения изображений часто используется пространственно-частотная фильтрация. Если даже снимок не имеет явных дефектов, можно применить фильтр с небольшим подъемом характеристики на верхних частотах, и снимок будет выглядеть более резким. Столь же полезна режекция постоянной составляющей, когда подавляются или ослабляются некоторые (или все) составляющие, расположенные вблизи нулевой…

Реферат

Подробнее...

Методология использования информационной технологии

Централизованная обработка информации на ЭВМ вычислительных центров была первой исторически сложившейся технологией. Создавались крупные вычислительные центры коллективного пользования, оснащенные большими ЭВМ (в нашей стране — ЭВМ ЕС). Применение таких ЭВМ позволяло обрабатывать большие массивы входной информации и получить на этой основе различные виды информационной продукции, которая затем…

Реферат

Подробнее...

Структура подсистем и их характеристика

Правовое обеспечение представляет собой совокупность правовых норм, регламентирующих правоотношения при функционировании АСУП и статус результатов ее функционирования. В него входят нормативные акты, регламентирующие организацию работ по созданию автоматизированных систем, их цели, задачи, структуру и функции, статус АСУП и всех ее звеньев, а также регламентирующие процессы, связанные…

Реферат

Подробнее...

Типы данных в ячейках электронной таблицы

Числовые значения, заключенные в круглые скобки, интерпретируются как отрицательные. Например, (5) интерпретируется как -5. Символ Е или е используется при вводе чисел в экспоненциальном представлении. Например, 1Е6 интерпретируется как 1 000 000 (единица, умноженная на десять в шестой степени). При вводе больших чисел можно вставлять пробел для отделения сотен от тысяч, тысяч от миллионов и т…

Реферат

Подробнее...

Введение. Графический интерфейс Windows

Можно без конца спорить о многочисленных недостатках и недоработках в тех или иных элементах интерфейса Windows. Можно, потрясая пыльными историческими справочниками, доказывать, что все лучшее, что заключено в нем, Microsoft просто-напросто скопировала у своих конкурентов — Unix, MacOS, Linux, OS/2… Но только зачем? В любом случае то, что мы видим во время сеанса работы с Windows, выглядит…

Реферат

Подробнее...

Условная энтропия. Теория информационных процессов и систем + доп. Материалы в эбс

Другой пример: сообщение, А содержит информацию о мужчине (фамилию, имя, отчество, год рождения, место рождения, образование, домашние адрес и телефон), а сообщение В содержит аналогичную информацию о женщине — супруге упомянутого мужчины. Очевидно, что сообщение В частично содержит в себе информацию А, а именно: фамилию жены, ее домашний адрес и телефон, скорее всего совпадающие с фамилией…

Реферат

Подробнее...

Отношение достижимости модулей графов

Доказательство. Предположим, вершинах, (х, е X) недостижима из Xj. Тогда х, ё X/ и множество X' = X х), непусто. Поскольку выбранный компонент графа связанный, то существуют вершина х, — е х, и цепь /7(х;, xj), ведущая от х, к х,-. Исходя из ацикличности графа G, в X' должна существовать простая цепь Н (х/, xj), где в вершину xf не входят дуги (данная цепь может быть пустой, если X' состоит…

Реферат

Подробнее...

Пожарная безопасность компьютерной лаборатории

Согласно НАПБ Б.03.001−2004 в помещении расположены первичные приспособления пожаротушения — два углекислотных огнетушителя ВВК-1, 4 из расчета 1 огнетушитель на 3 ПК, но не меньше 1 на помещение. Их использование обусловлено необходимостью тушения электроустановок, которые находятся под напряжением не более 1000 В, расположенных в помещении. Также в комнате необходим один дымовой анализатор…

Реферат

Подробнее...

Вычислительные процедуры симплекс-метода

Если в задаче максимизации все небазисные переменные вуравнении имеют неотрицательные коэффициенты, полученное пробное решение является оптимальным. Иначе в качестве новой базисной переменной следует выбрать ту, которая имеет наибольший по абсолютной величине отрицательный коэффициент. Применяя это условие к исходной таблице — переменная, включаемая в базис. Отношение, идентифицирующее…

Реферат

Подробнее...