Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Чисельне розвязання задач оптимального керування

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 9.11.2024

ЧИСЕЛЬНЕ РОЗВ’ЯЗАННЯ ЗАДАЧ оптимального керування


1 Дискретизація задачі із закріпленим лівим і вільним правим кінцем. Необхідні умови оптимальності

,(1)

,(2)

, , . (3)

Виконаємо дискретну апроксимацію даної задачі. Для цього розіб’ємо відрізок  точками ,  і будемо обчислювати значення цільового функціонала і закону руху тільки в точках розбиття: , , . Закон руху в цьому випадку можна записати у вигляді:

.

Тепер дискретна задача оптимального керування, що апроксимує неперервну задачу (1) – (3), матиме вигляд:

, , (4) 

, (5) 

(6)

, . (7)

Для пошуку оптимального розв’язку отриманої дискретної задачі може бути застосований метод множників Лагранжа. Функція Лагранжа має вигляд:

, 

,(8)

де .

Обмеження на керування введемо далі, під час реалізації чисельного методу. Відзначимо, що перед першим доданком стоїть знак «–», оскільки  і якщо не додавати «–», то характер екстремуму початкової функції зміниться.

Якщо  –локально-оптимальний процес для задачі (4) – (7), то існують такі нерівні одночасно нулю множники Лагранжа , , , , що матимуть місце наступні умови:

1.  або

,

,

. (10)

2.  або

,

. (11)

Із (9) одержимо ітераційні співвідношення для спряжених змінних , а з (10) –співвідношення для :

, (12)

.     (13)

Перепишемо співвідношення (12) у вигляді:

.

Очевидно, що останнє співвідношення є аналогом спряженої системи для неперервних задач керування. Дійсно, 

.

Якщо , то з останнього співвідношення одержимо


.

Зі співвідношення (13) випливає, що .

Сформулюємо критерій оптимальності для задачі (4) – (7). Вважатимемо, що функції ,  неперервно-диференційовані за змінними  і опуклі за . Тоді для локально-оптимального процесу  існують такі множники Лагранжа , , , , не всі рівні нулю одночасно, що матимуть місце необхідні умови екстремуму:

) умови стаціонарності в точці :

;

2) . (14)

Розпишемо (14), використовуючи вираз для функції Лагранжа:

Перетворимо вираз під знаком мінімуму, переходячи до довільного :

Або

Якщо , то з останнього співвідношення одержимо

2 Ітераційний метод розв’язання дискретної задачі оптимального керування з двійним перерахуванням

Розглянемо ітераційний метод пошуку оптимального керування задачі (4) – (7). Суть методу полягає в тому, що на кожній ітерації обчислюються два вектори:  і . Перший із них містить -е наближення для керувань у моменти часу  для системи (14), при , а другий-е наближення для фазових станів системи в ці ж моменти часу. Отже, на кожній ітерації ми одержуємо процес , що є -м наближенням до шуканого оптимального процесу.

Контроль у методі подвійного перерахування полягає в повторному перерахуванні результатів задачі і порівнянні отриманих даних для різних значень кроку розбиття. У випадку розбіжності виконується корекція і обчислення повторюються.

Розглянемо алгоритм методу.

. Задаємо крок розбиття  та точність обчислень .

. Задаємо початкове наближенняприпустимий набір керувань на кожному кроціпочаткову стратегію керування:

, , ,

де  –наближення керування в момент  на ітерації .

3. За визначеною в п. 2 стратегією керування  будуємо фазову траєкторію процесу 

, , 

на початкової ітерації , використовуючи початкові умови і різницеві співвідношення, що апроксимують рівняння руху:

, .

4. Визначаємо початкове наближення  відповідно до (5).

5. Знаходимо спряжені змінні за формулами (12) – (13).

Визначаємо наступні наближення до оптимального керування , 

в момент  як розв’язки задачі (15) або (16):

, .

7. Обчислюємо відповідну стратегії  траєкторію 

за формулами (4), (6):

, , .

8. Знаходимо наступне наближення цільового функціонала 

за формулою (5).

. Якщо , то переходимо до п. 10, інакше вважаємо, що 

, ,  і переходимо до п. 13.

і ,

то переходимо до п. 13, інакшедо п. 11.

. Позначаємо 

, , .

12. Виконуємо наступний крок ітераційного методуп. 5.

13. Позначаємо

, ,  –розв’язок, отриманий із кроком розбиття .

1 Якщо крок  не ділився, то переходимо до п. 15, інакшедо п. 1

. Ділимо крок 

. Тоді  і переходимо до п. 2 при .

і ,

то переходимо до п. 18, інакше переходимо до п. 17.

. Позначаємо 


,
 , , , і переходимо до п. 15наступного кроку подвійного перерахування.

. , ,  –розв’язок задачі.

Кінець алгоритму.

3. Оптимальне стохастичне керування: формулювання із зовнішнім інтегралом

Розглянемо відображення , що задане формулою

,   (17)

за таких припущень:

 параметр  приймає значення з вимірного простору . Для будь-якої фіксованої пари  задана ймовірнісна міра  на просторі , а символ  у формулі (12) означає зовнішній інтеграл відносно цієї міри. Отже,

;

 функції  і  відображують множину  відповідно в множини  і , тобто , ;

 скаляр  додатний.

Формули (1), (6) є окремими випадками відображення  з (12). Очевидно, що відображення (1) для детермінованої задачі випливає з (12), якщо множина  складається з єдиного елемента, а відображення (6) (для стохастичної задачі зі зліченним простором збурень) відповідає випадку, коли множина  зліченна, а  є -алгеброю, складеною із всіх підмножин .

Очевидно, що відображення  з (12) задовольняє припущенню монотонності. Якщо на множини ,  і функції ,  і  накласти вимоги вимірності, то витрати за  кроків  можна визначити в термінах звичайного інтегрування для будь-якої стратегії , для якої функції ,  вимірні.

Для початкового стану  і стратегії  ймовірнісні міри

, ..., 

у сукупності із системою рівнянь

,    (18)

визначають єдину міру  на -кратному прямому добутку  копій простору . У випадку, якщо , , і виконується одна з умов

або 

,

то функція витрат за  кроків, що відповідає вимірній стратегії , приводиться до звичайного вигляду
,

де стани ,  виражено як функції змінних , ...,  за допомогою рівнянь (13) та початкового стану .

Рекурентне співвідношення методу динамічного програмування для розв’язання багатоетапних задач оптимального стохастичного керування зі скінченним горизонтом можна записати так:

, ,

де  –щільність розподілу величини .

4 Оптимальне стохастичне керування: мультиплікативний функціонал витрат

Розглянемо відображення , що задане формулою

,    (19)

за припущення, що параметр  приймає значення зі зліченної множини  відповідно до заданого розподілу ймовірностей, що залежать від стану  і керування . Вважатимемо також, що , , , . Тоді відображення  з формули (14) задовольняє припущенню монотонності. 

Якщо , , то задача оптимального керування з мультиплікативним функціоналом витрат і скінченним горизонтом  матиме такий вигляд:

, (20)

. (21)

а відповідна задача з нескінченним горизонтом:

, (22)

.  (23)

Границя в (23) існує, якщо :  або .

Самостійний інтерес становить задача з експоненціальною функцією витрат

,

,

де .

Для розв’язання багатоетапних задач оптимального стохастичного керування з мультиплікативним функціоналом витрат використовується таке рекурентне співвідношення алгоритму динамічного програмування:

, , 

де  –щільність розподілу величини .

. Мінімаксне керування

Розглянемо задачу керування системою, у якій некерованими впливами є стратегії супротивника (або явища природи) , , що обираються залежно від поточного стану  і керування . Вважатимемо, що припустимі стратегії супротивника приймають значення із множини , . Будемо обчислювати стратегію керування , орієнтуючись на найгіршу поведінку супротивника. Розглянемо відображення , задане формулою

,

за таких припущень:

 параметр  приймає значення з деякої множини , а  –непуста підмножина  при будь-яких , ;

 функції  і  відображують множину  в множини  та  відповідно, тобто , ;

 скаляр  додатний.

За таких умов припущення про монотонність для відображення  має місце. Якщо при цьому ,  і  для всіх , , , то відповідну -крокову задачу мінімаксного керування можна сформулювати так:

, (17)

. (18)

Задача з нескінченним горизонтом формулюється аналогічно:

, (24)

.  (25)

Границя у співвідношенні (25) існує при виконанні будь-якої з умов:

  •  , , , ;
  •  , , , ;
  •  , , , ,  і деякого .

Для розв’язання багатокрокових мінімаксних задач оптимального стохастичного керування рекурентне співвідношення алгоритму динамічного програмування використовується у такому вигляді:

, , 

, 

.




1. Реферат- Конституционное право Чехии
2. Курсовая работа- Потребительские предпочтения на рынке холодильников
3. Макияж для фотосъемки 6 занятий по 34 часа.html
4. Степень специализации и маштаб производства продукции определяет тпи произвосдтва
5. Клуб Внимательных Пешеходов Конкурс игра «СВЕТОФОР»
6. 65.5 0 14.65 ПЗ 2.2 Составление схем прямой обратной и нулевой последовательностей.html
7. Литература Возрождения также внесла свой вклад в расширение представлений о реальном человеке и его реальн
8. 26 ноября 2013 г ПРОГРАММА ПРОИЗВОДСТВЕННОЙ ПРАКТИКИ ПО НАПРАВЛЕНИЮ 230700
9. Конструкторская часть3 1
10. спереди на корточках сидел денщик в нанковом сюртуке исделавшейся совершенно мягкой бывшей офицерской фур
11. КОНТРОЛЬНАЯ РАБОТА по дисциплине Маркетинг Вопросы 1237
12.  Многоугольники 2 1
13. Научная и религиозная картина мира
14. Бессознательное и архетипы как основа интертекстуальности
15. ПЁТР I КАК ПОЛИТИЧЕСКИЙ ДЕЯТЕЛЬ И ПОЛКОВОДЕЦ
16. Контрольная работа
17.  Географическое положение Канады и природные pecypcы
18. Математические понятия
19. ЛАБОРАТОРНАЯ РАБОТА1
20. Специфика рынка России с выделением положительных и отрицательных сторон3