Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

тема автоматического управления содержит следующие функциональные компоненты рис

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 6.11.2024

Структура и функциональные компоненты САУ

Схема и функциональные компоненты систем управления. Система автоматического управления содержит следующие функциональные компоненты (рис.1.9):

  •  объект (управляемый процесс);
  •  исполнительные устройства ИсУ; 
  •  измерительные устройства ИзУ; 
  •  устройство управления УУ.

Рис. 1.9. Функциональная схема САУ

Объектами технических систем служат: кинематические механизмы, электрические, химические, тепловые процессы и другие технологические процессы.

Текущее состояние объекта характеризуется переменными состояния xi=xi(t) (точное определение см. п. 3.1.1), к которым относятся физические величины:

  •  угловые и линейные координаты, скорости и другие механические переменные, описывающие движения кинематических механизмов;
  •  токи или напряжения электрических элементов схемы;
  •  температуры и плотности веществ в тепловых и химических процессах

и т.д.

Переменные состояния объединяются в вектор состояния 

x(t) = {x i} = .

К регулируемым, или выходным, переменным yj =yj(t) относятся те переменные объекта (управляемого процесса), по отношению к которым формулируется основная задача управления. Выходные переменные объединяются в вектор выхода 

y = {yj}= .


Для многозвенных кинематических механизмов вектор выхода обычно представлен декартовыми координатами рабочей точки механизма (например, схвата робота манипулятора и т.д.).

Входами объекта являются управляющие органы, к которым прикладываются воздействия Uj исполнительных устройств системы. Это - входные оси кинематических механизмов, входные схемы электрических систем, нагревательные элементы и вентили тепловых и химических процессов, к которым приложены силы или моменты сил электроприводов, электрические напряжения и т.д., вызывающе движение (развитие) управляемого процесса.

Объекты с одним входом и одним выходом ( m=1 ) называются одноканальными. Соответственно, к многоканальным относят объекты с несколькими входами и/или выходами. Последние могут иметь автономные (независимые друг от друга) каналы. Часто каналы многоканального объекта оказываются взаимозависимы и такой объект называются многосвязным .

К внешней среде системы управления относятся внешние процессы, оказывающие влияние на поведение управляемого объекта. Среда является источником следующих факторов (воздействий):

  •  помех измерения j(t ) (см. п. 1.1.1);
  •  возмущающих воздействий fj (t);
  •  внешних задающих воздействий y*(t) (см. п. 1.1.3).

К возмущающим относят воздействия, препятствующие функционированию объекта (силы сопротивления для кинематических механизмов, температура окружающей среды для тепловых процессов и т.д.). Возмущающие воздействия объединяются в вектор возмущений 

f= {fj} = .

Измерительные устройства (датчики) предназначены для получения информации об объекте и внешней среде у j , т.е. для электрического измерения переменных состояния, выходных переменных, внешних задающих воздействий и т. д.

 

Критерий оптимальности.

На этом этапе оговариваются требования, предъявляемые к качеству работы замкнутой системы. Требования задаются в обобщенном виде, а именно в виде интегрального функционала, который носит название критерия оптимальности.

 Общий вид критерия оптимальности:

,      (2.8)

Частные виды критерия оптимальности:

1) критерий оптимальности, обеспечивающий минимум времени переходного процесса (решается задача оптимального быстродействия)

;      (2.9)

2) критерий оптимальности, обеспечивающий минимум затрат энергии:

  •  по одной из компонент

;      (2.10)

  •  по всем переменным состояниям

;      (2.11)

  •  по одному управляющему воздействию

;     (2.12)

  •  по всем управляющим воздействиям

;     (2.13)

  •  по всем компонентам (в самом общем случае)

.       (2.14)

Форма результата

Необходимо оговорить в каком виде будем искать управляющее воздействие.

Возможны два варианта оптимального управления U0:

  •  u0 = u0(t) – используется при отсутствии возмущения,
  •  u0 = u0(x) – оптимальное управление в виде обратной связи (замкнутое управление).

 

Формулировка задачи синтеза оптимальной системы в общем виде:

Для объекта, описанного переменными состояниями с заданными ограничениями и  множеством начальных и конечных состояний, необходимо найти управляющее воздействие, обеспечивающее качество процессов в замкнутой системе, соответствующее критерию оптимальности.

Метод динамического программирования

Принцип оптимальности

Исходные данные:

,     xRn ,   uRm,    m ≤ n,

ui ≤ Ūi,     x(0), x(T) ,

Необходимо найти u0

 

Рис. 2.7. Фазовый портрет перехода системы из начальной точки в конечную

в пространстве состояний

Траектория перехода из начальной точки в конечную будет оптимальной и единственной.

Формулировка принципа: Конечный участок оптимальной траектории есть также оптимальная траектория.

Если бы переход из промежуточной точки в конечную не осуществлялся бы по оптимальной траектории, то для него можно было бы найти свою оптимальную траекторию. Но в этом случае переход из начальной точки в конечную проходил бы по другой траектории, которая должна была бы быть оптимальной, а это невозможно, так как оптимальная траектория единственная.

Основное уравнение Беллмана.

Рассмотрим объект управления произвольного вида

,     xRn ,   uRm,    m ≤ n,

Необходимо обеспечить переход из начальной точки в конечную с критерием оптимальности

.     (2.16)

Рассмотрим переход в пространстве состояний

Рис. 2.8. Фазовый портрет перехода системы из начальной точки в конечную x(t) – текущая (начальная) точка, x(t+Δt) – промежуточная точка.

Выберем промежуточную точку и рассмотрим поэтапный переход

(2.17)

Преобразуем выражение

          (2.18)

Заменим второй интеграл на V(x(t+Δt))

        (2.19)

1)При малом значении Δt введем допущения:

 (2.20)

2) Разложим вспомогательную функцию

,               (2.21)

          (2.22)

Выполняя дальнейшие преобразования, получим

,      (2.23)

где min V(x(t)) и есть критерий оптимальности J

В результате получили

.               (2.24)

Разделим обе части выражения на Δt и устраним Δt к нулю.

,              (2.25)

где

Получим основное уравнение Беллмана

                        (2.26)

Расчетные соотношения метода динамического программирования

Основное уравнение Белмана содержит (m+1) - неизвестных величин, т.к. U0Rm , VR1

(2.27)

 

Продифференцировав m раз, получим систему из (m+1) уравнений.

Для ограниченного круга объектов решение полученной системы уравнений дает точное оптимальное управление. Такая задача носит название задачи АКОР (аналитического конструирования оптимальных регуляторов).

Объекты, для которых рассматривается задача АКОР, должны удовлетворять следующим требованиям:

1)     

  1.  T   ,
  2.  Критерий оптимальности должен быть квадратичным

.

Пример 2.2

Для объекта, описываемого уравнением

,

необходимо обеспечить переход из x(0) в x(T) по критерию оптимальности

,

U1= 5x,

U2= -6x

Проанализировав объект на устойчивость, получим U0 = U2 = -6x.

Принцип максимума Понтрягина

          (2.28)

или

       (2.29)

Введем расширенный вектор состояний, который расширяем за счет нулевой компоненты, в качестве которой выбираем критерий оптимальности. zRn+1

.      (2.30)

Также введем расширенный вектор правых частей, который расширяем за счет функции, стоящей под интегралом в критерии оптимальности.

       (2.31)

Введем Ψ – вектор сопряженных координат

 (2.32)

Сформируем Гамильтониан, представляющий собой скалярное произведение Ψ и φ(z,u)

H(Ψ,z,u) = Ψ•φ(z,u),    (2.33)

  (2.34)

Уравнение (2.34) называется основным уравнением принципа максимума Понтрягина, основанное на уравнении  динамического программирования

Оптимальным является управление, которое на заданном интервале времени доставляет максимум Гамильтониана. Если бы ресурс управления не был бы ограничен, то для определения оптимального управления можно было бы воспользоваться необходимыми и достаточными условиями экстремума. В реальной ситуации для отыскания оптимального управления необходимо анализировать величину Гамильтониана при предельном значении уровня. В этом случае U0 будет функцией расширенного вектора состояний и вектора сопряженных координат

u0 = u0(z, Ψ)

Для отыскания сопряженных координат необходимо решить систему уравнений

.

Процедура расчета системы по принципу максимума Понтрягина.

  1.  Уравнения объекта должны быть приведены к виду, стандартному для синтеза оптимальных систем.

,       xRn,   uRm,   m≤n

Необходимо оговорить также начальные и конечные состояния и записать критерий оптимальности

. (2.35)

  1.  Вводятся расширенный вектор состояний

 ,    (2.36)

расширенный вектор правых частей

    (2.37)

и вектор сопряженных координат

.  (2.38)

  1.  Записываем Гамильтониан как скалярное произведение

H(Ψ,z,u) = Ψ•φ(z,u),   (2.39)

  1.  Находим максимум Гамильтониана по u

, (2.40)

по которому определяем оптимальное управление  u0(Ψ,z).

  1.  Записываем дифференциальные уравнения для вектора сопряженных координат

.       (2.41)

Находим сопряженные координаты как функцию времени

Ψ= Ψ(t).         (2.42)

6. Определяем окончательный оптимальный закон управления

u0= u0(t) .       (2.43)

Как правило, этот способ позволяет получить программный закон управления.

Пример 2.3.

Для объекта, представленного на рис. 2. 9. необходимо обеспечить переход из начальной точки y(t) в конечную y(t) за T= 1c с качеством  процесса

     U  y                                   

Рис. 2.9. Модель объекта

  1.  W(p)=y/U = 1/p2

  1.  

, , .

3.

H(Ψ,Z,U) = Ψ0u2 + Ψ1x2 + Ψ3u.

  1.  

,

u0= - Ψ2/2 Ψ0.

5.  

6.                     

Для определения констант b1 и b2 нужно решить краевую задачу. Запишем уравнение замкнутой системы

Проинтегрируем

Рассмотрим конечную точку  t=T=1с.

 

 

Получили систему уравнений, из которой находим b2 = 6, b1 = -12.

Запишем закон управления u0= -12t + 6.

Задача оптимального управления

,      xRn,    uRm,    m≤n

Для объекта общего вида необходимо обеспечить переход из начальной точки в конечную за минимальное время при ограниченном законе управления.

          .       (2.44)

Особенности задачи оптимального быстродействия

  1.  Гамильтониан быстродействия.

H = Ψφ = Ψ0▪1 + Ψ1f1(x,u) +…+ Ψnfn(x,u),       (2.45)

Ψ0=-1.         (2.46)

H = -1 + Ψ1▪f1(x,u) +…+ Ψn▪fn(x,u),        (2.47)

Hб = Ψ1▪f1(x,u) +…+ Ψn▪fn(x,u) =▪f(x,u)       (2.48)

=[Ψ1,…, Ψn]             (2.49)

.        (2.50)

  1.  Релейность управления.

Эта особенность имеет место для релейных объектов.

, xRn,       uRm,    m≤n,

Hб = ▪(Ax+Bu);

  1.  Теорема о числе переключений управляющего воздействия.

Эта теорема справедлива для линейных моделей с вещественными корнями характеристического уравнения.

det(pI-A)=0                (2.51)

 

Λ(A) – вектор вещественных собственных чисел.

Формулировка теоремы:

В задаче оптимального быстродействия с вещественными корнями характеристического уравнения число переключений не может быть больше, чем (n-1), где n – порядок объекта, следовательно, число интервалов постоянства управления не будет больше, чем (n-1).

Рис. 2.10. Вид управляющего воздействия при n=3.

Пример2.4

.

пример решения задачи оптимального быстродействия:

,  ,            T0=1

,  

  1.  

.

  1.  Ψ=[Ψ1, Ψ2].

  1.  Hб= Ψ1x2+ Ψ2( -2dx2 –x1+u).

  1.  

  1.  

,

,

.

Классический метод вариационного исчисления

    Задачи синтеза алгоритмов оптимального управления объектами в динамике при выбранном функционале критерия качества [см. (1.37)] имеют дополнительные (условные) ограничения в виде уравнений математической модели динамики объекта. Экстремум функционала, определяемый при дополнительных условиях (функциональных ограничениях), называют условным экстремумом. Задачи на условный экстремум при определении оптимальных управлений объектом в динамике обусловлены тем, что функции  и , входящие в функционал, не могут варьироваться независимо, так как они связаны уравнением динамики объекта. Траектория выходаявляется следствием изменения координаты управления и зависит от вида дифференциального уравнения объекта.

    Таким образом, задача об оптимизации объекта управления в динамике, решаемая классическим вариационным исчислением, имеет следующую формулировку. Задана математическая модель объекта в форме уравнений состояния, представленная при одной координате управления векторным уравнением

  (3.64)

    Требуется определить оптимальное управление , обеспечивающее минимум функционала

.   (3.65)

в котором  и  связаны уравнениями состояния (3.64), а функция  является непрерывной по всем переменным и имеет непрерывные частные производные первых двух порядков. Функции и  должны быть непрерывными и иметь непрерывные первые производные (i=1,2,…,n). Векторы и  фиксированы.

    Первые задачи на условный экстремум были поставлены и решены основоположниками классического вариационного исчисления Бернулли, Эйлером и Лагранжем. Задачу, определяемую дифференциальными связями типа (3.64) и функционалом (3.65), называют общей задачей Лагранжа. Если функционал характеризует конечное состояние  , то имеем задачу Майера, а если  - задачу Больца. Для решения общей задачи Лагранжа используют метод множителей Лагранжа, аналогичный изложенному при определении экстремума функций (см. § 3.1).

    При решении задачи на условный экстремум рассматривают вспомогательный функционал

,   (3.66)

гдестрока множителей Лагранжа;

  (3.67)

    Функцию  называют функцией Лагранжа, а функцию функцией связей, которая определяется исходными уравнениями (3.64):

  (3.68)

или

где

.

    Задачу на безусловный экстремум решают для вспомогательного функционала (3.66). Уравнения Эйлера при этом составляют для функции Лагранжа (i = 1, 2, ..., п):

  (3.69)

    Эти уравнения называют уравнениями Эйлера Лагранжа; они характеризуют условие стационарности функционала (3.66). В результате решения уравнений (3.69) с учетом уравнений (3.64) получим оптимальное управление объектом в динамике.

    Уравнения (3.64) и (3.69) являются уравнениями вариационной задачи, порядок которых после исключения координаты управления равен 2п. При решении этих уравнений относительно векторов X и  для заданных  и рассматривается двухточечная краевая задача. Сложность решения ее обусловлена тем, что начальные значения множителей Лагранжа неизвестны. Чтобы удовлетворить заданным значениям векторов состояния и, приходится многократно решать уравнения вариационной задачи, задаваясь различными начальными значениями.

    При определении оптимального управления классическим методом вариационного исчисления уравнения вариационной задачи могут быть записаны в гамильтоновой или канонической форме. Пусть функционал в частном случае зависит от переменных  и, а также их производных  и :

.   (3.70)

    Запишем для него уравнения Эйлера типа (3.60):

  (3.71)

От переменных и перейдем к новым переменным  и  согласно выражениям ;,   (3.72)

 а от функции F к новой функции

В общем случае, при п переменных выражение для функции Н запишем в векторной форме:

  (3.73)

где функцию H называют функцией Гамильтона, а переменныеканоническими переменными.

Дифференцируя (3.73), получаем

    (3.74)

На основании уравнений Эйлера и (3.72) запишем

При этом вместо (3.74) получим новую систему дифференциальных уравнений, которые называют каноническими уравнениями Гамильтона:

      (3.75)

    Второе уравнение (3.75) эквивалентно первоначальному уравнению Эйлера и является его новой математической формулировкой. 

    Для общей задачи Лагранжа на основании (3.67), (3.68) и (3.72) при записи (3.65) через переменные состояния получим

  (3.76)

т. е. канонические переменные равны множителям Лагранжа. При этом

  (3.77)

    Таким образом, дифференциальные уравнения Эйлера—Лагранжа (3.69) и уравнения (3.64) можно представить системой канонических дифференциальных уравнений первого порядка (i=1,2, ..., п):

  (3.78)

    Уравнения (3.78) являются уравнениями вариационной задачи, которые необходимо дополнить вторым уравнением (условие стационарности функционала  по координате управления) из системы (3.69):

  (3.79)

В результате решения уравнений (3.78) и (3.79) получим оптимальное управление объектом в динамике.

В общем случае при нескольких координатах управления  в уравнениях (3.64) и функционала (3.65) вместо и (t) будут векторы , поэтому вместо второго уравнения в (3.69) запишем

,  (3.80)

т.е. система (3.69) будет состоять из (n+r) дифференциальных уравнений Эйпера-Лагранжa.

Пример 3.1. Определим оптимальное управление объектом, заданным уравнением

  (3.81)

или

  (3.82)

где Т и k постоянная времени и коэффициент усиления объекта;

= — 1/T; == k/T ;         >0 и >0 — весовые коэффициенты;

в процессе перехода объекта из фиксированного начального  в фиксированное конечное состояние при условии минимума функционала :

  (3.83)

    Составим функцию Лагрпнжа [см. (3.67)]

Используя (3,69), запишем уравнения вариационной задачи

  (3.84)

Из последнего уравнения определим

  (3.85)

    Подставив (3.85) в первое уравнение (3.84), получим систему уравнений

  (3.86)

    Чтобы определить корпи системы (3.86), составим определитель и приравняем его нулю:

откуда

Условиям устойчивости и  удовлетворяет отрицательный корень , поэтому решение системы (3.86) имеет вид:

  (3.87)

где и постоянные интегрирования: , а .

Значение  известно, так как   задано, а значение   в данном (простейшем) случае можно определить из (3.86) и (3.87). Подставив (3.87) в (3.86), запишем

После сокращений и преобразований получим

      или    

   Следовательно, искомое оптимальное управление

  (3.88)

Оптимальное управление (3.88) зависит от постоянной , которая определяется заданным начальным значением  и имеет такой же закон изменения, как и выходная координата объекта  у(t). Поэтому с учетом (3.87) вместо (3.88) запишем

  (3.89)

где

  (3.90)

Подставив значения   в выражение (3.90), найдем оптимальное значение.

Уравнение (3.89) определяет структуру оптимального регулятора для заданного объекта управления [см. (3.82)] и выбранного функционала (3.83). Минимум (3.83) гарантирует минимальные отклонения у(t)  и u(t) в период переходного процесса.

    При решении задач оптимизации объектов методом классического вариационного исчисления предполагается, что искомые функции оптимальных процессов являются непрерывными и на координаты выхода и управлений не наложено ограничений. Между тем управление и фазовые координаты имеют ограничения в виде неравенств. Иногда с помощью искусственных приемов эти неравенства удается заменить равенствами [13]. Однако если исключить ограничения и рассматривать открытое множество управлений, то для многих задач будет получен ответ, что оптимальных управлений не существует. Поэтому уравнения Эйлера наиболее целесообразно применять для решения задач, в которых на координаты не наложены ограничения, а также при нелинейных (например, квадратичных) функционалах и уравнениях связи, когда дифференциальные уравнения вариационной задачи получаются линейными.

Метод динамического программирования Р. Беллмана.

    В технике существует класс объектов и процессов, управление которыми осуществляется на основе ограниченного числа решений, принимаемых последовательно в некоторые фиксированные моменты времени. Для решения задач оптимизации таких объектов американским ученым Р. Беллманом предложен метод, названный динамическим программированием.

    В основу динамического программирования положен принцип оптимальности. Согласно ему оптимальное управление определяется конечной целью управления и состоянием системы в рассматриваемый момент времени независимо от того, каким образом система пришла в это состояние, т. е. оптимальное управление не зависит от предыстории системы. Это значит, что для любой оптимальной траектории каждый участок, связывающий любую промежуточную точку этой траектории с конечной, также является оптимальной траекторией.

    Задачей оптимизации считается определение оптимальных управлений  и траектории  из условия минимума (максимума) функционала

  (3,91)

для заданных уравнений состояния объекта

  (3.92)

а также начальных и конечных фиксированных значений и  и интервала при наличии ограничений вида и  .  Здесь и заданные допустимые области для координат состояния и управлений.

При этом вводится вспомогательная функция Беллмана

  (3.93)

Минимум функционала (3.91) при условиях (3.92) зависит от момента времени , значения и конечного момента времени Т :

  (3.94)

где произвольный промежуточный момент времени в интервале ;   вектор координат состояния в момент времени .

  Пусть t фиксированный момент времени, малое положительное число(). Тогда с учетом (3.94) вспомогательная функция

  (3.95)

Соответственно полученным из (3.95) величинам  по уравнениям (3.92) определяем оптимальные траектории вектора выхода. При решении задач оптимизации объектов методом динамического программирования используют функциональные уравнения Беллмана в частных производных либо численные методы,

Уравнение Беллмана и его применение для синтеза оптимальных систем.

Первое слагаемое в правой части выражения (3.95) с точностью до малых величин более высокого порядка, чем , можно заменить приближенным значением

.   (3.96)

    Второе слагаемое в правой части выражения (3.95), определяющее значение функции для любого момента времени , разложим в ряд Тейлора. Ограничиваясь линейными членами относительно приращений ии переходя к пределу, заменим это слагаемое приближенным значением, если функция S(t,X) имеет непрерывные частные производные по всем t и :

  (3.97)

    На основании (3.95), (3.96) и (3.97) запишем

откуда после деления на   всех членов и перехода к пределу при получим нелинейное дифференциальное уравнение Беллмана в частных производных относительно неизвестной функции S(t,X):

  (3.98)

при условиях

  (3.99)

    Оптимальное управление  найдем в результате решения уравнения (3.98). Если координата управления ограничена ,то для внутренней точки области, определяемой множеством , условие (3.98) можно заменить функциональными уравнениями в частных производных:

  (3.100)

Если S не зависит явно от времени, то . В этом случае при решении уравнений (3.100) для квадратичных функций F(...) функционала (3.91) и . А. М. Лётовым [7] предложено искать вспомогательную функцию в виде квадратичной формы, дифференцируемой по всем координатам :

  (3.101)

    Для линейных объектов функция S(X) является функцией Ляпунова при . В результате решения (3.100) с учетом (3.101) найдем оптимальное управление в функции координат вектора состояния , которое обеспечивает устойчивые процессы.

Пример 3.2. Определим оптимальное управление объектом, заданным уравнением (3.82) из условия минимума функционала (3.83) по уравнениям (3.100). Вспомогательную функцию зададим в виде

  (3.102)

Для данного случая на основании (3.100) запишем функциональные уравнения Беллмана:

  (3.103)

откуда

  (3.104)

или с учетом (3.102)

  (3.105)

где    

     Оптимальное управление (3.105) совпадает с управлением (3.89), полученным классическим вариационным исчислением.

Для определения  найдем производную  из (3.102) и подставим в первое уравнение (3.103) и (3.104):

или  

откуда

Подставив значение  в выражение для  , получим выражение

совпадающее с (3.90).

    

Численное решение уравнений динамического программирования. 

Уравнение (3.98) и соответствующие ему уравнения (3.100) не всегда удается решить аналитически. Поэтому применяют численное решение в виде многошагового процесса, являющееся приближенным. При этом обычно используется ЦВМ.

Для этого заменяют исходные уравнения объекта (3.92) конечно-разностными уравнениями:

  (3.106)

где k = 1, 2, ..., N; N — число принятых расчетных интервалов (шагов).

    На основании (3.96) функционал

  (3.107)

На каждом из временных  интервалов управление  сохраняет неизменное значение, принятое в начале интервала. Если найденные значения управлений на каждом интервале , такие, что  и обеспечен минимум функционала (3.107) и , то полученное управление является оптимальным.

При численном решении задачи оптимизации участки процесса рассматривают в последовательности, обратной их номеру, т. е. от конца процесса к началу.

    Рассмотрим начало последнего участка процесса, т. е. момент времени . Ему соответствуют значения координат . Согласно принципу оптимальности необходимо, чтобы было выбрано оптимальное управление на последнем интервале , переводящее объект из состояния  в состояние . Выбор значения  влияет лишь на последний член суммы (3.107)

  (3.108)

     Выберем такое , чтобы обеспечивался минимум (3.108). При этом на основании (3.93) получим

  (3.109)

    В результате на первом шаге назад (последнем интервале) определим значения  и , которые передаются в запоминающее устройство ЦВМ или записываются в виде таблицы.

    Перейдем к предпоследнему интервалу N—2 (второму шагу назад), т. е. рассмотрим начало момента времени . Этому интервалу соответствуют значения координат . Выберем оптимальное значение  из условия минимума двух последних членов суммы (3.107) с учетом того, что  уже известно. При этом

  (3.110)

Так как соответственно (3.106)

то вместо (3.110) запишем

  (3.111)

    На предпоследнем интервале (втором шаге назад) получены значения и , которые передаются в запоминающее устройство ЦВМ.

    Таким образом, все расчеты проводят аналогично указанным «шаг за шагом назад», начиная с последнего интервала [см. (3.109)] и кончая первым интервалом (k=1), по следующим рекуррентным соотношениям (k = N — 1, N — 2, ..., 2, 1):

  (3.112)

   В результате получим значения,  по которым можно построить приближенную оптимальную траекторию   и найти приближенное оптимальное управление . Таким образом, в результате решения задачи численным методом получим квазиоптимальное управление. При таком расчете учитываются ограничения, и недопустимые варианты управлений  исключаются.

    Кроме указанного обратного решения задачи «шаг за шагом назад» можно применить прямое решение по следующим рекуррентным соотношениям (k = 1, 2, ..., N — 1):

  (3.112a)

    Следует, однако, отметить, что при высоком порядке уравнений объекта и нескольких координатах управлений объем вычислений численным методом оказывается очень большим.

    Область целесообразного использования. Метод динамического программирования успешно применяют для оптимизации дискретных систем. При введении дискретного времени вариационную задачу оптимизации удается свести к N простым задачам минимизации (максимизации) функций малого числа переменных (управлений). При этом принимают, что внутри каждого интервала управление и координаты объекта не меняются, т. е. используют такой же подход, как и в импульсных системах.

     При оптимизации объектов с непрерывными процессами требуется, чтобы вспомогательная функция S(t,X) была дифференцируемой во всех точках фазового пространства. Это требование не выполняется при предельных значениях координат . Трудность решения функциональных уравнений Беллмана обусловлена также тем, что функция S(t,X)  заранее неизвестна и уравнения (3.100) содержат частные производные. Однако если удается свести задачу синтеза к решению уравнений (3.100) при вспомогательной функции типа (3.101), то решение задачи синтеза может быть значительно упрощено. В примере 3.2 показано, что для определения  производилось решение нелинейного алгебраического уравнения вместо интегрирования дифференциальных уравнений   (см. пример 3.1).

    При численном решении уравнения (3.98) можно учитывать ограничения, наложенные на координаты управлений и выхода объекта, а недопустимые управления исключать из решения.

    Общего способа определения S(t,X) в явной аналитической форме пока не существует, поэтому каждая задача требует особого исследования. В задачах с квадратичными функционалами для стационарных линейных объектов функция S(X)  является функцией Ляпунова.

Принцип максимума Л. С. Понтрягина

    В ряде практических задач оптимизации объектов управления экстремум функционала (3.91) при заданных уравнениях объекта (3.92) обеспечивается при управлении u(t), имеющем разрывы первого рода. При этом координаты также имеют разрывы, положение и число которых заранее неизвестны. Эти обстоятельства затрудняют применение классического вариационного исчисления для некоторых задач оптимизации, которые могут быть решены методом, разработанным коллективом советских ученых под руководством акад. Л. С. Понтрягина и названным принципом максимума.

    Задачей оптимизации является определение оптимальных управлений  и траектории  из условия минимума функционала (3.91) для заданных уравнений объекта (3.92) при начальных  и конечных  значениях, заданном интервале времени  с учетом ограничений вида  и .

    Функции управления  допускают разрывы первого рода (см. кривую 1 на рис. 3.6). Так как координаты выхода  не являются гладкими, то канонические уравнения (3.78) и (3.80) при введенных множителях Лагранжа (3.76) и функции Гамильтона (3.77) не могут быть непосредственно применены для определения оптимальных управлений. Объясняется это тем, что из-за разрывов первого рода вариация функции  может быть большой, следовательно, большой будет и вариация функционала. В результате этого в выражении (3.56) уже нельзя ограничиваться только линейными относительно вариаций функций  и  членами, а следует учитывать также нелинейные члены. В связи с этим было введено понятие игольчатой вариации [12].

    Игольчатая вариация представляет собой приращение варьируемой функции оптимального управления  на бесконечно малом отрезке времени  в виде импульса ограниченной величины (см. кривую 4 на рис. 3.6) с учетом . Влияние такой вариации на последующее движение объекта управления в интервале  бесконечно мало, поскольку влияние любого импульса оценивается величиной его площади , которая в данном случае бесконечно мала. Следовательно, приращение функционала при игольчатой вариации управления будет бесконечно малым. Оно обращается в нуль, т. е. выполняется условие экстремума (3.58) функционала (3.54), когда игольчатая вариация производится относительно оптимального управления .

Основные уравнения и их применение для синтеза оптимальных систем.

Рассмотрим кратко сущность принципа максимума. Пусть математическая модель объекта оптимизации задана в виде уравнений состояния

  (3.113)

где i= 1, 2, ..., n; r количество координат управления.

   Уравнение (3.113) можно представить в векторной форме

(3.114)

Сигналы управления могут иметь ограничения для всех координат .

Зададимся некоторой функцией и будем считать, что цель управления объектом будет достигнута, если изображающая точка из начального положения  координатами  в n-мерном фазовом пространстве переместится в положение  с координатами .

    При оптимизации объекта требуется найти вектор управляющего воздействия u(t)с учетом указанных ограничений из условия минимума функционала

  (3.115)

Сначала рассмотрим задачу при одной координате управления (r = 1) в пространстве (п +1) координат, введя дополнительную переменную , определяемую уравнением

(3.116)

     При этом для вывода принципа максимума используем игольчатую вариацию.

    Если управляющему воздействию и° (t) соответствует оптимальное движение объекта , то после игольчатой вариации дальнейшее движение X(t) будет отличаться от оптимального. Разность между ними в момент , определяется разностью скоростей

  (3.117)

    Эта разность бесконечно мала, так как бесконечно малая величина. Поэтому для интервала  введем вектор вариации траектории

Закон изменения вариации, являющейся бесконечно малой величиной, может быть найден из уравнений, записанных для малых изменений X(t), которые называют уравнениями в вариациях. Эти уравнения можно получить из (3.113) или (3.114), если заменить  на , а затем после разложения  в ряд по степеням  отбросить члены высших порядков малости. Далее вычтем уравнение вида (3.113) и получим линейное уравнение в вариациях

,   (3.118)

где j = 0, 1, 2..., п.

    Вектор вариаций при t = Т характеризует изменение критерия оптимальности . Для любых неоптимальных управлений и(t) эта величина определяется скалярным произведением вектора вариаций  и вспомогательного вектора и является отрицательной:

(3.119)

    Уравнение (3.119) позволяет найти  в зависимости от начального условия , определяемого значением  .

    Если подобрать такой (п + 1)-мерный вектор, который при  удовлетворяет условию

т   (3.120)

где

то вместо принятой в классическом вариационном исчислении функции Гамильтона (3.77) можно составить функцию Гамильтона для неклассических вариационных задач:

  (3.121)

    Эта функция достигает максимума при оптимальном управлении и° (t) , откуда следует принцип максимума: нужно так подобрать , чтобы величина Н* достигала максимального значения. При этом можно записать (для открытого множества )

дН*/ди=0.   (3.122)

Используя выражение (3.121) и уравнения объекта управления (3.113) с учетом (3.116), можно составить аналогично уравнениям (3.81) канонические уравнения Гамильтона для неклассических вариационных задач:

(3.123)

где i = 0, 1, 2, ...,n.

Уравнения (3.123) при r координатах управления дополняются уравнениями

(3.124)

    Пусть существует допустимое управление и , то соответствующая ему фазовая траектория проходит через фиксированные начальную и конечную X (T) точки. Тогда и° (t)  определяется по теореме Л. С. Понтрягина [12]:

для того чтобы управление u(t) было оптимальным, необходимо существование такой ненулевой вектор – функции , соответствующей в силу уравнений (3.123) функциям и u(t) и X(t), чтобы:

1) при  [функция Н* достигла максимума при и° (t)

  (3.125)

2) в конечный момент времени t = Т выполнялись бы соотношения

  (3.126)

    В большинстве случаев в (3.126) можно принять .

    Для задач с ограниченными фазовыми координатами и нефиксированными  и X (T)  формулировка принципа максимума является более сложной и дополняется условиями трансверсальности [12].

    При решении задач но принципу максимума составляют функцию типа (3.121), записывают уравнения (3.123) и (3.124), из которых находят оптимальные управления и° (t)  или и° (T). Принцип максимума не дает непосредственного решения задачи оптимизации, а сводит ее к стандартной задаче решения дифференциальных уравнений в (2 п + r + 2) -мерном пространстве.

    В общем случае правые части уравнений (3.113) и подынтегральная функция (3.115) могут явно зависеть от времени:

 (3.127)

    Вводя дополнительную переменную , определяемую уравнением  с начальным условием , заменим исходные уравнения объекта расширенной системой с учетом (3.116)

   (3.128)

для которой применим принцип максимума, сформулированный для автономных систем [12].

Пример 3.3. Определим оптимальное управление объектом, заданным уравнением (3.82), из условия минимума функционала (3.83) при фиксированных  и .

Запишем систему исходных уравнений

  (3.129)

    Составим функцию Гамильтона для неклассической вариационной задачи

  (3.130)

где вспомогательные функции , на основании(3.123) определяются уравнениями:

  (3.131)

    В соответствии с (3.124) из уравнения

при  получим оптимальное управление

  (3.132)

    Значение переменной  определяется с учетом и (3.132) уравнениями:      (3.133)

Система уравнений (3.133) подобна системе (3.86), поэтому решение ее дает значение

Подставив его и (3.132), получим оптимальное управление

  (3.134)

где с определяется выражением, аналогичным (3.90).

    При оптимизации объектов управления из условия минимума времени переходного процесса (максимальное быстродействие) в функционале (3.115) принимают , поэтому с учетом  функция Н* вместо (3.121) будет определяться выражением

   (3.135)

где                    (3.135)

    В связи с этим при решении задач синтеза оптимальных по быстродействию систем соотношение (3.126) принимает вид

  (3.136)

    Оптимальное управление с учетом ограничения координат определяется из условия максимума функции (3.135) и для линейных объектов может быть записано в виде [12]

где  - матрица-столбец;

  дН/ди;

     Полученный закон управления (3.137) является релейным. Примеры определения оптимальных управлений типа (3.137) будут рассмотрены в гл. 5.

   

Область целесообразного использования.

Особенностью принципа максимума является то, что вариационная задача нахождения управления как функции времени , обеспечивающей экстремум заданного функционала J, сведена к более простой задаче определения , доставляющего максимум функции Гамильтона H(u). Отсюда и название метода принцип максимума.

     Для задач, в которых на класс искомых экстремалей не наложены ограничения, принцип максимума дает те же результаты, что и метод классического вариационного исчисления. Однако в отличие от классического вариационного исчисления принцип максимума позволяет проще находить экстремали в виде кусочно-непрерывных (разрывных) функций и учитывать наличие ограничений координат [12, 13].

     Наиболее широко принцип максимума применяют при синтезе оптимальных управлений в задачах максимального быстродействия и наличии ограничений координат управления . Таким образом, принцип максимума имеет ряд преимуществ перед классическим методом вариационного исчисления.

                          Оптимальное управление

       Классификация задач оптимального управления

    В общем случае задачу управления нельзя ограничивать только достижением некоторого значения вектора состояния . Может оказаться, что в таком строгом достижении этого состояния и нет необходимости: важно, чтобы состояние динамической системы не вышло из некоторой области, определяющей многообразие допустимых значений вектора состояния. Естественно, каждому заданному закону управления соответствует закон изменения координат вектора состояния, то есть траектория “движения” управляемого объекта в фазовом пространстве. Зачастую процесс управления осуществляется с “ограниченными ресурсами”, то есть закон управления не может быть произвольным, а должен выбираться из некоторого множества Ω. Математически задача оптимального управления может быть сформулирована так. Дан управляемый динамический объект, вектор состояния которого подчиняется системе уравнений (7.1)

   Информацию о текущем векторе состояния x(t )  мы получаем из наблюдений

z =f(x) .

    Закон управления u(t) определяется с помощью процедуры минимизации функционала вида

Q(x, z, u; t)=min.

Этот функционал и определяет цель управления.

    Пусть x(t0)  дано. Задача формулируется так, что окрестность x(t1)  достигается за некоторый фиксированный отрезок времени T=t1t0 . Тогда задачу относят к типу задач с фиксированным временем и свободным концом траектории.

    Другая постановка. Конец траектории строго фиксирован, то есть x(t1) задано. Требуется найти такое управление и, которое сообщает динамическому объекту траекторию, минимизирующую функционал Q. Время перехода от начального состояния к конечному не фиксировано. Тогда это задача  с закрепленными концами фазовой траектории и свободным временем.

В частном случае, взяв в качестве функционала время T, получим задачу на максимальное быстродействие.

Например, задача управления состоит в том, чтобы перевести космический аппарат с одной круговой орбиты на другую, тоже круговую, но более высокую. Такой перевод может быть осуществлен с помощью двух импульсов управления. Если высота новой орбиты задана, то время такого перевода не фиксировано. Имеем задачу со свободным временем и закрепленными концами.

Второй вариант – запуск искусственного спутника Луны. С круговой орбиты около Земли космический аппарат с помощью импульса переводится на орбиту, вытянутую в сторону Луны. По достижении космическим аппаратом окрестности Луны необходимо скорректировать орбиту и превратить ее в круговую около Луны. Эту коррекцию можно выполнить различными способами. Возникает задача: как сэкономить топливо? Здесь концы траектории не закреплены, а ведется поиск закона управления с минимальной энергией, решающего задачу достижения результата за ограниченное допустимое время.

Минимизация функционала – классическая задача вариационного исчисления. В разных прикладных задачах те или иные преимущества имеют:

а) метод динамического программирования Р. Беллмана,

б) метод, основанный на “принципе максимума” Л. Понтрягина.

Последний – более распространен в небесной механике и астродинамике.

Принцип максимума

Запишем систему дифференциальных уравнений – математическую модель управляемого динамического объекта (ограничимся автономными системами)

Компоненты вектора управления   нужно выбрать так, чтобы минимизировать функционал  , который запишем в виде

    Введем  -ю компоненту вектора состояния x следующим образом

так что

Очевидно, что начальные условия для компоненты   имеют вид  

, а цель управления  . Теперь расширенная

система уравнений имеет вид

,

где

Пусть    и   – оптимальное управление и оптимальная траектория.

Тогда для любого, мало отличающегося от оптимального процесса

можно написать уравнение в вариациях

и сопряженную систему

Заметим, что   – квадратная матрица.

Определим функцию Понтрягина (расширенную функцию Гамильтона)

Теперь нашу систему можно записать в канонической форме

 

ибо

Л.С. Понтрягиным доказано, что оптимальное управление   достигается при максимуме функции  

Сформулируем теперь принцип максимума так, как он изложен в книге Я.Н. Ройтенберга “Автоматическое управление”.

Пусть   – такое допустимое управление, что соответствующая ему траектория  , исходящая в момент   из точки , проходит в момент через точку  Для оптимальности управления   и траектории  необходимо существование такой ненулевой непрерывной вектор-функции   что

-– для любого момента  , являющегося точкой непрерывности управления , если канонические уравнения удовлетворены, функция   переменной   достигает в точке   максимума;

- – в конечный момент  выполнены соотношения

Замечание: в любой момент  , если канонические уравнения удовлетворены.

Пример1. “Мягкая посадка”.

В начале главы мы описали задачу “мягкой посадки” на поверхность планеты. Пренебрежем влиянием атмосферы (допустим, что это поверхность Луны), кроме того не будем учитывать зависимость силы тяжести от высоты. Тогда уравнения, связывающие высоту  h над поверхностью, вертикальную скорость  v и массу m, имеют вид

где  μ – скорость истечения газов относительно ракеты,   – “тяга”. Примем, что в начальный момент   ракета имела высоту  и скорость  . В момент посадки   и высота, и скорость должны быть нулевыми:  . Определим оптимальной управление ракетой при условии наименьшего расхода топлива

Введем стандартные обозначения   и, как это требуется в методе Понтрягина, дополнительную координату  =,, причем    Управлением является    –  величина, пропорциональная скорости изменения массы ракеты. Итак, уравнения имеют вид:

    Построим функцию Понтрягина

где   – переменные сопряженной системы

Таким образом, функция Понтрягина – линейная функция относительно  u. Максимального значения она достигает лишь на границе области определения. Остается выяснить, как ведет себя множитель, стоящий перед  u,

Рассмотрим производную

Поскольку    в нуль не обращается (), этот множитель изменяется монотонно, не имеет ни максимума, ни минимума.

Как правило, режим работы двигателя следующий: если он включен, то тяга постоянна и равна  , если выключен – тяга равна нулю. Поэтому   имеет максимальное значение при  

Задача оптимального управления мягкой посадкой, таким образом, сводится к определению момента включения двигателя    и момента посадки  

Чтобы эти моменты определить, проинтегрируем дифференциальные уравнения.

При   имеем.

На следующем отрезке времени   получим

Возьмем интеграл, для чего воспользуемся равенством

Отсюда

Краевое условие   приводит к следующим трансцендентным уравнениям, определяющим    и  :

где

Итак, чтобы совершить мягкую посадку, необходимо на космическом корабле иметь измерительные устройства, дающие информацию о высоте, скорости и массе. Вычислительное устройство по заданным параметрам    и   находит момент включения двигателя.

Пример 2. Ориентация космического аппарата

Рассмотрим задачу на управление ориентацией космического аппарата (КА). Для упрощения мы будем рассматривать лишь плоский вариант: поворот КА производится лишь в одной плоскости за счёт вращения маховика установленного внутри КА. На вал маховика подаётся вращательный момент М , который сообщает ему угловое ускорение . Таким образом   где момент инерции маховика. Согласно закону сохранения кинетического момента  КА

              гдемомент инерции КА, - угол ориентации . Из последнего равенства следует, что

             

Величину, пропорциональную вращательному моменту М , взятую с обратным знаком , примем за сигнал управления и                       

Введём обозначения для составляющих вектора состояния

                                          ,

следовательно      

Согласно теории Л.С. Понтрягина, введём третью составляющую вектора состояния

Очевидно, что  Функция Понтрягина имеет вид

Верхняя граница этой функции достигается в точке, где  то есть   Функции  определим из канонических уравнений

Следовательно  Видим, что управление космическим аппаратом есть линейная функция времени вида          u(t)=-at+b .

Теперь обратимся к нашим исходным уравнениям  и  проинтегрируем их

Допустим, что в начальный момент = 0, , а в конечный момент

 Для определения постоянных а и b имеем два уравнения

Следовательно  Здесь b – удельный вращательный момент на валу маховика в начальный момент, а постоянная а равна начальной скорости изменения угла ориентировки КА .

x(0)

x(T)

xn

 x1

x(t)

x(T)

xn

 x1

x(t+Δt)

x1(T)=1

x2(T)=0

x1(0)=0

x2(0)=0

EMBED Equation.3  

EMBED Equation.3  

1= 1/6 b1 + 1/2 b2

0= 1/2b1 + b2

x1(T)=1

x2(T)=0

 t1       t2               t




1. вытяжные предназначенные для удаления воздуха которые в свою очередь могут быть местными и общими; 2 при
2. 14 14 10 Генетика
3. Безопасность жизнедеятельности
4. Товароведение и экспертиза мебели
5. Развитие продуктивного мышления на уроках математики1
6. Тема Решение задачи
7. тема знаний и представлений человека о мире о себе самом и т
8. Я выбираю среди студентов Кемеровской государственной медицинской академии Цели и задачи Де1
9. Развитие внимания младших школьников с нарушением интеллекта на уроках изобразительной деятельности
10. НА ТЕМУ- ИНСТИТУТ СОБСТВЕННОСТИ ПО ГРАЖДАНСКОМУ ПРАВУ И ЕГО ЗНАЧЕНИЕ В СТАНОВЛЕНИИ РЫНОЧНОЙ ЭКОНОМИКИ В РОСС
11. Реферат- Организация труда
12. вступительных испытаний зачисляются при предъявлении соответствующих документов- дети ~ сироты и дети оста
13. умирают Чтобы проследить жизненный путь звёзд и понять как они стареют необходимо знать как они возникают
14. Современные направления прикладной психофизиологии
15. Художня обробка металів у 5-9 класах
16. Культура нашей речи роскошь или целесообразность
17. Средства создания комического в детективах Д Донцовой
18. Задание. составьте бухгалтерские проводки в журнале хозяйственных операций; определите тип хозяйствен
19. Тема 2 Подготовительные и вспомогательные работы при производстве земляных работ
20. предшественники различных рибонуклеиновых кт тРНК рРНК мРНК и мн