Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

на тему Метод Дэвидона Флетчера Пауэлла

Работа добавлена на сайт samzan.net:


Метод Дэвидона - Флетчера - Пауэлла.                   Бойко Константин.

Министерство науки, высшей школы и технической

политики Российской Федерации.

Новосибирский Государственный

Технический Университет.

Реферат по исследованию операций на тему

«Метод Дэвидона - Флетчера - Пауэлла».

Вариант №2.

Факультет: АВТ.

Кафедра: АСУ.

Группа: АС-513.

Студент: Бойко Константин Анатольевич.

Преподаватель: Ренин Сергей Васильевич.

Дата: 19 октября 1997 года.

Новосибирск


Введение.

Первоначально метод был предложен Дэвидоном (Davidon [1959] ), а затем развит Флетчером и Пауэллом (Fletcher, Powell [1963] ). Метод Дэвидона - Флетчера - Пауэлла называют также и методом переменной метрики. Он попадает в общий класс квазиньютоновских процедур, в которых направления поиска задаются в виде -Djf(y). Направление градиента является, таким образом, отклоненным в результате умножения на  -Dj, где Dj - положительно определенная симметрическая матрица порядка n  n, аппроксимирующая обратную матрицу Гессе. На следующем шаге матрица Dj+1 представляется в виде суммы Dj и двух симметрических матриц ранга один каждая. В связи с этим схема иногда называется схемой коррекции ранга два.

Алгоритм Дэвидона - Флетчера - Пауэлла.

Рассмотрим алгоритм Дэвидона - Флетчера - Пауэлла минимизации дифференцируемой функции нескольких переменных. В частности, если функция квадратичная, то, как будет показано позднее, метод вырабатывает сопряженные направления и останавливается после выполнения одной итерации, т.е. после поиска вдоль каждого из сопряженных направлений.

 Начальный этап. 

Пусть 0 - константа для остановки. Выбрать точку х и начальную симметрическую положительно определенную матрицу D. Положить y= x, k = j = 1 и перейти к основному этапу.

 

Основной этап.

Шаг 1. Если f(yj)  , то остановиться; в противном случае положить dj = - Djf(yj) и взять в качестве j оптимальное решение задачи минимизации f(yj + dj) при   0. Положить yj+1 = yj + jdj. Если j  n, то перейти к шагу 2. Если j = n, то положить y = xk+1 = yn+1, заменить k на k+1, положить j=1 и повторить шаг 1.

 Шаг 2. Построить Dj+1 следующим образом :

,    (1)

где

  pj = jdj,       (2)

  qj = f(yj+1) - f(yj).      (3)

Заменить j на j + 1 и перейти к шагу 1.

Пример.

Рассмотрим следующую задачу :

минимизировать (x - 2) + (x - 2x).

Результаты вычислений методом Дэвидона - Флетчера - Пауэлла приведены в таблице 1.

Таблица 1. Результаты вычислений по методу Дэвидона - Флетчера - Пауэлла.

k

xk

f(xk)

j

yj

f(yj)

f(yj)

f(yj)

D

dj

j

yj+1

1

(0.00, 3.00)

(52.00)

1

(0.00, 3.00)

(52.00)

(2.70, 1.51)

(0.34)

(-44.00, 24.00)

(0.73, 1.28)

50.12

.47

(44.00, -24.00)

(-0.67, -1.31)

0.062

.22

(2.70, 1.51)

(2.55, 1.22)

2

(2.55, 1.22)

(0.1036)

1

(2.55, 1.22)

(0.1036)

(2.45, 1.27)

(0.0490)

(0.89, -0.44)

(0.18, 0.36)

0.99

.40

(-0.89, 0.44)

(-0.28, -0.25)

0.11

.64

(2.45, 1.27)

(2.27, 1.11)

3

(2.27, 1.11)

(0.008)

1

(2.27, 1.11)

(0.008)

(2.25, 1.13)

(0.004)

(0.18, -0.20)

(0.04, 0.04)

0.27

.06

(-0.18, 0.20)

(-0.05, -0.03)

0.10

.64

(2.25, 1.13)

(2.12, 1.05)

4

(2.12, 1.05)

(0.0005)

1

(2.12, 1.05)

(0.0005)

(2.115, 1.058)

(0.0002)

(0.05, -0.08)

(0.004, 0.004)

0.09

.006

(-0.05, 0.08)

.10

(2.115, 1.058)

На каждой итерации вектор dj для j = 1, 2 определяется в виде
Djf(yj), где D –единичная матрица, а D вычисляется по формулам (1) - (3). При
k = 1 имеем p = (2.7, -1.49)T, q = (44.73, -22,72)T. На второй итерации
p = (-0.1, 0.05)T, q = (-0.7, 0.8)T и, наконец, на третьей итерации
p = (-0.02, 0.02)T, q = (-0.14, 0.24)T. Точка yj+1 вычисляется оптимизацией вдоль направления dj при начальной точке yj для j = 1, 2. Процедура остановлена в точке
y = (2.115, 1.058)T на четвертой итерации, так как норма f(y) = 0.006 достаточно мала. Траектория движения, полученная методом, показана на рисунке 1.

Рисунок 1. Метод Дэвидона - Флетчера - Пауэлла.

Лемма 1 показывает, что каждая матрица Dj положительно определена и dj является направлением спуска.

Для доказательства леммы нам понадобится :

Теорема 1. Пусть S - непустое множество в Еn, точка x  cl S. Конусом возможных направлений в точке x называется множество D = {d : d  0, x + d  S при всех   (0, ) для некоторого  > 0}.

Определение. Пусть x и y - векторы из Еn и xTy - абсолютное значение скалярного произведения xTy. Тогда выполняется следующее неравенство, называемое неравенством Шварца : xTy  x y.

Лемма 1.

 

Пусть y  Еn, а D –начальная положительно определенная симметрическая матрица. Для j = 1, ..., n положим yj+1 = yj + jdj, где dj = –Djf(yj), а j является оптимальным решением задачи минимизации f(yj + dj) при   0. Пусть, кроме того, для
j = 1, ..., n –матрица Dj+1 определяется по формулам (1) - (3). Если f(yj)  0 для
j = 1, ..., n, то матрицы D, ..., Dn симметрические и положительно определенные, так что d, ..., dn –направления спуска.

 Доказательство.

Проведем доказательство по индукции. При j = 1 матрица D симметрическая и положительно определенная по условию леммы. Кроме того,
f(y)Td = –f(y)TDf(y)  0, так как D положительно определена. Тогда по теореме 1 вектор d определяет направление спуска. Предположим, что утверждение леммы справедливо для некоторого j  n –, и покажем, что оно справедливо для j+1. Пусть x –ненулевой вектор из En, тогда из (1) имеем

      (4)

Так как Dj –симметрическая положительно определенная матрица, то существует положительно определенная матрица Dj/2, такая, что Dj = Dj/2Dj/2. Пусть
a = Dj/2x и b = Dj/2qj. Тогда xTDjx = aTa, qjTDjqj = bTb и xTDjqj = aTb. Подставляя эти выражения в (4), получаем :

    (5)

По неравенству Шварца имеем (aTa)(bTb)  (aTb). Таким образом, чтобы доказать, что xTDj+1x  0, достаточно показать, что pjTqj   0 и bTb  0. Из (2) и (3) следует, что

pjTqj = jdjT[f(yj+1) –f(yj)].      (6)

По предположениюf(yj)  0, и Dj положительно определена, так что
f(yj)TDjf(yj)  0. Кроме того,
dj –направление спуска, и, следовательно, j  0. Тогда из (6) следует, что pjTqj  0. Кроме того, qj   0, и , следовательно, bTb= qjTDjqj   0.

Покажем теперь, что xTDj+1x  0. Предположим, что xTDj+1x = 0. Это возможно только в том случае, если (aTa)(bTb) = (aTb) и pjTx = 0. Прежде всего заметим, что
(aTa)(bTb) = (aTb) только при
a = b, т.е. Dj/2x = Dj/2qj. Таким образом, x =  qj. Так как x  0, то   0. Далее, 0 = pjTx =  pjTqj противоречит тому, что pjTqj  0 и   0. Следовательно, xTDj+1x > 0, т.е. матрица Dj+1 положительно определена.

Поскольку f(yj+1)  0 и Dj+1 положительно определена, имеем
f(yj+1)Tdj+1 = –f(yj+1)T Dj+1f(yj+1) < 0. Отсюда по теореме 1 следует, что dj+1 –направление спуска.

Лемма доказана. 

Квадратичный случай.

 В дальнейшем нам понадобиться :

Теорема 2. Пусть f(x) = cTx +  xTHx, где Н - симметрическая матрица порядка n x n. Рассмотрим Н - сопряженные векторы d, …, dn и произвольную точку x. Пусть k для = 1, …, n - оптимальное решение задачи минимизации
f(xk + dk) при   Е и
xk+1 = xk +  dk. Тогда для k = 1, …, n справедливы следующие утверждения :

  1.  f(xk+1)Tdj = 0, j = 1, …, k;
  2.  f(x1)Tdk = f(xk)Tdk;
  3.  xk+1 является оптимальным решением задачи минимизации f(x) при условии
    x - x  L(d, …, dk), где L(d, …, dk) –линейное подпространство, натянутое на векторы d, …, dk, то есть  В частности, xn+1 –точка минимума функции f на Еn.

Если целевая функция f квадратичная, то в соответствии со сформулированной ниже теоремой 3 направления d, …, dn, генерируемые методом Дэвидона - Флетчера - Пауэлла, являются сопряженными. Следовательно, в соответствии с утверждением 3 теоремы 2 метод останавливается после завершения одной итерации в оптимальной точке. Кроме того, матрица Dn+1, полученная в конце итерации, совпадает с обратной к матрице Гессе Н.

Теорема 3. Пусть Н –симметричная положительно определенная матрица порядка n x n. Рассмотрим задачу минимизации f(x) = cTx +  xTHx при условии x  En. Предположим, что задача решена методом Дэвидона - Флетчера - Пауэлла при начальной точке y и начальной положительно определенной матрице D. В частности, пусть j, j = 1, …, n, –оптимальное решение задачи минимизации f(yj + dj) при   0 и yj+1 = yj + jdj, где dj = -Djf(yj), а Dj определяется по формулам (1) –(3). Если f(yj)  0 для всех j, то направления
d, …, dn являются Н - сопряженными и Dn+1 = H-1. Кроме того, yn+1 является оптимальным решением задачи.

Доказательство.

Прежде всего покажем, что для j, такого, что 1  j  n, справедливы следующие утверждения :

  1.  d, …, dj линейно независимы.
  2.  djTHdk = 0 для i  k; i, k  j.
  3.  Dj+1Hpk, или, что эквивалентно, Dj+1Hdk = dk для 1  k  j, pk = kdk.

 Проведем доказательство по индукции. Для j = 1 утверждения 1 и 2 очевидны. Чтобы доказать утверждение 3, заметим прежде всего, что для любого k справедливы равенства

Hpk = H(kdk) = H(yk+1 - yk) = f(yk+1) –f(yk) = qk.  (7)

В частности, Hp = q. Таким образом, полагая j = 1 в (1), получаем

,

т.е. утверждение 3 справедливо при j = 1.

Теперь предположим, что утверждения 1, 2 и 3 справедливы для j  n –. Покажем, что они также справедливы и для j + 1. Напомним, что по утверждению 1 теоремы 2 diTf(yj+1) = 0 для i  j. По индуктивному предположению di = Dj+1Hdi, i  j. Таким образом, для i  j имеем

0 = diTf(yj+1) = diTHDj+1f(yj+1) = –diTHdj+1.

 Ввиду предположения индукции это равенство показывает, что утверждение 2 также справедливо для j+1.

Теперь покажем, что утверждение 3 справедливо для j+1.

Полагая k    j+1, имеем

.   (8)

Учитывая (7) и полагая k = j + 1 в (8), получим, что Dj+2Hpj+1 = pj+1. Теперь пусть k  j. Так как утверждение 2 справедливо для j + 1, то

pj+1THpk = kj+1dj+1THdk = 0.     (9)

По предположению индукции из (7) и вследствие того, что утверждение 2 справедливо для j + 1, получаем

.  (10)

Подставляя (9) и (10) в (8) и учитывая предположение индукции, получаем

 .

Таким образом, утверждение 3 справедливо для j+1.

Осталось показать, что утверждение 1 справедливо для j+1. Предположим, что . Умножая это равенство на и учитывая, что утверждение 2 справедливо для j+1, получаем, что . По условию теоремы , а по лемме 1 матрица  положительно определена, так что . Так как H положительно определена, то  и, следовательно, . Отсюда следует, что , и так как d, …, dj линейно независимы по предположению индукции, то  для i = 1, …, j. Таким образом, d, …, dj+1 линейно независимы и утверждение 1 справедливо для j+1. Следовательно, утверждения 1, 2 и 3 выполняются. В частности сопряжённость d, …, dn следует из утверждений 1 и 2, если положить j = n.

Пусть теперь j = n в утверждении 3. Тогда  для k = 1, …, n. Если в качестве D взять матрицу, столбцами которой являются векторы d, …, dn, то . Так как D имеет обратную, то , что возможно только в том случае, если . Наконец,  является оптимальным решением по теореме 2.

Теорема доказана.  


Список литературы.

  1.  Базара М., Шетти К. «Нелинейное программирование. Теория и алгоритмы». М., 1982.
  2.  Химмельблау Д. «Прикладное нелинейное программирование». М., 1975.



1. Тема 3- Современные методы обучения экономике 3
2. Социология управления Объект и предмет социологии управления
3. ЛАБОРАТОРНАЯ РАБОТА ОПРЕДЕЛЕНИЕ КОНЦЕНТРАЦИИ НЕОРГАНИЧЕСКОГО ФОСФОРА В СЫВОРОТКЕ КРОВИ Подготовка
4. Античные традиции в мировой и европейской культурах
5. Тоталитарный от позднелатинского totlits целостность целое через итальянское totlit и производное от
6. Р показывает количество продукта которое потребители готовы и в состоянии купить по каждой из предложенн
7. I. Переживание и автобиография Задачи критики исторического разума Связность духовного мира зарождаетс
8. Закономерности составляющие предмет науки криминалистики
9. методическим объединением по медицинскому и фармацевтическому образованию вузов России в качестве учеб
10. Московский государственный индустриальный университет ФГБОУ ВПО МГИУ Кафедр.1
11. Множественная миелома, диффузно-узловая форма
12. О некоторых грамматических особенностях разговорного французского языка
13. Княжество Андорра
14. Реферат- Принципы создания культурных ландшафтов и их рациональное использовани
15. Лекция- Интерфейс Microsoft Word 2007- версия для печати и PD Лекция знакомит пользователя с интерфейсом Microsoft Word 2007
16. Методические рекомендации по дисциплине- Учет деятельности коммерческих банков Для студентов напр
17.  ПОНЯТИЕ ЗЕМЕЛЬНОГО ПРАВА Земельное право ~ это совокупность правовых норм регулирующих отношения по пов
18. Медный король Медный король
19. Лабораторная работа М1 Выполнил студент 1го курса строительного факультета группы П
20. 2006 13