Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
На практике часто встречаются игровые ситуации, когда один из противников не оказывает сознательного противодействия, а неопределенность является следствием недостатка информации. К таким игрокам относятся так называемые «игры с природой». Они исследуются методами теории статистических решений.
«Игру с природой» можно описать с помощью матрицы:
, (6.1)
где: А i - возможные варианты решения эксперта (игрок А) ;
Пj - возможные варианты состояния природы (игрок В) ;
доход (выигрыш) игрока А, если эксперт принимает решение Аi, а природа окажется в состоянии Пj. Наряду с платежной матрицей , при исследовании «игр с природой» используют матрицу рисков:
R= (6.2)
где: , где ,.
Метод решения задачи зависит от того, какая функция берется в качестве критерия, что, в свою очередь, зависит от того, насколько эксперт информирован о поведении природы.
Случай1. Вероятности pj природы известны хорошо.
1. При критерии среднего выигрыша (математического ожидания выигрыша) в качестве оптимальной берется стратегия, которая максимизирует средний выигрыш игрока А:
Р ( А i ) = (6.3)
2. Критерий среднего риска, равносильный критерий Р(Аi), имеет вид
R ( Ai )= (6.4)
Cлучай2. Вероятности состояний природы неизвестны, но есть основания считать, что все вероятности состояний природы приблизительно одинаковы.
3. Критерий Лапласа получают из критерия среднего выигрыша, если информация о pj очень скудна и предполагается самое простое, что вероятности всех состояний природы равны между собой. Тогда
L (Аi) = . (6.5)
Случай3. Вероятности состояний природы неизвестны.
4. Критерий Вальда - критерий крайнего пессимизма - имеет вид:
W(Ai) = (6.24)
В пессимистических критериях природа рассматривается как активно противоборствующий противник.
5. Критерий Сэвиджа (также пессимистический) отличается критерия Вальда тем, что вместо матрицы платежей берется матрица рисков:
S ( Ai) = (6.25)
6. Критерий крайнего оптимизма представляется в виде
О(A i) = (6.26)
7. Критерий Гурвица отражает компромисс между W(Ai) и O(Ai):
(6.27)
где k коэффициент, отражающий долю оптимизма. Его значения лежат в интервале [0;1], т.е. . Коэффициент k выбирается по субъективным соображениям: чем более сложная ситуация необходимо застраховаться, тем ближе k к единице. При k =1 имеем критерий Вальда, при k=0 критерий крайнего оптимизма.
Для игр с природой, аналогично парным играм, вводится понятие доминирования одной стратегии над другой. Говорят, что k-я строка матрицы доминирует l-ю строку, если a kj a lj и akj > alj, хотя бы для одного j. Стратегию соответствующую доминируемой строке можно не рассматривать (вычеркнуть из платежной матрицы), поскольку она заведомо не выгодна.
Ниже на примерах, будет показано, что решение, принимаемое в условиях неопределенности, существенно зависит от выбранного критерия. Возникает вопрос о применимости того или иного критерия. Этот вопрос является сложной проблемой и заслуживает отдельного исследования. Общие рекомендации: решение следует принимать с учетом практического опыта и традиций в данной предметной области. При принятии ответственных и разовых решений следует использовать критерии Вальда и Севиджа. При принятии решений в ситуациях, которые часто повторяются целесообразно применение критерия Гурвица и вероятностных критериев (математического ожидания выигрыша, критерия Лапласа и др.).
ПРИМЕР 1 ( [1]).
Рудное месторождение разведано редкой сетью скважин (в основном по категории С1) [1]. В связи с дефицитностью сырья необходимо принять решение о мощности рудника, не ожидая окончания детальной разведки. Разведанные запасы месторождения (точнее их математическое ожидание) составляют 40 млн.т. Так как точность подсчета запасов по категории С1 составляет 100%, реально запасы сырья могут изменяться от 20 до 80 млн. т. Рассматриваются 5 возможных вариантов запасов 20, 30, 40, 60 и 80 млн.т . (соответственно П1-П5 состояния природы).
Также рассматриваются 4 варианта строительства рудника мощностью 2,3,4 или 5 тыс.т.(соответственно стратегии А1-А4). Для каждого варианта мощности при рассматриваемых состояниях природы (вариантов запасов месторождения) подсчитаны возможные значения суммарной приведенной прибыли (рис. 6.26). Отрицательное значение прибыли, наблюдаемое в ряде случаев, показывает, что в связи с неподтверждением запасов и большими капиталовложениями эксплуатация месторождения убыточна. Для принятия окончательного решения о мощности рудника требуется рассчитать критерии Вальда, Сэвиджа, Лапласа и среднего выигрыша (математическое ожидание прибыли), задаваясь вероятностями состояний природы (по аналогии с другими месторождениями). Для критерия среднего выигрыша полагаем, что наблюдается нормальный закон распределения ошибки подсчета запасов, поэтому примем вероятности состояния равными соответственно (p1 ;p2 ; p3 ; p4 ; p5)=( 0,12; 0,25; 0,3; 0,25; 0,08). Для критерия Гурвица считать, что уменьшение и увеличение запасов равновероятно, т.е. k=0,5.
Вариант мощности |
Прибыль, млн у.е. для вариантов запасов (состояний природы), млн. т |
||||
20 (П1) |
30 (П2) |
40 (П3) |
60 (П4) |
80 (П5) |
|
2 (А1) |
-10 |
50 |
65 |
70 |
72 |
3 (А2) |
-40 |
-20 |
80 |
100 |
105 |
4 (А3) |
-65 |
-45 |
55 |
120 |
150 |
5 (А4) |
-85 |
-65 |
35 |
130 |
165 |
Рис.6.26
Решение.
1. Критерий Вальда. Для каждой строки платежной матрицы считаем (минимальный элемент по строке ).
Наибольшему значению критерия соответствует первая стратегия, которую следует считать оптимальной с позиции рассматриваемого критерия Вальда.
2. Критерий Сэвиджа. Вычисляем матрицу рисков. Для этого вычисляем максимальный элемент для каждого столбца исходной матрицы, с этой целью строим дополнительную строку в платежной матрице (рис. 6.27).
Вариант мощности |
Прибыль, млн. у.е. для вариантов запасов (состояний природы), млн. т |
||||
20 (П1) |
30 (П2) |
40 (П3) |
60 (П4) |
80 (П5) |
|
2 (А1) |
-10 |
50 |
65 |
70 |
72 |
3 (А2) |
-40 |
-20 |
80 |
100 |
105 |
4 (А3) |
-65 |
-45 |
55 |
120 |
150 |
5 (А4) |
-85 |
-65 |
35 |
130 |
165 |
j |
-10- |
50 |
80 |
130 |
165 |
Рис.6.27
Отнимая от полученных значений соответствующие значения элементов платежной матрицы получаем матрицу рисков (рис. 6.28):
Вариант мощности |
Риск, млн. у.е. для вариантов запасов (состояний природы), млн. т |
||||
20 (П1) |
30 (П2) |
40 (П3) |
60 (П4) |
80 (П5) |
|
2 (А1) |
0 |
0 |
15 |
60 |
93 |
3 (А2) |
30 |
70 |
0 |
30 |
60 |
4 (А3) |
35 |
95 |
25 |
10 |
15 |
5 (А4) |
75 |
115 |
45 |
0 |
0 |
Рис.6.28
Далее для каждой строки матрицы риска считаем (максимальный элемент по строке ):
После этого выбираем оптимальную стратегию. Наименьшему значению критерия соответствует вторая стратегия, которую следует считать оптимальной с позиции рассматриваемого критерия Сэвиджа.
3. Критерий Гурвица. Для каждой строки считаем
Наибольшему значению критерия соответствует третья стратегия, которую следует считать оптимальной с позиции рассматриваемого критерия Гурвица.
4. Критерии среднего выигрыша. Для каждой строки считаем P(Ai):
Наибольшему значению критерия соответствует первая стратегия, которую следует считать оптимальной с позиции рассматриваемого критерия.
5. Критерий Лапласа. Полагаем, что все состояния равновероятны, т.е. p1 =p2 = p3 = p4= p5. Поскольку p1 +p2 + p3 + p4+ p5=1, то p1 =p2 = p3 = p4= p5=1/5=0,20. Для каждой строки считаем L(Ai):
.
Наибольшему значению критерия соответствует первая стратегия, которую следует считать оптимальной с позиции рассматриваемого критерия Лапласа.
Вывод. Таким образом, по критериям Вальда, Лапласа и при принятом распределении вероятностей состояний природы (критерия среднего выигрыша) лучшая стратегия 1 (вариант строительства рудника мощностью 2 тыс. т), по критерию Сэвиджа 2, а по критерию Гурвица 3.
Если учитывать, что принимается разовое решение, то для рассматриваемой задачи предпочтение в целом следует отдать стратегии 1.
ПРИМЕР 2. (Переработано из: [4])
Менеджер ресторана, расположенного на одном из тропических островов, заказывает на материке партию мороженного раз в неделю. Многолетний опыт показывает, что возможный объем реализации продукта меняется в диапазоне от 0 до 3 упаковок, в зависимости от погоды. Возможные состояния погоды (природы) можно характеризовать терминами «холодно», «прохладно», «тепло» и «жарко», при этом спрос на мороженное равен 0, 1, 2 и 3 упаковок соответственно. Если продукт не реализован в течение недели, то он подлежит утилизации.
Пусть цена продажи каждой упаковки равна 100 у.е., цена закупки - 40 у.е., неудовлетворенный спрос (упущенная выгода) - 50 у.е. , цена утилизации - 7 у.е.
Определить оптимальный объем закупок, если состояния погоды «холодно», «прохладно», «тепло» и «жарко» реализуются с вероятностями 0.1, 0.3, 0.4 и 0.2 соответственно.
Провести анализ устойчивости решения, полагая, что упущенная выгода меняется от 0 до 150.
Решение
Принимая во внимание, что решение менеджер принимает регулярно, то наиболее рационально рассматривать ситуации, как игру с природой, взяв в качестве критерия выбора решения критерий среднего выигрыша. Решение приведено на рис. 6.29. Ячейки платежной матрицы заполнены значениями платежей, которые вычисляются по формуле
,
где - количество закупленных упаковок;
- количество проданных упаковок;
- неудовлетворенный спрос;
- количество нереализованных упаковок.
Величина среднего выигрыша для каждого варианта содержится в интервале ячеек F9:F12. Максимальное значение среднего выигрыша равное 56.5 у.е., которое соответствует объему закупок в 2 упаковки.
Рис. 6.29.
Решение базируется на объективных значениях цен продажи, закупки и утилизации и на субъективном значении неудовлетворенного спроса, которое определяется менее точно. Проведем анализ чувствительности относительно этого параметра модели.
Анализ чувствительности можно провести, задавая различные значения упущенной выгоды. Для каждого значения необходим пересчет элементов платежной матрицы, вычисление средних выигрышей и выбор на их основе нового оптимального решения.
Воспользуемся средством «Таблица подстановки», выполнив для этого следующие действия:
Заполним значениями 0 от до 150 с шагом равным 5 интервал ячеек А18:А48;
В диапазон ячеек B17:E17 введем формулы =F9 …=F12 (рис.6.30);
Выделим диапазон А17:Е48 и вызовем средство «Таблица подстановки», которое содержится в пункте меню «Данные». В диалоговом окне в поле «Подставлять значения по строкам в» вводим значение $B$3 (рис.6.31). Это обеспечит подстановку значений из столбца А в ячейку В3 (по одному значению за один раз), пересчет формул в диапазоне F9:F12 и заполнение столбцов B,C, D и Е в диапазоне А18:Е48. эти значения и являются значениями, соответствующими значениям среднего выигрыша при соответствующем объеме закупок. Выбор максимального значения среднего выигрыша и соответствующего объема закупок проведем графическим методом рис.6.32-6.33.
Рис. 6.30.
Рис. 6.31.
На графике каждая линия соответствует определенному объему закупок, оптимальному значению соответствует та, которая при заданном значении упущенной выгоды расположена выше. На построенном графике видно, что при возрастании величины упущенной выгоды средний выигрыш убывает (для объемов покупок равным 0, 1 и 2) или остается постоянным для объема покупки в 3 упаковки. На рис.6.33 видно, что если значение упущенной выгоды меньше 127 у.е., то оптимальным будет объем покупки в 2 упаковки. Если значение упущенной выгоды больше 127 у.е., то оптимальным будет объем покупки в 3 упаковки. Окончательно приходим к выводу, что нет необходимости знать точное значение упущенной выгоды чтобы определить оптимальное решение, достаточно знать будет оно больше или меньше 127 у.е.
Рис. 6.32.
Рис. 6.33.
ВАРИАНТЫ ЗАДАНИЙ
Каждый вариант состоит из двух задач. Для определения исходных данных используется M и N предпоследняя и последняя цифра зачетной книжки.
Задача 1
Планируется строительство горного предприятия (рудника). Рудное месторождение разведано редкой сетью скважин (в основном по категории С1). В связи с дефицитностью сырья необходимо принять решение о мощности рудника, не ожидая окончания детальной разведки. Разведанные запасы месторождения (точнее их математическое ожидание) составляют 40 млн. т. Так как точность подсчета запасов по категории С1 составляет 100%, реально запасы сырья могут изменяться от 20 до 80 млн. т. Рассматриваются 5 возможных вариантов запасов 20, 30, 40, 60 и 80 млн. т (соответственно П1-П5 состояния природы).
Также рассматриваются 4 варианта строительства рудника различной мощности (соответственно стратегии А1-А4). Для каждого варианта мощности при рассматриваемых состояниях природы (вариантов запасов месторождения) подсчитаны возможные значения суммарной приведенной прибыли (табл. 6.3).
Для принятия окончательного решения о мощности рудника требуется рассчитать критерии Вальда, Сэвиджа, Лапласа и среднего выигрыша (математическое ожидание прибыли), задаваясь вероятностями состояний природы (по аналогии с другими месторождениями). Для критерия среднего выигрыша полагаем, что наблюдается нормальный закон распределения ошибки подсчета запасов, поэтому примем вероятности состояния равными соответственно (p1 ;p2 ; p3 ; p4 ; p5)=(0,12; 0,25; 0,3; 0,25; 0,08). Для критерия Гурвица задайтесь тремя значениями коэффициента k, выражающим долю оптимизма k=0,3; 0,5 и 0,7.
Таблица 6.3.
Вариант мощности |
Прибыль, млн. у.е. для вариантов запасов (состояний природы), млн. т |
||||
П1 |
П2 |
П3 |
П4 |
П5 |
|
А1 |
-15- M |
40- M+ N |
60 |
70+ M |
90- N |
А2 |
-55- M |
-10- M+ N |
80 |
100- N |
100+ M |
А3 |
-65- M |
-60- M+ N |
50 |
110 |
120+ M+ N |
А4 |
-90- M |
-70- M+ N |
40 |
125 |
160 +M+ N |
Задача 2
Владелец кафе, расположенного рядом с Ледовым дворцом, в котором происходят матчи чемпионата по хоккею, заказывает партию готовых салатов накануне матча. Многолетний опыт показывает, что возможный объем реализации продукта в первый день (сразу после матча) меняется в диапазоне от 0 до 4 упаковок, в зависимости от результата матча. Возможные результаты матча характеризовать терминами «проигрыш», «проигрыш по буллитам», «выигрыш по буллитам», «выигрыш» и «крупный выигрыш», при этом спрос на салаты равен 0, 1, 2, 3 и 4 упаковки соответственно. Если продукт не реализован в течение двух дней, то он подлежит утилизации, которую необходимо оплатить. Как показывает практика, половина не проданных в день матча салатов реализуется со скидкой 30% на следующий день. Заметим, что упаковка состоит из нескольких порций, поэтому необходимо учесть возможность не целого их (упаковок) количества при реализации со скидкой и утилизации.
Пусть цена продажи каждой упаковки равна 110+M+ N у.е., цена закупки - 70+ N у.е., неудовлетворенный спрос (упущенная выгода) - 50- M+ N у.е. , цена утилизации - 7 у.е.
Определить оптимальный объем закупок, если по оценке букмекерской конторы результаты игры «проигрыш», «проигрыш по буллитам», «выигрыш по буллитам», «выигрыш» и «крупный выигрыш», реализуются с вероятностями 0.15, 0.15 , 0.25, 0.35 и 0.1 соответственно.
Провести анализ устойчивости решения, полагая, что упущенная выгода меняется от 0 до 150.
Провести имитационное моделирование процесса реализации партии салатов, проведя не менее 300 розыгрышей. Сравнить полученный платеж со средним ожидаемым выигрышем.