Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
25. Доказательство критерия оптимальности смешанных стратегий игрока В в терминах данных цены игры, выигрыш-функции и множества смешанных стратегий игрока А.
Теорема. Пусть V цена игры, H(P, Q) функция выигрыша, и множества смешанных стратегий соответственно игроков А и В. Для того чтобы стратегия Q0 игрока В была оптимальной , необходимо и достаточно, чтобы выполнялось неравенство для любого P, т.е. выбор игроком В одной из своих оптимальных стратегий Q0 гарантирует ему проигрыш, не больший цены игры V, при любой стратегии P игрока А.
Доказательство. Необходимость. Пусть Q0 - оптимальная стратегия игрока В, тогда по теореме фон Неймана показатель неэффективности β(Q0) стратегии Q0 равен цене игры V. Рассматривая β(Q0) как показатель неэффективности стратегии Q0 относительно множества SA смешанных стратегий игрока А, имеем . Получим:
.
Достаточность. Пусть для некоторой стратегии Q0 игрока В справедливо неравенство . Для доказательства ее оптимальности достаточно показать, что .
Так как неравенство выполняется для любой стратегии P SA игрока А, то оно будет справедливым и для , т.е.
Но цена игры равна верхней цене игры и .
Из двух последних неравенств получаем равенство , которое в силу теоремы фон Неймана означает, что стратегия Q0 является оптимальной.
26. Доказательство критерия оптимальности смешанных стратегий игрока А в терминах данных цены игры, выигрыш-функции и множества чистых стратегий игрока В.
Теорема. Пусть V цена игры, H(P, Q) функция выигрыша, и множества чистых стратегий соответственно игроков А и В. Для того чтобы стратегия игрока А была оптимальной, необходимо и достаточно, чтобы
Доказательство. Необходимость. Пусть оптимальная стратегия игрока А. По критерию оптимальности смешанных стратегий в терминах цены игры, выигрыш-функции и множества смешанных стратегий . Пусть справедливо это неравенство, и так как оно справедливо для любой стратегии , то оно будет справедливо и для чистых стратегий игрока В.
Достаточность. Пусть выполнено , тогда с учетом
Таким образом, , т.е. по критерию оптимальности смешанных стратегий в терминах множеств смешанных стратегий игроков является оптимальной стратегией игрока A.
27. Доказательство критерия оптимальности смешанных стратегий игрока В в терминах данных цены игры, выигрыш-функции и множества чистых стратегий игрока А.
Теорема. Пусть V цена игры, H(P, Q) функция выигрыша, и множества чистых стратегий соответственно игроков А и В. Для того чтобы стратегия игрока B была оптимальной, необходимо и достаточно, чтобы
Доказательство. Необходимость
Пусть оптимальная стратегия игрока В. По критерию оптимальности смешанных стратегий в терминах цены игры, выигрыш-функции и множества смешанных стратегий . Пусть справедливо это неравенство, и так как оно справедливо для любой стратегии PSA, то оно будет справедливо и для чистых стратегий игрока A.
Достаточность. Пусть выполнено , тогда с учетом
Таким образом, , т.е. по критерию оптимальности смешанных стратегий в терминах множеств смешанных стратегий игроков является оптимальной стратегией игрока B.
28. Доказательство теоремы о геометрической интерпретации множества оптимальных смешанных стратегий игрока A.
Следствие из теоремы об оптимальности смешанных стратегий игрока А в терминах данных цены игры, выигрыш-функции и множества чистых стратегий игрока В. Множество оптимальных стратегий игрока A является выпуклым многогранником (политопом), содержащимся в симплексе всех смешанных стратегий игрока A.
Для каждой оптимальной стратегии игрока A из теоремы об оптимальности смешанных стратегий игрока А справедливо неравенство .
можно переписать как . Тогда
Множество точек m-мерного пространства , координаты которых удовлетворяют этому неравенству для фиксированного , является замкнутым полупространством,
а множество точек , координаты которых удовлетворяют этому неравенству для всех , является пересечением конечного числа n замкнутых полупространств и называется выпуклым замкнутым полиэдром.
Так как к тому же множество оптимальных стратегий игрока A ограничено, поскольку оно является подмножеством симплекса всех его смешанных стратегий , то является выпуклым многогранником (политопом).