Метод линейного программирования в теории игр


Допустим, что все элементы (выигрыши) платежной матрицы положительны (aij ³ 0) (если это не так, то можно ко всем элементам прибавлять достаточно большое число M, сделав их положительными. При этом цена игры увеличится на M, а решение задачи и не изменится). Если все aij ³ 0, то g > 0. Пусть платежная матрица не содержит седловой точки, т. е. игра решается в смешанных стратегиях:

.

Применение игроком I оптимальной смешанной стратегии гарантирует ему средний выигрыш, не меньше цены игры g, независимо от поведения игрока II. Игрок II, применяя оптимальную смешанную стратегию гарантирует для себя минимальный проигрыш (не больше g).

Если игрок II применяет свою чистую стратегию Bj, а игрок I — свою оптимальную стратегию , то средний выигрыш игрока I равен:

Если игрок I применяет чистую стратегию АI, а игрок II – свою оптимальную смешанную стратегии , то средний выигрыш игрока II составит

Учитывая, что gj не может быть меньше g для игрока I, а и не может быть больше g для игрока II, двойственную задачу линейного программирования можно записать следующим образом:

1) для игрока I:

2) для игрока II:

Смысл этих систем уравнений заключается в следующем: игрок I стремится увеличить цену игры (g ® max), он действует так, чтобы его средний выигрыш при использовании его стратегий с вероятностями pi для любой j-й стратегии игрока II был не меньше величины g, которую он стремится увеличить. Игрок II стремится уменьшить свой проигрыш (g ® min), т. е. он действует так, чтобы его средний проигрыш при использовании его стратегий с вероятностями qj при любой i-й стратегии игрока I не превышал величину g, которую он стремится уменьшить.

Задача состоит в нахождении двух оптимальных смешанных стратегий и , которые дают для игрока I максимально возможный для него средний выигрыш, а для игрока II минимально возможный для него средний проигрыш.

Разделив левую и правую части неравенств на цену игры g > 0, получим:

Введем обозначения:

Тогда выражения примут следующий вид:

Из равенств и следует, что переменные xi и yj должны удовлетворяют условиям:

Учитывая, что игрок I стремится максимизировать g, а игрок II стремится минимизировать g, переменные xi и yj должны быть выбраны так, чтобы целевая функция Достигала минимума, а целевая функция достигала максимума.

Таким образом, задача решения игры сводится к задаче линейного программирования. Оптимальные стратегии и игры с платежной матрицей А могут быть найдены путем решения симметричной пары двойственных задач линейного программирования:

Решая их, находим xi, yj, цену игры g и оптимальные стратегии и .

или

© 2011-2024 Контрольные работы по математике и другим предметам!