logo

Решение контрольных по математике!!!

43. Бесконечные антагонистические игры

Бесконечные антагонистические игры являются обобщением матричных игр, в которых один или оба игрока имеют бесконечное число возможных стратегий. При этом будут рассматриваться бесконечные игры, в которых каждый из игроков, как и в матричных играх, делает по одному ходу, и затем определяется величина выигрыша победившего игрока и проигрыша побежденного.

Формально будем рассматривать игру F(X, Y, M(X, Y)) двух игроков с нулевой суммой, в которой первый игрок выбирает свою стратегию (число) X из множества X , второй игрок выбирает стратегию (число) из множества Y . Затем первый игрок получает выигрыш за счет второго игрока, если , либо проигрывает второму игроку , если . В качестве множеств X и Y , как правило, используются открытые или замкнутые интервалы вещественной оси чисел. Поскольку любой интервал можно масштабированием привести к единичному интервалу, то обычно полагают, что множества X и Y являются единичными открытыми (0, 1) или замкнутыми [0, 1] интервалами.

По аналогии с матричными играми в бесконечных антагонистических играх можно определить нижнюю И верхнюю чистые цены игры:

;

.

Однако, в бесконечных антагонистических играх, в отличие от матричных, величины и могут и не существовать.

Пример 4.3. Пусть задана бесконечная антагонистическая игра

.

Поскольку X и Y являются открытыми интервалами, то на них a и b не существуют. Если бы X и Y Были замкнутыми интервалами [0,1], тогда

При оптимальных стратегиях X0 =1 и Y0 = 0 соответственно первого и второго игроков.

Если для бесконечной игры F(X, Y, M(X, Y)) величины a и b существуют и равны между собой, то такая бесконечная антагонистическая игра имеет решение в чистых стратегиях, т. е. у первого игрока есть оптимальная стратегия X0 Î X, у второго игрока оптимальная стратегия Y0 Î Y, при которых a = b = = M(X0, Y0) = N – является ценой игры.

Если решение в чистых стратегиях в бесконечной игре отсутствует, то по аналогии с матричными играми его пытаются найти в смешанных стратегиях. Однако в бесконечных играх, в отличие от матричных, решение в смешанных стратегиях может и не существовать. Наличие или отсутствие решения во многом зависит от вида функции M(X, Y). Если функция M(X, Y) имеет разрывы, то решение игры часто отсутствует. Выделим класс бесконечных антагонистических игр с непрерывной функцией M(X, Y). Для этого класса игр справедлива следующая теорема.

Теорема 4.1. (Основная теорема теории непрерывных антагонистических игр на единичном квадрате). Любая бесконечная игра двух игроков (XM(XY)) с непрерывной функцией выигрышей M(X, Y) на единичном квадрате имеет решение в смешанных стратегиях.

При поиске решений в бесконечных играх в смешанных стратегиях в качестве вероятностной меры для каждого из игроков вводят функцию распределения вероятностей применения его чистых стратегий. Обычно задают интегральные законы распределения вероятностей применения чистых стратегий в смешанных соответственно первым и вторым игроками:

;

Где P(h £ X) – вероятность того, что случайно выбранная чистая стратегия h первого игрока не будет превосходить числа X; P (m £ Y) – вероятность того, что случайно выбранная чистая стратегия m второго игрока не будет превосходить числа Y.

Определение. Функции F1(X), F2(Y) в бесконечных антагонистических играх называют смешанными стратегиями соответственно первого и второго игроков.

Если функции F1(X), F2(Y) дифференцируемы, то существуют их производные , , а дифференциалы DF1(X), DF2(Y) интегральных функций распределения вероятностей F1(X), F2(Y) соответственно определяют вероятности того, что стратегия h находится в интервале X £ h £ X + Dx, а стратегия m – в интервале Y £ m £ Y + Dy.

Если первый игрок будет применять свою стратегию h (X £ h £ X + Dx), а второй игрок – свою чистую стратегию Y, то выигрыш первого игрока составит:

. (4.6)

Если проинтегрировать выражение (4.6) в интервале [0, 1], т. е. диапазоне изменения значений чистых стратегий первого игрока, то получим средний выигрыш E(F, Y) первого игрока при условии, что второй игрок применяет чистую стратегию Y

.

Аналогично можно получить средний выигрыш первого игрока, если он будет применять свою чистую стратегию X, а второй игрок – смешанную стратегию F2(Y)

.

Если оба игрока применяют свои смешанные стратегии F1(X), F2(Y), то средний выигрыш первого игрока равен

. (4.7)

Так как средний выигрыш (4.7) в бесконечной игре есть функция двух смешанных стратегий, то первый игрок, изменяя свою смешанную стратегию F1(X), будет стремиться максимизировать свой выигрыш. При этом он может гарантировать, что за счет применения своей смешанной стратегии его выигрыш не будет меньше нижней цены игры в смешанных стратегиях

. (4.8)

Второй игрок, наоборот, за счет применения своей смешанной стратегии F2(Y) будет стремиться минимизировать выигрыш первого игрока. При этом за счет применения своей смешанной стратегии F2(Y) он может гарантировать, что выигрыш первого игрока не будет превышать величины

, (4.9)

Т. е. верхней цены игры в смешанных стратегиях.

По аналогии с матричными играми, имеющими седловые точки в смешанных стратегиях, если для первого и второго игроков существуют соответственно смешанные стратегии F1*(X), F2*(Y), при которых нижняя и верхняя цены бесконечной игры совпадают, то стратегии F1*(X), F2*(Y) называются оптимальными. Они образуют седловую точку в смешанных стратегиях, а цена V игры равна

.

В бесконечной антагонистической игре F(X, Y, M(X, Y)) для оптимальных смешанных стратегий соответственно первого и второго игроков F1*(X), F2*(Y) выполняются неравенства

. (4.10)

Из неравенств (4.10) следует, что если в бесконечной антогонистической игре один из игроков придерживается седловой точки в смешанных стратегиях, то у другого игрока нет лучшей стратегии, чем придерживаться седловой точки. Действительно, если седловой точки (F1*, F2*) придерживается первый игрок, а второй игрок хочет выбрать смешанную стратегию F2 ¹ F2*, то по соотношению (4.9) любое отклонение от F2* не может уменьшить V2 = b, но может привести к увеличению проигрыша второго игрока. Если седловой точки придерживается второй игрок, а первый игрок хочет выбрать стратегию F1 ¹ F1*, то по соотношению (4.8) любое изменение смешанной стратегии F1* не может увеличить выигрыш первого игрока, но может его уменьшить за счет лучшей смешанной стратегии второго игрока.

Итак, решить бесконечную антагонистическую игру F(X, Y, M(X, Y)) с непрерывной функцией M(X, Y) – это значит определить седловую точку или найти такие смешанные стратегии F1(X), F2(Y), при которых нижняя и верхняя цены игры совпадают.

В общем случае поиск решений бесконечных антагонистических игр весьма сложен. Поэтому рассмотрим важный частный класс бесконечных игр с выпуклыми непрерывными функциями выигрышей. Такие бесконечные игры называют выпуклыми.

 
Яндекс.Метрика
Наверх