Теория игр — игры с нулевой суммой и чистая стратегия «Равновесие Нэша»

машинное обучение искусственный интеллект
Теория игр — игры с нулевой суммой и чистая стратегия «Равновесие Нэша»

Мало знаний, большой вызов! Эта статья участвует в "Необходимые знания для программистов«Творческая деятельность.

Игра с нулевой суммой

Игра с нулевой суммой, также известная как игра с нулевой суммой или игра с нулевой суммой, представляет собой концепцию теории игр, в отличие от игры с ненулевой суммой, которая относится к некооперативной игре. Игра с нулевой суммой означает, что сумма интересов всех сторон равна нулю или постоянна, то есть одна сторона имеет доход, а другая сторона должна проиграть.

В игре с конечной нулевой суммой различные теории игр, такие как равновесие Нэша и минимаксные алгоритмы, дают одно и то же решение. Игрокам необходимо использовать смешанную стратегию. Примерами игр с нулевой суммой являются азартные игры, фьючерсы и выборы.

чистая стратегия равновесие по Нэшу

В игре с полной информацией, если при каждой данной информации можно выбрать только одну конкретную стратегию, такая стратегия называется чистой стратегией. Чистые стратегии являются частным случаем смешанных стратегий. Выигрыш чистой стратегии может быть выражен в полезности, а выигрыш смешанной стратегии может быть выражен только в ожидаемой полезности.

В полной информационной игре игроки (игроки) могут толькополитическое пространствоВыберите уникальную стратегию Совместная игра для двух игроков, как игроки выбирают свои собственные стратегии, чтобы получить больше преимуществ в игре

Выражение игры с нулевой суммой

G={S1,S2;A}G = \{ S_1,S_2;A \}

В некооперативной игре двух игроков наборы стратегий А и В равныS1S_1иS2S_2

S1={A1,A2,A3}S2={B1,B2,B3}\begin{aligned} S_1 = \{A_1,A_2,A_3\}\\ S_2 = \{B_1,B_2,B_3\}\\ \end{aligned}

Матрица возврата

B1B_1 B2B_2 B3B_3
A1A_1 6,-6 -1,1 0,0
A2A_2 3,-3 1,-1 2,-2
A3A_3 -3,3 0,0 -1,1

Платежная матрица игрока A равна A

[(6,6)(1,1)(0,0)(3,3)(1,1)(2,2)(3,3)(0,0)(1,1)]\begin{bmatrix} (6,-6) & (-1,1) & (0,0)\\ (3,-3) & (1,-1) & (2,-2)\\ (-3,3) & (0,0) & (-1,1)\\ \end{bmatrix}
A=[610312301]A= \begin{bmatrix} 6 & -1 & 0\\ 3 & 1 & 2\\ -3 & 0 & -1\\ \end{bmatrix}

Как игроки в каждой игре должны выбирать свои собственные стратегии, чтобы обеспечить себе выгодное положение в игре?

  • Возьмите минимальное значение для каждой строки матрицы и максимальное значение среди минимальных значений

max1j3min1i3={1,1,3}=1=a22\max_{1 \le j \le 3} \min_{1 \le i \le 3} = \{-1,1,-3\} = 1 = a_{22}

  • Возьмите максимальное значение для каждого столбца матрицы и возьмите минимальное значение среди максимальных значений

Матрица возврата имеет элементы седловой точки, седловая точкаa22a_{22}седловой элемент

min1j3max1i3={6,1,2}=1=a22\min_{1 \le j \le 3} \max_{1 \le i \le 3} = \{6,1,2\} = 1 = a_{22}