Теория игр - игра «Орел и голубь»

машинное обучение искусственный интеллект
Теория игр - игра «Орел и голубь»

Мало знаний, большой вызов! Эта статья участвует в "Необходимые знания для программистов«Творческая деятельность.

Сегодня я буду использовать пример, чтобы помочь каждому понять ситуации, с которыми можно столкнуться в жизни и на работе.

В приведенной выше таблице в игре участвуют 2 игрока, А и Б, в которых сосредоточена стратегия.{A1,A2}\{A_1,A_2\}Представляя соответственно орла и голубя, то есть жесткость и компромисс, матрица преимуществ выглядит следующим образом.

A1A_1 A2A_2
A1A_1 A-C,A-C 2А, 0
A2A_2 0,2A A,A

затем вAC>0A - C >0В этом случае и А, и В выберутA1A_1Стратегия, это их доминирующая стратегия.В настоящее время, выберет ли B орла или голубя, пока A выбирает орла, это наиболее выгодно, поэтому выбор орла является доминирующей стратегией, поэтому обе стороны выберут орел и, таким образом, достичь баланса доминирующей стратегии. и когдаAC<0A-C < 0В этом случае выбор стратегии B должен учитывать выбор стратегии A, тогда, не зная выбора A, предположим, что A выбираетA1A_1Вероятностьальфа\alphaв результате чего

E(A1)=альфа×(AC)+(1альфа)×2A\mathbb{E}(A_1) = \alpha \times (A-C) + (1-\alpha) \times 2A
E(A2)=альфа×0+(1альфа)×A\mathbb{E}(A_2) = \alpha \times 0 + (1-\alpha) \times A

Вышесказанное является выбором Стороны Б.A1A_1(Орел) иA2A_2Чего ждать от (голубя), то когда А делает выборA1A_1Стратегия — это то, как часто выигрыш одинаков для любой стратегии, которую выбирает Б.

альфа×(AC)+(1альфа)×2A=альфа×0+(1альфа)×A\alpha \times (A-C) + (1-\alpha) \times 2A = \alpha \times 0 + (1-\alpha) \times A
альфа=AC\alpha = \frac{A}{C}

Когда Сторона А беретA1A_1Вероятность выпадения орлаAC\frac{A}{C}При этом, независимо от того, выберет ли В орла или голубя, доход не изменится. Вероятность того, что обе стороны выберут орлов, равнаальфа*=AC\alpha^* = \frac{A}{C}В этот момент достигается точка равновесия.

Здесь, чем больше А, тем больше вероятность выбора орла, потому что прибыль спора велика, а когда больше С, больше и проигрыш, и вероятность спора становится меньше. А после увеличения C прибыль от отбора голубей может быть увеличена, потому что прибыль от голубейA(1AC)A(1 - \frac{A}{C})Следовательно, чем больше C, тем больше выгода от выбора голубей.