Теория игр (2) - Равновесие Нэша

машинное обучение искусственный интеллект
Теория игр (2) - Равновесие Нэша

Мало знаний, большой вызов! Эта статья участвует в "Необходимые знания для программистов«Творческая деятельность.

Равновесие по Нэшу

Назван в честь лауреата Нобелевской премии по экономике 1994 года Джона Нэша. Сегодня равновесие Нэша широко используется в исследованиях в различных областях, особенно в области экономической науки, равновесие Нэша оказывает очень важное влияние на экономику.

Так что же такое равновесие Нэша?

Теория игр изучает рациональное поведение, то есть каждый игрок будет выбирать свою наиболее выгодную стратегию в соответствии со стратегией противника, то естьоптимальный ответ.

Структуры данных — Введение в деревья и бинарные деревья Расскажите, что такое дерево и основные понятия дерева, что такое бинарное дерево, а также классификацию и характеристики бинарного дерева.

A A
откровенный сопротивляться
B откровенный 3,3 0,5
B сопротивляться 5,0 1,1

Классическая задача теории игр, дилемма заключенного, где у A и B есть два заключенных, каждая камера представляет собой ситуацию, A и B задают свою собственную стратегию, а единица дает A и B функцию полезности, которая дает их соответствующие стратегии. Каждое комбинированное значение функции полезности объединяет первое значение функции полезности со значением А и второе значение функции полезности со значением В. Если A решит признаться, то заключенный B будет приговорен к 5 годам, если он признается 3 и сопротивляется, потому что 3 года меньше, чем 5 лет, поэтому B выберет признание, тогда, когда A решит сопротивляться, B выберет признание как выпуска, а сопротивление составляет 1 год, поэтому Б решил признаться.

То же самое верно и для А: независимо от того, кого выберет Б, он выберет признание. Для игроков A и B в игре, независимо от того, какую стратегию выберет другая сторона, это их собственная стратегия.доминирующая стратегия. стратегия сопротивленияплохая стратегия.

доминирующая стратегия

Вообще говоря, в игре с двумя игроками, если рассмотреть любые две стратегии A1 и A2 из множества стратегий игрока A, независимо от того, какую стратегию изберет противник, выигрыш от стратегии A1 игрока A всегда будет строго больше, чем от стратегии A1 игрока A. Возврат А2, мы говорим, что в стратегии А2 строго доминирует стратегия А1, или стратегия А1 является строго доминирующей стратегией, а стратегия А2 называется строго подчиненной стратегией.

Если независимо от того, какую стратегию использует противник, выигрыш игрока А по стратегии А1 всегда строго больше или равен выигрышу по стратегии А2, то говорят, что в стратегии А2 доминирует стратегия А1.доминирующая стратегия, или стратегия A1 является доминирующей стратегией, а стратегия A2 называетсяплохая стратегия.

равновесие доминирующей стратегии

В экономике — стабильная и измеримая модель интерактивного поведения. Когда каждый игрок в игре выбирает свою собственную доминирующую стратегию, соответствующий результат игры является равновесием доминирующей стратегии.

равновесие доминирующей стратегии

Равновесие по Нэшу

Комбинация политик, состоящая из оптимальных политик всех игроков. Эта комбинация стратегий также известна как равновесие Нэша.

В равновесии Нэша у каждого рационального участника нет стимула менять стратегию независимо, потому что каждый игрок в игре не может увеличить выгоду, в одностороннем порядке изменив свою стратегию.

Индивидуальная рациональность не означает наилучший исход, это видно из дилеммы заключенного: все выбирают исповедаться, а не сопротивляться, и каждый получает большую выгоду.

кооперативное равновесие

Все стороны координируют действия для достижения результата общей стратегии, оптимизированной для платежей. Вообще говоря, если игроки в игре способны реализовать согласованную стратегию, выбранная ими стратегия представляет собойкооперативное равновесие.