Категория "обучение с подкреплением"

Список всех статей из категории "обучение с подкреплением"

Примечания к градиенту политики для обучения с подкреплением

Примечания к градиенту политики для обучения с подкреплением

Читать

Часть II: Обзор алгоритмов обучения с подкреплением

Часть II: Обзор алгоритмов обучения с подкреплением

Читать

Сможете ли вы победить ИИ в Дудижу? Набор инструментов для обучения с подкреплением для карточных игр, RLCard, уже здесь!

Сможете ли вы победить ИИ в Дудижу? Набор инструментов для обучения с подкреплением для карточных игр, RLCard, уже здесь!

Читать

Принцип Q-обучения и его простой случай

Принцип Q-обучения и его простой случай

Читать

[ICLR 2018] Алгоритм TRPO для интеграции модели [с кодом]

[ICLR 2018] Алгоритм TRPO для интеграции модели [с кодом]

Читать

«
1
2
...
4
5
6
7
8
9
10
11
12
»