Категория "обучение с подкреплением"

Список всех статей из категории "обучение с подкреплением"

Примечания к градиенту политики для обучения с подкреплением

Примечания к градиенту политики для обучения с подкреплением

Читать
Часть II: Обзор алгоритмов обучения с подкреплением

Часть II: Обзор алгоритмов обучения с подкреплением

Читать
Сможете ли вы победить ИИ в Дудижу? Набор инструментов для обучения с подкреплением для карточных игр, RLCard, уже здесь!

Сможете ли вы победить ИИ в Дудижу? Набор инструментов для обучения с подкреплением для карточных игр, RLCard, уже здесь!

Читать
Принцип Q-обучения и его простой случай

Принцип Q-обучения и его простой случай

Читать
[ICLR 2018] Алгоритм TRPO для интеграции модели [с кодом]

[ICLR 2018] Алгоритм TRPO для интеграции модели [с кодом]

Читать