Категория "обучение с подкреплением"

Список всех статей из категории "обучение с подкреплением"

OfflineRL — алгоритм BCQ

OfflineRL — алгоритм BCQ

Читать
Введение в обучение с подкреплением 4 - Q-обучение и Сарса

Введение в обучение с подкреплением 4 - Q-обучение и Сарса

Читать
[Google Brain] Может ли агент учиться во сне?

[Google Brain] Может ли агент учиться во сне?

Читать
Сводный список ресурсов в области глубокого обучения [фреймворк, наборы данных, журналы]

Сводный список ресурсов в области глубокого обучения [фреймворк, наборы данных, журналы]

Читать
Беркли, Стэнфорд, Penn Joint Publishing: Изучение прогностических моделей на основе наблюдений и взаимодействий

Беркли, Стэнфорд, Penn Joint Publishing: Изучение прогностических моделей на основе наблюдений и взаимодействий

Читать