Изображение:Voron-ML-RL-slides.pdf

Материал из MachineLearning.

Перейти к: навигация, поиск

Voron-ML-RL-slides.pdf (размер файла: 1,06 МБ, MIME-тип: application/pdf)

Обучение с подкреплением (Reinforcement Learning)

История файла

Нажмите на дату/время, чтобы просмотреть как тогда выглядел файл.

Дата/времяУчастникРазмер объектаРазмер файлаПримечание
текущий15:02, 27 апреля 2023Vokov (Обсуждение | вклад)1,06 МБ+Актёр-критик +Томпсоновское сэмплирование
22:55, 18 апреля 2021Vokov (Обсуждение | вклад)1,89 МБвесна 2021
12:02, 18 ноября 2020Vokov (Обсуждение | вклад)1,89 МБ+сократил бандитов +DQN +вернул SARSA +концепции model-free/model-based
19:41, 14 декабря 2019Vokov (Обсуждение | вклад)940 КБмелкие правки
23:29, 31 октября 2017Vokov (Обсуждение | вклад)969 КБ+policy gradient -SARSA
23:23, 16 ноября 2016Vokov (Обсуждение | вклад)996 КБ+ contextual bandit
18:46, 20 ноября 2015Vokov (Обсуждение | вклад)932 КБДобавлен слайд про общий алгоритм контекстуального бандита
23:25, 15 ноября 2015Vokov (Обсуждение | вклад)911 КБдобавлены контекстные бандиты, параметр E/E для UCB
07:13, 21 июня 2014Vokov (Обсуждение | вклад)980 КБ
21:30, 20 ноября 2012Vokov (Обсуждение | вклад)832 КБЕщё порция улучшений, исправлены опечатки
17:04, 20 ноября 2012Vokov (Обсуждение | вклад)830 КБнесколько исправлений + слайд со списком приложений
13:20, 20 ноября 2012Vokov (Обсуждение | вклад)807 КБОбучение с подкреплением (Reinforcement Learning)

Следующие страницы ссылаются на данный файл:

Личные инструменты