[Перевод] Введение в обучение с подкреплением: от многорукого бандита до полноценного RL агента

[Перевод] Введение в обучение с подкреплением: от многорукого бандита до полноценного RL агента

Привет, Хабр! Обучение с подкреплением является одним из самых перспективных направлений машинного обучения. С его помощью искусственный интеллект сегодня способен решать широчайший спектр задач: от робототехники и видеоигр до моделирования поведения покупателей и здравоохранения. В этой вводной статье мы изучим главную идею reinforcement learning и с нуля построим собственного самообучающегося бота. Читать дальше →

4 декабря 2017, понедельник 15:23 Оставить комментарий Источник

Похожие материалы

Особенности практического использования различных алгоритмов Многорукого бандита

Большинство статей про алгоритмы, используемые для решения задачи многорукого бандита, очень академичны. Они пестрят формулами, графиками и статистическими таблицами. При этом как будто подразумевается, что у нас есть неизменяемый набор ручек для дёргания и n→∞ попыток. В этой

19 мая 2021, среда 0:14 Источник
Учим агента играть в Mario Kart с помощью фильтров

Владимир Иванов vivanov879, Sr. Deep Learning Engineer в NVIDIA, продолжает рассказывать про обучение с подкреплением. В этой статье речь пойдет про обучение агента для прохождения квестов и о том, как нейросети используют фильтры для распознавания изображений. В предыдущей статье разбиралось обучение агента для простых стрелялок. Про применение обучения с подкреплением на практике Владимир будет рассказывать на AI Conference 22 ноября. Читать дальше →

12 ноября 2018, понедельник 14:44 Источник
[Перевод] Введение в обучение с подкреплением

Всем привет! Мы открыли новый поток на курс «Machine learning», так что ждите в ближайшее время статей связанных с данной, так сказать, дисциплиной. Ну и разумеется открытых семинаров. А сейчас давайте рассмотрим, что такое обучение с подкреплением. Обучение с подкреплением является…

7 ноября 2018, среда 21:40 Источник

[Перевод] Введение в обучение с подкреплением: от многорукого бандита до полноценного RL агента

Комментарии

Похожие материалы

Особенности практического использования различных алгоритмов Многорукого бандита

Учим агента играть в Mario Kart с помощью фильтров

[Перевод] Введение в обучение с подкреплением