[Перевод] Никогда больше не игнорируйте обучение с подкреплением

[Перевод] Никогда больше не игнорируйте обучение с подкреплением

Привет, Хабр! Представляю вашему вниманию перевод статьи «Don’t Ever Ignore Reinforcement Learning Again» автора Michel Kana, Ph.D. Обучение с учителем и обучение без учителя — это ещё не все. Все это знают. Начните с OpenAI Gym. Собираетесь победить чемпиона мира по шахматам, нардам или го? Есть способ, который позволит вам это сделать — обучение с подкреплением. Читать дальше →

10 ноября 2019, воскресенье 23:49 Оставить комментарий Источник

Похожие материалы

[Перевод] Введение в обучение с подкреплением

Всем привет! Мы открыли новый поток на курс «Machine learning», так что ждите в ближайшее время статей связанных с данной, так сказать, дисциплиной. Ну и разумеется открытых семинаров. А сейчас давайте рассмотрим, что такое обучение с подкреплением. Обучение с подкреплением является…

7 ноября 2018, среда 21:40 Источник
[Перевод] Обучение с подкреплением: неформальное знакомство

Обучение с подкреплением (Reinforcement learning, RL) сыграло ключевую роль в стремительном развитии технологий искусственного интеллекта, которое можно было наблюдать в последнее десятилетие. В этом материале мы простыми словами расскажем о том, что такое обучение с подкреплением, поговорим о том, почему оно важно не только как объект исследований, но и как инструмент, который находит множество самых разных вариантов практического применения. Читать далее

30 мая 2022, понедельник 15:05 Источник
[Перевод] Обучение с подкреплением: математический аппарат

В предыдущем материале из этой серии мы простыми словами рассказали о том, что такое обучение с подкреплением (Reinforcement learning, RL). Там мы, на интуитивном уровне, разобрались с тем, как работают механизмы RL, поговорили о том, как обучение с подкреплением применяется для решения практических задач. В этом материале мы изучим математический аппарат RL, начав с его базовых принципов и дойдя до примеров применения этих принципов при проектировании RL-алгоритмов. Читать далее

14 июня 2022, вторник 14:24 Источник

[Перевод] Никогда больше не игнорируйте обучение с подкреплением

Комментарии

Похожие материалы

[Перевод] Введение в обучение с подкреплением

[Перевод] Обучение с подкреплением: неформальное знакомство

[Перевод] Обучение с подкреплением: математический аппарат