Reinforcement Learning: Model-free & Deep RL

Reinforcement Learning: Model-free & Deep RL

Продолжаю погружаться в Reinforcement Learning. Здесь продолжение статьи Intro Reinforcement Learning. Если предыдущая часть помогла вам понять, что такое среда, агент, награды и функции ценности, то здесь мы сделаем шаг дальше: мы переходим к model-free алгоритмам и Deep Reinforcement Learning, где агент учится оптимальной стратегии, не имея прямого доступа к модели среды. Читать далее

19 ноября 2025, среда 22:45 Оставить комментарий Источник

Похожие материалы

Reinforcement Learning: Policy gradient methods

В предыдущих статьях Intro Reinforcement Learning и Reinforcement Learning: Model-free & Deep RL были рассмотрены подходы, в которых оптимальные действия находились косвенно через оценку полезности состояний или пар «состояние–действие». Такие методы принято называть value-based. Однако возникает…

23 декабря 2025, вторник 2:16 Источник
Создаем собственные окружения в Reinforcement Learning

Готовые RL‑окружения удобны для старта, но в реальных задачах редко хватает чужих правил и бенчмарков. В статье разбираем, как создать собственную среду для обучения с подкреплением: задать действия и наблюдения, продумать функцию награды и не сломать обучение на базовых ошибках. Читать далее

2 июля 2026, четверг 19:40 Источник
[Перевод] Реализуем Q learning на Python

Обучение с подкреплением (Reinforcement learning) является одним из направлений ML. Суть этого метода заключается в том, что обучаемая система или агент учится принимать оптимальные решения через взаимодействие со средой. В отличие от других подходов, Reinforcement learning (RL) не требует заранее…

2 октября 2025, четверг 10:23 Источник

Reinforcement Learning: Model-free & Deep RL

Комментарии

Похожие материалы

Reinforcement Learning: Policy gradient methods

Создаем собственные окружения в Reinforcement Learning

[Перевод] Реализуем Q learning на Python