Новое доказательство за авторством австралийского писателя-фантаста Грега Игана и доказательство от 2011 года, анонимно опубликованное в сети, признали значительными прорывами в области изучения загадки, которую математики исследуют уже 25 лет 16 сентября 2011 года один фанат…
Математики услышали мольбы тех, кому приходилось протискивать громоздкий диван за угол и волноваться: «Пройдёт ли он вообще?». Задача геометрии «о перестановке дивана» — это попытка найти самую большую фигуру, которая может повернуть под прямым углом в узком коридоре и при…
Математики придумали, как удлинить загадочный мост, соединяющий два далёких континента математического мира Когда в начале 1990-х Эндрю Джон Уайлс доказал Великую теорему Ферма, это стало монументальным шагом не только для математиков, но и для всего человечества. Формулировка…
В предыдущем материале из этой серии мы простыми словами рассказали о том, что такое обучение с подкреплением (Reinforcement learning, RL). Там мы, на интуитивном уровне, разобрались с тем, как работают механизмы RL, поговорили о том, как обучение с подкреплением применяется для решения практических задач. В этом материале мы изучим математический аппарат RL, начав с его базовых принципов и дойдя до примеров применения этих принципов при проектировании RL-алгоритмов. Читать далее