Анонсируем новый линтер для Go, который одновременно является песочницей для прототипирования ваших задумок в мире статического анализа. go-critic построен вокруг следующих наблюдений: Лучше иметь “good enough” реализацию проверки, чем не иметь её вовсе Если проверка спорная, это ещё…
Привет, Хабр!Actor-Critic — это класс алгоритмов в RL, суть которого довольно проста на словах, он сочетает в себе такие полтики как policy-based и оценки value-based. У нас есть два главных действующих лица: Actor и Critic. Actor отвечает за выбор действий, т.е формирование политики поведения, он принимает…
Вы, возможно, помните недавний анонс нового статического анализатора для Go под названием go-critic. Я проверил с его помощью проект golang/go и отправил несколько патчей, которые исправляют некоторые найденные там проблемы. В этой статье мы разберём исправленный код, а также будем мотивироваться отправлять ещё больше подобных изменений в Go. Для самых нетерпеливых: обновляемый список трофеев. Читать дальше →
Это вольный перевод статьи Rudy Gilman и Katherine Wang Intuitive RL: Intro to Advantage-Actor-Critic (A2C).Специалисты по усиленному обучению (RL) подготовили множество отличных учебных пособий. Большинство, однако, описывают RL в терминах математических уравнений и абстрактных диаграмм. Нам нравится думать о…