[Перевод] Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением

[Перевод] Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением

Изложение статьи от том, что давно известные эволюционные стратегии оптимизации могут превзойти алгоритмы обучения с подкреплением. Преимущества эволюционных стратегий: Простота реализации Не требуется обратного распространения Легко масштабируется в распределенной среде вычислений Малое число гиперпараметров. Читать дальше →

6 июня 2017, вторник 16:38 Оставить комментарий Источник

Похожие материалы

[Перевод] Обучение с подкреплением или эволюционные стратегии? — И то, и другое

Привет, Хабр! Мы нечасто решаемся размещать здесь переводы текстов двухлетней давности, без кода и явно академической направленности — но сегодня сделаем исключение. Надеемся, что дилемма, вынесенная в заголовок статьи, волнует многих наших читателей, а фундаментальную работу об эволюционных стратегиях, с которой полемизирует этот пост, вы уже читали в оригинале или прочитаете сейчас. Добро пожаловать под кат! Читать дальше →

15 июня 2019, суббота 0:54 Источник
[Перевод] Обучение с подкреплением: неформальное знакомство

Обучение с подкреплением (Reinforcement learning, RL) сыграло ключевую роль в стремительном развитии технологий искусственного интеллекта, которое можно было наблюдать в последнее десятилетие. В этом материале мы простыми словами расскажем о том, что такое обучение с подкреплением, поговорим о том, почему оно важно не только как объект исследований, но и как инструмент, который находит множество самых разных вариантов практического применения. Читать далее

30 мая 2022, понедельник 15:05 Источник
[Перевод] Обучение с подкреплением: математический аппарат

В предыдущем материале из этой серии мы простыми словами рассказали о том, что такое обучение с подкреплением (Reinforcement learning, RL). Там мы, на интуитивном уровне, разобрались с тем, как работают механизмы RL, поговорили о том, как обучение с подкреплением применяется для решения практических задач. В этом материале мы изучим математический аппарат RL, начав с его базовых принципов и дойдя до примеров применения этих принципов при проектировании RL-алгоритмов. Читать далее

14 июня 2022, вторник 14:24 Источник

[Перевод] Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением

Комментарии

Похожие материалы

[Перевод] Обучение с подкреплением или эволюционные стратегии? — И то, и другое

[Перевод] Обучение с подкреплением: неформальное знакомство

[Перевод] Обучение с подкреплением: математический аппарат