[Перевод] Анимации градиентного спуска и ландшафта потерь нейронных сетей на Python

[Перевод] Анимации градиентного спуска и ландшафта потерь нейронных сетей на Python

Во время изучения различных алгоритмов машинного обучения я наткнулся на ландшафт потерь нейронных сетей с их горными территориями, хребтами и долинами. Эти ландшафты потерь сильно отличались от выпуклых и гладких ландшафтов потерь, с которыми я столкнулся при использовании…

10 января 2021, воскресенье 15:13 Оставить комментарий Источник

Похожие материалы

[Перевод] Объясняем на пальцах принцип действия оптимизаторов для нейронных сетей: основные алгоритмы, и зачем они нужны

Оптимизаторы — важный компонент архитектуры нейронных сетей. Они играют важную роль в процессе тренировки нейронных сетей, помогая им делать всё более точные прогнозы. Специально к старту нового потока расширенного курса по машинному и глубокому обучению, делимся с вами простым описанием основных методик, используемых оптимизаторами градиентного спуска, такими как SGD, Momentum, RMSProp, Adam и др. Читать далее

16 апреля 2021, пятница 18:46 Источник
[Перевод] AI, практический курс. Современные архитектуры глубоких нейронных сетей для классификации изображений

В предыдущей статье, Обзор нейронных сетей для классификации изображений, мы ознакомились с основными базовыми понятиями сверточных нейронных сетей, а также лежащими в их основе идеями. В данной статье мы рассмотрим несколько архитектур глубоких нейронных сетей, обладающих…

26 июля 2018, четверг 9:42 Источник
Математика за оптимизаторами нейронных сетей

В этой статье мы поговорим о математике градиентного спуска, почему при обучении нейронных сетей применяется стохастический градиентный спуск и о вариации SGD (Stochastic Gradient Descent) с использованием скользящего среднего (SGD с momentum и Nesterov Accelerated Gradient). Читать дальше →

7 июня 2021, понедельник 17:22 Источник

[Перевод] Анимации градиентного спуска и ландшафта потерь нейронных сетей на Python

Комментарии

Похожие материалы

[Перевод] Объясняем на пальцах принцип действия оптимизаторов для нейронных сетей: основные алгоритмы, и зачем они нужны

[Перевод] AI, практический курс. Современные архитектуры глубоких нейронных сетей для классификации изображений

Математика за оптимизаторами нейронных сетей