Долгая дорога к DiT (часть 2)

Долгая дорога к DiT (часть 2)

Первая треть пути преодолена и совсем скоро мы создадим генератор картинок на целиком на архитектуре трансформеров. Но перед тем как совершить финальный скачок к Diffusion Transformers (DiT) нам сначала надо научиться работать с готовыми датасетами и освоить генерацию изображений…

26 октября 2025, воскресенье 15:29 Оставить комментарий Источник

Похожие материалы

Долгая дорога к DiT (часть 3)

Заключительная (но ещё не последняя) статья из цикла про диффузные модели, где мы наконец отбросим примитивную модель из полносвязных слоёв и напишем работающий генератор изображений c архитектурой Diffusion Transformer (DiT). Разберёмся зачем нарезать изображения на квадратики и увидим, что произойдёт с вашей генерацией, если проигнорировать главную "слабость" трансформеров - неспособность понимать порядок. Читать далее

27 ноября 2025, четверг 6:48 Источник
Долгая дорога к DiT (часть 1)

Это лето обрадовало нас прорывом в обработке изображений с помощью нейросетей. Одна за другой выходят такие модели как Flux.1 Kontext, Qwen-Image-Edit, Gemini 2.4 Flash Image Preview (Nano Banana) демонстрируя недостижимый до сих пор уровень манипуляции цифровым контентом. Это не замена Фотошопу, а технология,…

6 сентября 2025, суббота 14:15 Источник
Часть 3: Diffusion Transformer (DiT) — Stable Diffusion 3 как она есть

В этой статье погрузимся в мир генерации изображений с Diffusion Transformer (DiT) — сердцем Stable Diffusion 3. Разберем как она устроена и как работает Читать далее

2 июля 2025, среда 21:11 Источник

Долгая дорога к DiT (часть 2)

Комментарии

Похожие материалы

Долгая дорога к DiT (часть 3)

Долгая дорога к DiT (часть 1)

Часть 3: Diffusion Transformer (DiT) — Stable Diffusion 3 как она есть