[Перевод] Пишем кастомные CUDA-ядра на Triton

[Перевод] Пишем кастомные CUDA-ядра на Triton

Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA. Здесь будут изложены основы программирования для GPU и рассказано, как для этой цели используется Triton. Учитывая нынешний успех глубокого обучения и вал исследовательских статей на эту тему, часто…

30 ноября 2022, среда 13:01 Оставить комментарий Источник

Похожие материалы

[Перевод] Triton: Open Source язык для ядер Deep Learning

Подобный Python Triton уже работает в ядрах, которые в 2 раза эффективнее эквивалентных реализаций Torch. А ядра матричного умножения FP16, сравнимые производительностью с cuBLAS, на Triton займут менее 25 строк. Как утверждает автор, многие программисты не могут написать такие ядра. Подробностями о Triton делимся к старту курса по ML и DL. Читать далее

23 сентября 2021, четверг 21:49 Источник
Кратко про язык программирования Triton

Triton был разработан специально для выполнения на GPU и предоставляет удобную Python-ориентированную среду.Triton позволяет использовать модель программирования, основанную на блоках, которая значительно отличается от традиционной модели CUDA. Вместо управления потоками на уровне скалярных инструкций, Triton оперирует блоками данных, что в целом дает более лучшую производительность. Читать далее

18 апреля 2024, четверг 15:02 Источник
[Перевод] Обзор CUDA: сюрпризы с производительностью

Наверное, я очень опоздал с изучением CUDA. До недавнего времени даже не знал, что CUDA — это просто C++ с небольшими добавками. Если бы я знал, что изучение её пойдёт как по маслу, я бы столько не медлил. Но, если у вас есть багаж привычек C++ , то код на CUDA у вас будет получаться низкокачественным. Поэтому расскажу вам о некоторых уроках, изученных на практике — возможно, мой опыт поможет вам ускорить код. Читать далее

17 апреля 2025, четверг 16:25 Источник

[Перевод] Пишем кастомные CUDA-ядра на Triton

Комментарии

Похожие материалы

[Перевод] Triton: Open Source язык для ядер Deep Learning

Кратко про язык программирования Triton

[Перевод] Обзор CUDA: сюрпризы с производительностью