Ускоряем неускоряемое или знакомимся с SIMD, часть 2

Ускоряем неускоряемое или знакомимся с SIMD, часть 2 — AVX

Предыдущая часть вызвала бурную дискуссию, в ходе которой выяснилось, что AVX/AVX2 на самом деле есть в десктопных CPU, нет только AVX512. Поэтому продолжаем знакомиться с SIMD, но уже с современной его частью — AVX. А так же разберём некоторые комментарии: медленнее ли _mm256_load_si256, чем прямое обращение к памяти? влияет ли на скорость использование AVX команд над SSE регистрами? действительно ли так плохо использовать _popcnt? Читать дальше →

18 февраля 2019, понедельник 20:21 Оставить комментарий Источник

Похожие материалы

[Перевод] В 10-17 раз быстрее, чем что? Анализ производительности Intel x86-simd-sort (AVX-512)

В статье приведён анализ производительности недавно ставшей популярной [1] реализации сортировки Intel AVX-512.Intel опубликовала невероятно быструю библиотеку сортировки для AVX-512, Numpy переходит на неё, чтобы ускорить сортировку в 10-17 разВ этом анализе мы рассмотрим производительность…

13 июня 2023, вторник 16:11 Источник
Ускоряем неускоряемое или знакомимся с SIMD

Есть класс задач, которые нельзя ускорить за счёт оптимизации алгоритмов, а ускорить надо. В этой практически тупиковой ситуации к нам на помощь приходят разработчики процессоров, которые сделали команды, позволяющие выполнять операции на большим количеством данных за одну…

17 февраля 2019, воскресенье 14:17 Источник
[Перевод] Разновидности SIMD

Во время разработки meshoptimizer частенько возникает вопрос: «А может этому алгоритму использовать SIMD?» Библиотека ориентирована на производительность, но SIMD не всегда обеспечивает значительные преимущества по скорости. К сожалению, SIMD может сделать код менее переносимым и менее…

24 февраля 2019, воскресенье 22:05 Источник

Ускоряем неускоряемое или знакомимся с SIMD, часть 2 — AVX

Комментарии

Похожие материалы

[Перевод] В 10-17 раз быстрее, чем что? Анализ производительности Intel x86-simd-sort (AVX-512)

Ускоряем неускоряемое или знакомимся с SIMD

[Перевод] Разновидности SIMD