Пишем LLM бенчмарк для GPU-серверов с картами NVIDIA в Ollama

Пишем LLM бенчмарк для GPU-серверов с картами NVIDIA в Ollama

Как мы в HOSTKEY создали собственный LLM-бенчмарк для GPU-серверов с видеокартами NVIDIA в Ollama. Подробно о методике тестирования, коде на bash, результатах и закономерностях производительности. Читать далее

12 ноября 2025, среда 11:01 Оставить комментарий Источник

Похожие материалы

Lemonade — локальный LLM-сервер при поддержке AMD. Зачем он нужен, если есть Ollama?

Ryzen AI 9 HX 370 - это чип с NPU на 50 TOPS и Ollama его не видит - из-за своей архитектуры. Собственно, сама Ollama работает поверх llama.cpp, llama.cpp поддерживает GPU через CUDA, Metal, Vulkan и ROCm. А вот AMD GPU Ollama запускает - через ROCm и Vulkan. Но AMD NPU на базе архитектуры XDNA туда, к сожалению, не входит. Ryzen AI 300, Ryzen 8040, Ryzen 7040 -

4 мая 2026, понедельник 14:37 Источник
Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

3 дня борьбы с ROCm, RX580 и Ollama: как я запустил LLM на домашней видеокартеЯ попытался запустить LLM inference на старой AMD RX580 через ROCm и Ollama в Kubernetes. GPU определялся, VRAM занималась, контейнеры запускались — но inference падал с ошибками hipMemGetInfo, а иногда просто выдавал бессмысленный текст.В статье

15 марта 2026, воскресенье 6:15 Источник
Установка NVIDIA GeForce GTX 1070 Founders Edition в бокс для GPU Nvidia Tesla S2050

Доброго времени суток, товарищи Хабровчане. Сегодня будет небольшая статья про установку «турбинных» карт NVIDIA GeForce GTX 1070 Founders Edition в бокс Nvidia Tesla S2050 Server позволяющий установить 4 GPU-карты и подключить их к серверу через интерфейсные карты Nvidia P797 HIC по шине PCI-E 16x 2.0 полной ширины. Бокс был предварительно доработан, чтобы мог работать не только с GPU-картами Nvidia Tesla M2050. Продолжение истории под катом

13 ноября 2019, среда 21:53 Источник

Пишем LLM бенчмарк для GPU-серверов с картами NVIDIA в Ollama

Комментарии

Похожие материалы

Lemonade — локальный LLM-сервер при поддержке AMD. Зачем он нужен, если есть Ollama?

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

Установка NVIDIA GeForce GTX 1070 Founders Edition в бокс для GPU Nvidia Tesla S2050