Ускорение LLM: универсальные методы для популярных архитектур

Ускорение LLM: универсальные методы для популярных архитектур

ML‑модели применяются в сервисах Яндекса уже много лет, мы накопили большой опыт в их обучении. Статьи об этом коллеги регулярно публикуют, в том числе на Хабре. Но сегодня хочу обсудить другую не менее важную задачу — ускорение инференса (процесса работы…

5 февраля 2025, среда 12:00 Оставить комментарий Источник

Похожие материалы

Влажные салфетки Сиф для очищения поверхностей без разводов универсальные, 30 шт

Как часто мы бываем в поездках, путешествиях, на даче или просто хотим быстро очистить загрязнения на кухне, в ванной комнате? Салфетки универсальные Сиф моментально справятся с любой задачей! В отличие от обычных бытовых средств в бутылках влажные салфетки для очищения поверхностей Сиф универсальные, 30 шт. всегда под рукой! Чистящее средство можно положить в машину, чтобы … Влажные салфетки Сиф для очищения поверхностей без разводов универсальные, 30 шт Read More »

31 марта 2026, вторник 21:21 Источник
[Перевод] Большое сравнение архитектур LLM

Это перевод классной статьи с детальным обзором архитектур главных опенсорсных LLM: очень структурировано, доходчиво и с изумительными картиночками. И такой обзор просто обязан быть на русском языке. Поговорим про DeepSeek V3/R1, OLMo 2, Gemma 3, Mistral Small 3.1, Llama 4, Qwen3, SmolLM3, Kimi K2, GPT-OSS, Grok 2.5, GLM-4.5,…

22 октября 2025, среда 7:38 Источник
Проблемы с логикой у LLM и с доверием не только у LLM

Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые

22 июля 2024, понедельник 4:23 Источник

Ускорение LLM: универсальные методы для популярных архитектур

Комментарии

Похожие материалы

Влажные салфетки Сиф для очищения поверхностей без разводов универсальные, 30 шт

[Перевод] Большое сравнение архитектур LLM

Проблемы с логикой у LLM и с доверием не только у LLM