Эффективный запуск и инференс LLM на своем сервере с нуля (часть 1)

Эффективный запуск и инференс LLM на своем сервере с нуля (часть 1)

Привет, Хабр! На связи CEO команды Compressa AI. Недавно обнаружил для себя крутой базовый курс по эффективному запуску и инференсу LLM моделей от легенды AI мира — Andrew NG и его платформы DeepLearning. Он полностью на английском языке в формате видео, поэтому я осмелился адаптировать его под…

9 июля 2024, вторник 1:58 Оставить комментарий Источник

Похожие материалы

Локальный инференс на бюджетных ноутбуках

В середине 2025 года приобрел себе для работы ноутбук Lenovo Thinkbook 14+. После выхода моделей gpt-oss протестировал локальный инференс младшей модели и результаты для меня были весьма удивительными. Затем я провел тесты еще на двух своих ноутбуках, а совсем недавно на работе собрал заинтересованных ребят и появились результаты еще 5 ноутбуков. Если коротко - локальный инференс доступнее чем кажется, а детали в статье. Читать далее

9 декабря 2025, вторник 9:45 Источник
Где живут LLM: разбираем инференс-кластер YADRO и тестируем его производительность

Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO: зачем он нужен, что у него под капотом и как в такой конфигурации показывают себя популярные модели. Кроме того, я немного порассуждаю об альтернативных реализациях кластера и поделюсь планами по развитию реализации нашей. Читать далее

30 июля 2025, среда 13:44 Источник
Эффективный пакетный инференс моделей. Опыт инженеров VK

Привет, Хабр! На связи Артём Петров, я занимаюсь разработкой ПО в центре технологий VK. Хочу рассказать о важной задаче обработки больших объёмов данных с использованием нескольких экземпляров одной и той же модели машинного обучения. Этот процесс называется batch inference («пакетный инференс») и позволяет значительно повысить производительность системы, особенно когда речь идёт о таблицах большого размера. Читать далее

15 апреля 2025, вторник 20:47 Источник

Эффективный запуск и инференс LLM на своем сервере с нуля (часть 1)

Комментарии

Похожие материалы

Локальный инференс на бюджетных ноутбуках

Где живут LLM: разбираем инференс-кластер YADRO и тестируем его производительность

Эффективный пакетный инференс моделей. Опыт инженеров VK