Как сжимать языковые модели без дообучения

Как сжимать языковые модели без дообучения

Привет, Хабр! Меня зовут Валентин Малых, я - и.о. руководителя направления фундаментальных исследований в MWS AI. Сегодня я расскажу об одном нашем исследовании по сжатию LLM. Если простыми словами, то это про то, как сделать большую модель чуть-чуть менее требовательной в плане памяти

2 декабря 2025, вторник 13:00 Оставить комментарий Источник

Похожие материалы

[Перевод] Новый фреймворк Memento позволяет агентам на базе LLM учиться на опыте — без дообучения модели

Учёные из Юниверсити Колледж Лондон (UCL) и лаборатории Huawei Noah’s Ark Lab разработали новый подход к обучению, который позволяет агентам на базе больших языковых моделей (LLM) динамически адаптироваться к среде без дообучения самой модели. Метод основан на системе структурированной памяти, которая автоматически обновляется по мере накопления агентом опыта, что даёт возможность непрерывно повышать качество его работы. Читать далее

8 сентября 2025, понедельник 20:24 Источник
Важность времени на размышления: как работают вычисления во время инференса

Еще в 2020 году в статье о GPT-3 появился график, заслуживающий отдельного внимания: чем больше языковые модели, тем лучше они справляются с задачами без дообучения (zero-shot). Пять лет этот график был путеводной звездой для исследователей ИИ, влияя на всё — от архитектуры моделей до разработки железа. C выпуском o1 OpenAI пришел с новым графиком. На этот раз речь не только о размере — а о том, чтобы дать моделям время думать. Читать далее

28 февраля 2025, пятница 14:25 Источник
[Перевод] Как прокачать ИИ-агента без дообучения: Agent Skills

Большие языковые модели давно вышли за пределы «болталок» и теперь работают в реальных средах — пишут код, анализируют данные, управляют инструментами. Однако чем мощнее становятся такие агенты, тем отчётливее видно: дело уже не в нейросетевых весах, а в доступе к…

17 ноября 2025, понедельник 14:57 Источник

Как сжимать языковые модели без дообучения

Комментарии

Похожие материалы

[Перевод] Новый фреймворк Memento позволяет агентам на базе LLM учиться на опыте — без дообучения модели

Важность времени на размышления: как работают вычисления во время инференса

[Перевод] Как прокачать ИИ-агента без дообучения: Agent Skills