«Сверхвеса» в больших языковых моделях

«Сверхвеса» в больших языковых моделях

Обзор посвящен исследованию, на тему «сверхвеса» (super weights) в больших языковых моделях (LLM). Авторы обнаружили, что очень небольшое количество параметров (вплоть до одного скаляра!) в LLM играет непропорционально важную роль в их способности генерировать…

25 января 2025, суббота 23:21 Оставить комментарий Источник

Похожие материалы

Субъективный взгляд на перспективы Больших Языковых Моделей

Прошло около полугода после последней моей статьи о перспективах развития больших языковых моделей. Чтобы не утомлять долгим чтением, её краткое резюме:Критика современных больших языковых моделей (БЯМ): они статичны, неэффективны в вычислениях и обучении, что ведет индустрию…

25 января 2025, суббота 0:26 Источник
Используй ChatGPT правильно, или проблема контекста в больших языковых моделях

Данная статья написана, чтобы помочь рядовым пользователям правильно использовать ChatGPT. В ней раскрываются тонкости устройства больших языковых моделей. А если вы разбираетесь в том, как всё работает, то не тратьте время и листайте ленту дальше!Написал я эту статью потому, что сам делал ошибки и не понимал, что не так, получая неудовлетворительный результат. Главным образом, я хочу рассказать, что такое размер контекста, на что он влияет и как с этим жить. Читать далее

14 сентября 2023, четверг 12:59 Источник
Почему «утекают» данные в больших языковых моделях. Часть 1

При разработке чат-ботов на основе больших языковых моделей (Large Language Model, LLM) всё чаще становится актуальной проблема «утечки» конфиденциальных данных. Причём она сопряжена со множеством значимых негативных последствий, как для клиентов, так и для бизнеса. Читать далее

17 июня 2024, понедельник 12:32 Источник

«Сверхвеса» в больших языковых моделях

Комментарии

Похожие материалы

Субъективный взгляд на перспективы Больших Языковых Моделей

Используй ChatGPT правильно, или проблема контекста в больших языковых моделях

Почему «утекают» данные в больших языковых моделях. Часть 1