Субъективный взгляд на перспективы Больших Языковых Моделей

Субъективный взгляд на перспективы Больших Языковых Моделей

Прошло около полугода после последней моей статьи о перспективах развития больших языковых моделей. Чтобы не утомлять долгим чтением, её краткое резюме:Критика современных больших языковых моделей (БЯМ): они статичны, неэффективны в вычислениях и обучении, что ведет индустрию…

25 января 2025, суббота 0:26 Оставить комментарий Источник

Похожие материалы

Почему токенизация – костыль? Передовые подходы для больших языковых моделей следующего поколения

Сдерживает ли токенизация потенциал больших языковых моделей? Несмотря на свою популярность, этот подход имеет ряд ограничений, которые становятся всё более заметными с развитием LLM. В статье мы разберём, почему токенизация является костылём, какие проблемы она создаёт и какие альтернативные методы предлагают исследователи для их решения. От байтовых моделей до работы с концептами — как пытаются улучшить ситуацию и что это может означать для будущего языковых моделей. Читать далее

12 января 2025, воскресенье 19:15 Источник
Вкусы и предпочтения больших языковых моделей

У больших языковых моделей есть системы ценностей. БЯМ по-разному отзываются о чужих текстах или даже человеческой жизни, а их оценочные суждения и качество ответов отличаются в зависимости от упоминаемой расы, пола и национальности человека. Не вызывает никаких сомнений, что…

30 августа 2025, суббота 20:12 Источник
Как используют разницу между поколениями в IT-компаниях

Люди воспринимают любую работу с точки зрения своего жизненного опыта и своих ценностей. Система ценностей формируется в детстве под влиянием экономических, социальных, политических, технологических факторов внешней среды. Поэтому системы ценностей у людей различаются в…

8 августа 2017, вторник 14:01 Источник

Субъективный взгляд на перспективы Больших Языковых Моделей

Комментарии

Похожие материалы

Почему токенизация – костыль? Передовые подходы для больших языковых моделей следующего поколения

Вкусы и предпочтения больших языковых моделей

Как используют разницу между поколениями в IT-компаниях