История развития языковых моделей: ч. 2, от ChatGPT до рассуждающего режима

История развития языковых моделей: ч. 2, от ChatGPT до рассуждающего режима

Доброго времени суток, «Хабр»!В предыдущей части мы рассмотрели историю языковых моделей от робких шагов Маркова до долгой краткосрочной памяти. Сегодня мы продолжим, пройдемся по ключевым архитектурам последних лет и разберём, как модели научились интерпретировать контекст, предсказывать и даже спорить логически.Пристегните токены — вход в зону трансформаций! Читать далее

13 мая 2025, вторник 20:14 Оставить комментарий Источник

Похожие материалы

История развития языковых моделей: ч. 1, от цепей Маркова до ELIZA

История развития языковых моделей: ч. 1, от цепей Маркова до ELIZAДоброго времени суток, «Хабр»!2025 год на дворе, а мы уже успели познакомиться с сотнями языковых моделей, чьи возможности по-настоящему впечатляют. Написать осмысленный текст, проанализировать текст, найти в нём…

13 мая 2025, вторник 19:59 Источник
Почему токенизация – костыль? Передовые подходы для больших языковых моделей следующего поколения

Сдерживает ли токенизация потенциал больших языковых моделей? Несмотря на свою популярность, этот подход имеет ряд ограничений, которые становятся всё более заметными с развитием LLM. В статье мы разберём, почему токенизация является костылём, какие проблемы она создаёт и какие альтернативные методы предлагают исследователи для их решения. От байтовых моделей до работы с концептами — как пытаются улучшить ситуацию и что это может означать для будущего языковых моделей. Читать далее

12 января 2025, воскресенье 19:15 Источник
Субъективный взгляд на перспективы Больших Языковых Моделей

Прошло около полугода после последней моей статьи о перспективах развития больших языковых моделей. Чтобы не утомлять долгим чтением, её краткое резюме:Критика современных больших языковых моделей (БЯМ): они статичны, неэффективны в вычислениях и обучении, что ведет индустрию…

25 января 2025, суббота 0:26 Источник

История развития языковых моделей: ч. 2, от ChatGPT до рассуждающего режима

Комментарии

Похожие материалы

История развития языковых моделей: ч. 1, от цепей Маркова до ELIZA

Почему токенизация – костыль? Передовые подходы для больших языковых моделей следующего поколения

Субъективный взгляд на перспективы Больших Языковых Моделей