Недавно я задавался новозаветным вопросом о трафике в эпоху нейросетей:— Где брать трафик в мире победивших нейросетей?— Где брать трафик в мире победивших нейросетей? Часть 2, где мы меняем сам вопросМоя гипотеза была, что из-за нейросетей поисковый трафик будет падать.На днях
Данные за апрель 2025. Расклад в главной мировой гонке века следующий. Отранжировано по убыванию. 1. ChatGPT — 5,1 млрд. (!) визитов в месяц. ChatGPT вошел в пятерку самых посещаемых сайтов в мире. Абсолютное доминирование.2. DeepSeek от китайцев — 480 млн. Хороший ответ с новой архитектурой и…
Сдерживает ли токенизация потенциал больших языковых моделей? Несмотря на свою популярность, этот подход имеет ряд ограничений, которые становятся всё более заметными с развитием LLM. В статье мы разберём, почему токенизация является костылём, какие проблемы она создаёт и какие альтернативные методы предлагают исследователи для их решения. От байтовых моделей до работы с концептами — как пытаются улучшить ситуацию и что это может означать для будущего языковых моделей. Читать далее
Прошло около полугода после последней моей статьи о перспективах развития больших языковых моделей. Чтобы не утомлять долгим чтением, её краткое резюме:Критика современных больших языковых моделей (БЯМ): они статичны, неэффективны в вычислениях и обучении, что ведет индустрию…