Когда LLM впервые появились, они были немного похожи на детей - говорили первое, что приходило им в голову, и не особо заботились о логике. Им нужно было напоминать: «Подумай, прежде чем отвечать». Многие утверждали, что из-за этого у моделей нет настоящего интеллекта и что их необходимо дополнять либо человеческой помощью, либо каким-то внешним каркасом поверх самой LLM, например Chain of Thought. Читать далее
Уже больше года назад у меня зародилась идея создать свою архитектуру языковой модели. Традиционные модели, "думающие" на уровне токенов мне решительно не нравились. Колоссальный вычислительный бюджет на то, чтобы просто предсказать один токен. Логичным мне казалось оторвать…
15 и 16 сентября в Москве прошло знаковое для российского дизайн-комьюнити событие: конференция TREND. Очевидно что организаторы в очередной раз создали прецедент, событие невиданных ранее масштабов. За это им низкий поклон, хвала и всяческие почести. В этой статье будет краткий и субъективный обзор на то как протекало мероприятие, на спикеров и их лекции. Для полной ясности повторюсь — обзор субъективный, а значит не претендующий на истину в последней инстанции. Но обо всем по порядку. Читать дальше →
На прошлой неделе Илон Маск объявил, что Tesla презентует новый кроссовер Model Y 14 марта. Для нас это будет раннее утро 15-го, поэтому завтра станут известны подробности. Мы пока порассуждали, чего стоит ждать от новой модели. Читать дальше →