Новостной rss агрегатор

Momentum Attention: когда внимание получает инерцию

Внимание в трансформерах не имеет памяти между шагами, что ведет к нестабильным градиентам. Решение Momentum Attention, где текущие Value векторы смешиваются с предыдущими через экспоненциальное скользящее среднее. Этот подход добавляет инерцию, стабилизируя фокус модели. Внутри разбор механики, корректный код на PyTorch и анализ трейд оффов Читать далее

27 октября 2025, понедельник 15:58 Источник
Делаем свой ChatGPT за 10$ в месяц: разворачиваем LLM на облаке. Подробный гайд на VPS + API-обертка

Еще недавно поиск в Google или Яндекс был главным инструментом инженера. Сегодня все изменилось: AI-помощники вроде ChatGPT, Gemini или Claude, понимающие запросы на естественном языке, кардинально меняют подход к работе. Однако их использование упирается в серьезные преграды: вопросы…

27 октября 2025, понедельник 15:31 Источник
Как ускорить Windows 11 и сделать ее более оптимизированной

Windows 11 — современная и красивая операционка, но порой она может работать медленнее, чем хотелось бы. Особенно это заметно на старых или менее мощных ПК. Хорошая новость в том, что существует несколько простых и эффективных способов улучшить производительность системы, сделать…

27 октября 2025, понедельник 15:04 Источник
Создаём MCP‑сервер на практике

MCP без воды и шаблонного кода на практике: разбираем протокол, поднимаем сервер, тестируем через Inspector и учим LLM торговать через Finam API. Разберёмся, когда MCP выгоднее «обычных функций», как изолировать интеграции и упростить отладку инструментов. Читать далее

27 октября 2025, понедельник 15:00 Источник
Rust и приведение типов

Присматриваемся к Расту, как возможному кандидату на реализацию задачи Card DOM. Рассматриваем, как он поддерживает полиморфные структуры данных, в частности, приведение типов между трейтами. Читать далее

27 октября 2025, понедельник 14:50 Источник
Построение E2E-решения для прогнозирования временных рядов на примере метеоданных

Привет, Хабр!Четыре года назад, еще в институте, одним из моих первых серьезных проектов была простая LSTM-модель для прогноза погоды. Недавно, пересматривая старые наработки, я задался вопросом: насколько дальше можно зайти, применив накопленный за эти годы опыт и современные…

27 октября 2025, понедельник 14:44 Источник
Panther Lake: как Intel объединяет мощность и энергоэффективность в одном чипе

Производителям чипов приходится постоянно решать одну и ту же задачу — находить баланс между скоростью и энергоэффективностью. Intel, судя по последним анонсам, попыталась сделать это в серии Panther Lake. В ней компания собрала воедино успешные элементы предыдущих проектов. Так что…

27 октября 2025, понедельник 14:40 Источник
Как мы в Авито сделали свою LLM — A-vibe

Всем привет! Меня зовут Анастасия Рысьмятова, я руковожу юнитом LLM в Авито.В этой статье я расскажу, как мы с командой создали и адаптировали нашу большую языковую модель A-vibe: зачем решили развивать собственную LLM, как построили токенизатор, собрали датасеты, провели SFT и RL и что получили в итоге. Поделюсь основными экспериментами и покажу наши результаты. Читать далее

27 октября 2025, понедельник 14:17 Источник
На моём производстве социализм, но все кредиты на меня, а сейчас мы в неоплачиваемом отпуске

Когда в России было мало своего производства и не было проблем с логистикой, почти всё заказывали ложементы за три копейки в Китае вместе с товарами. Сейчас ситуация изменилась. Цены у китайцев выросли, логистика подорожала и возить воздух в ложементах, как раньше, стало…

27 октября 2025, понедельник 14:00 Источник
Айсберг регистрации товарного знака: что упускает быстрый поиск и вскрывает полноценная проверка

Бесплатная проверка товарного знака за 5 минут не даёт полную картину. Когда (и как?) можно проверить самому и когда нужен специалист — чтобы не потерять бюджеты на 10 месяцев продвижения бренда и вынужденный ребрендинг. Читать далее

27 октября 2025, понедельник 13:46 Источник