LatentMAS: Секрет AI-агентов, которые думают без слов, работают точнее и экономят до 80% токенов

LatentMAS: Секрет AI-агентов, которые думают без слов, работают точнее и экономят до 80% токенов

Классические AI-агенты общаются текстом — это дорого и медленно. LatentMAS раскрывает секрет "безмолвного" общения: агенты обмениваются "мыслями" напрямую через общую латентную память (KV-кэш). Разбираемся, как эта архитектура позволяет добиться двузначного прироста точности и радикально сократить расходы на токены. Читать далее

2 декабря 2025, вторник 7:00 Оставить комментарий Источник

Похожие материалы

«Когда агенты перестают говорить»: как LatentMAS предлагает новый язык общения ИИ-агентов

Мультиагентные системы на базе LLM почти всегда строятся вокруг текстовой коммуникации. Агенты объясняют друг другу планы, уточняют шаги, формируют выводы — всё это через генерацию токенов. Такой подход кажется естественным, но он порождает фундаментальные проблемы: текст…

4 декабря 2025, четверг 14:52 Источник
Память ИИ‑агентов: как агенты запоминают, забывают и учатся

Память ИИ‑агентов: как агенты запоминают, забывают и учатсяВсем привет! Продолжаю рассказывать и делиться своим опытом создания и внедрения ИИ-агентов. Сегодня давайте поговорим про память ИИ-агентов. Я поделюсь какие типы памяти использую чаще всего, поговорим про базовый минимум без которого нет смысла пытаться строить ИИ-агентов. Начнём с того как вообще работает контекстное окно и почему его не хватает, потом разберём какие типы памяти бывают, как они хранятся и как подгружаются в контекст. Читать далее

20 марта 2026, пятница 15:58 Источник
[Перевод] Картинка стоит 170 токенов: как GPT-4o кодирует изображения?

Интересный факт: GPT-4o взимает по 170 токенов за обработку каждого тайла 512x512 , используемого в режиме высокого разрешения. При соотношении примерно 0,75 токенов на слово можно предположить, что картинка стоит примерно 227 слов, что всего в четыре раза меньше, чем в поговорке…

15 августа 2024, четверг 16:02 Источник

LatentMAS: Секрет AI-агентов, которые думают без слов, работают точнее и экономят до 80% токенов

Комментарии

Похожие материалы

«Когда агенты перестают говорить»: как LatentMAS предлагает новый язык общения ИИ-агентов

Память ИИ‑агентов: как агенты запоминают, забывают и учатся

[Перевод] Картинка стоит 170 токенов: как GPT-4o кодирует изображения?