Мой локальный агент помнит проект лучше меня. Контекст

Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как

Мой агент на Llama 3.1 8B в третий раз спросил, как меня зовут. Я представился 200 сообщений назад. Контекст переполнился — начало разговора уехало. Большие контексты не спасают: дорого, «Lost in the Middle», локально не влезает. Суммаризация теряет детали. Я сделал по-другому — три типа внешней памяти: Redis для фактов, ChromaDB для семантического поиска, файлы для документов. Контекст маленький, память большая. Внутри — код на Python и грабли, на которые я уже наступил. Читать далее

9 февраля 2026, понедельник 17:31 Оставить комментарий Источник

Похожие материалы

ИИ агент в 1С — графовый агент, файлы и нормальные follow-up запросы 1С

В релизе 1С ИИ агент 0.8.5 агент стал ближе к полноценному рабочему инструменту аналитика: появился более устойчивый графовый цикл выполнения, улучшена работа с файлами и вложениями, а режим «Запрос 1С» теперь поддерживает follow-up уточнения. В статье показываем сценарий: пользователь просит вывести контрагентов, затем добавляет поля ИНН и код, а потом фильтрует только покупателей — агент перестраивает запрос и показывает результат в табличном документе. Читать далее

11 мая 2026, понедельник 4:50 Источник
[Перевод] Деплоим на PythonAnywhere из GitHub

Каждый может сделать так: локальный проект → github С (платным) ssh доступом вы сможете сделать так: локальный проект → PythonAnywhere В статье показано как (бесплатно) сделать так: локальный проект → github → PythonAnywhere Сначала я перечислю, зачем вам это может быть нужно, а затем перейду к тому как реализовать. Не стесняйтесь просколлить статью, если первая часть вам не интересна. Читать дальше →

24 июня 2019, понедельник 13:08 Источник
Синдром бесконечного окна: почему 1 миллион токенов в LLM не решает ваши проблемы (пока)

Год назад индустрия жила лозунгом «Scale is all you need», перекладывая его на размер контекстного окна. 32k казались прорывом, 128k - стандартом, а Gemini с 1M+ токенов - убийцей RAG.Сейчас, в 2025-м, я вижу, как этот миф разбивается о реальность. Разработчики пихают в промпт целые книги, логи за неделю…

15 декабря 2025, понедельник 7:59 Источник

Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как

Комментарии

Похожие материалы

ИИ агент в 1С — графовый агент, файлы и нормальные follow-up запросы 1С

[Перевод] Деплоим на PythonAnywhere из GitHub

Синдром бесконечного окна: почему 1 миллион токенов в LLM не решает ваши проблемы (пока)