Год назад я заменил RAG в продукте на «просто большой контекст» и на время действительно выиграл в простоте: стало меньше пайплайна и онколла, больше фич. Но прод быстро показал цену такого решения — хоть ответы звучали уверенно, доверия к ним не было. Статья о том, почему в 2026 году RAG возвращается в более взрослой форме и что именно приходится проектировать, чтобы знания оставались актуальными и проверяемыми. Разобрать RAG
Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и…
Генерация дополненного извлечения (RAG) стала самым популярным способом предоставления LLM дополнительного контекста для создания адаптированных выходных данных. Это отлично подходит для приложений LLM, таких как чат-боты или агенты ИИ, поскольку RAG предоставляет пользователям…
Привет, Хабр! Недавно у меня появилась задача - собрать RAG-систему для интернет-энциклопедии. В поисках решения я вышел на новый подход к гибридному RAG - “DAT: Dynamic Alpha Tuning for Hybrid Retrieval in Retrieval-Augmented Generation” (Динамическая настройка Альфа-параметра для гибридного поиска в RAG). Поиск по…