Как построить фактологически точный QA-сервис на русском языке с помощью Advanced RAG? Почему базовый RAG НЕ работает? Все ответы в этой статье. Читать далее
RAG ломается не так, как обычный LLM. У голой языковой модели одна поверхность отказа - генерация. У RAG-системы таких поверхностей две: retrieval и generation. И ломаются они по-разному.Retriever может вернуть нерелевантные чанки, потерять нужные документы или ранжировать их неправильно. Генератор
Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и…
Разрабатывая AI-консультантов и ассистентов на базе RAG-архитектуры, работающих с корпоративными базами знаний на русском языке, мы столкнулись с вопросом: какие открытые эмбеддинг-модели дают лучший баланс качества семантического поиска на русском и скорости работы. Особенно это актуально, когда запросы и документы русскоязычные, но внутри часто попадаются фрагменты кода/SQL и англоязычной терминологии.Мы прогнали 9 open-source эмбеддинг-моделей через несколько тестов, включающих проверки: Читать далее