Enbeddrus — обучение независящей от языка эмбеддинг-модели

Enbeddrus — обучение независящей от языка эмбеддинг-модели

Приветствую, хабровчане!Сегодня я хочу рассказать вам историю о том, как я обучил простую и компактную независящую от языка модель-эмбеддер, которая умеет работать с техническими текстами о PHP и способна извлекать схожие эмбеддинги для параллельных текстов на английском и…

2 июня 2024, воскресенье 19:31 Оставить комментарий Источник

Похожие материалы

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

Разрабатывая AI-консультантов и ассистентов на базе RAG-архитектуры, работающих с корпоративными базами знаний на русском языке, мы столкнулись с вопросом: какие открытые эмбеддинг-модели дают лучший баланс качества семантического поиска на русском и скорости работы. Особенно это актуально, когда запросы и документы русскоязычные, но внутри часто попадаются фрагменты кода/SQL и англоязычной терминологии.Мы прогнали 9 open-source эмбеддинг-моделей через несколько тестов, включающих проверки: Читать далее

31 октября 2025, пятница 8:12 Источник
Знакомьтесь, FRIDA. Открытая эмбеддинг-модель для русского языка

В этой статье мы расскажем о нашей новой модели FRIDA, которая сейчас (20.05.2025) занимает первое место в русскоязычном бенчмарке MTEB (ссылка на таблицу лидеров).Ранее мы уже рассказывали на Хабре о создании русскоязычных задач для MTEB. Напомним, что этот бенчмарк предназначен для оценки моделей, способных создавать эмбеддинги текста — векторные представления, применяемые в различных задачах NLP. Читать далее

20 мая 2025, вторник 12:37 Источник
Изучаем Q#. Алгоритм Гровера. Не будите спящего Цезаря

Криптохомячкам посвящается ... Алгоритм Гровера представляет собой обобщённый, независящей от конкретной задачи поиск, функция которого представляет "чёрный ящик" f: {0,1}^n to {0,1}^n, для которой известно, что EXISTS!w:f(w)=a, где a — заданное значение. Считаем, что для f и заданного a…

19 октября 2023, четверг 21:59 Источник

Enbeddrus — обучение независящей от языка эмбеддинг-модели

Комментарии

Похожие материалы

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

Знакомьтесь, FRIDA. Открытая эмбеддинг-модель для русского языка

Изучаем Q#. Алгоритм Гровера. Не будите спящего Цезаря