ruMTEB: новый бенчмарк для русскоязычных эмбеддеров

ruMTEB: новый бенчмарк для русскоязычных эмбеддеров

Салют, Хабр! На связи команды AGI NLP и нейронных сетей Виртуального ассистента Салют. В SberDevices наши команды занимаются созданием бенчмарков, а также обучением моделей для векторных представлений текстов или эмбеддеров. В этой статье расскажем про наш новый русскоязычный бенчмарк для эмбеддеров текста — ruMTEB. Читать далее

24 июля 2024, среда 19:16 Оставить комментарий Источник

Похожие материалы

Как оценивать LLM на практике, если времени на «идеальный бенчмарк» нет

Меня зовут Алёна, и я более пяти лет занимаюсь оценкой языковых моделей: участвовала в создании таких русскоязычных бенчмарков как Russian SuperGLUE, ruMTEB, куратор проекта Альянса в сфере искусственного интеллекта «MERA» (бенчмарка для оценки русскоязычных LLM), и создатель множества…

30 июня 2026, вторник 6:32 Источник
Новый взгляд на оценку русскоязычных моделей: обновлённый бенчмарк ruMTEB и лидерборд

Всем привет! Меня зовут Роман Соломатин, я представляю команду AI-Run из X5 Tech, мы занимаемся генеративными сетями в целом и языковыми моделями в частности. Несколько месяцев назад русскоязычное сообщество разработчиков искусственного интеллекта получило инструмент для оценки…

23 сентября 2024, понедельник 17:35 Источник
Шлепа — Большой Русский Бенчмарк

Здарова хабровчане! На связе лаборатория Вихрей, сегодня мы расскажем про наш бенчмарк, Шлёпа - большой русский бенчмаркЧто есть сейчас для оценки русскоязычных LLMMera - бенчмарк от Сбера, использует тесты и генерацию, сабмит через сайт, сайт почти не обновлялся с зимы. Почитать про него можно тут Читать далее

2 сентября 2024, понедельник 12:00 Источник

ruMTEB: новый бенчмарк для русскоязычных эмбеддеров

Комментарии

Похожие материалы

Как оценивать LLM на практике, если времени на «идеальный бенчмарк» нет

Новый взгляд на оценку русскоязычных моделей: обновлённый бенчмарк ruMTEB и лидерборд

Шлепа — Большой Русский Бенчмарк