Восстанавливаем предложения из эмбеддингов LaBSE

Восстанавливаем предложения из эмбеддингов LaBSE

На прошлой неделе меня дважды спрашивали, как восстановить текст предложения из его LaBSE эмбеддинга. Я дважды отвечал, что никак. Но на самом деле, конечно, можно обучить декодер генерировать текст по его эмбеддингу. Зачем? Например, чтобы переводить с 100 языков на русский, перефразировать предложения, модифицировать их смысл или стиль. Модель для восстановления предложений из эмбеддингов опубликована как cointegrated/rut5-base-labse-decoder, а подробности – под катом. Читать далее

19 июля 2022, вторник 10:01 Оставить комментарий Источник

Похожие материалы

Малоресурсный язык ломает коммерческие embedding: R@1 0,83 (LaBSE) vs 0,21 (OpenAI) на армянском EPG

Платные модели embedding не гарантируют качество на малоресурсных языках. На задаче кроссязыкового сопоставления EPG-заголовков (EN/RU/HY) бесплатная LaBSE набирает R@1 = 0,83, а OpenAI text-embedding-3-large -- 0,21. Протестировано 19 моделей, код и данные открыты. Читать далее

10 марта 2026, вторник 7:15 Источник
Восстанавливаем рефлекс засыпания (попытка починить бессонницу)

Давно планировал написать эту заметку, просто для того, чтобы кидать на нее ссылку, а не пересказывать. А пересказывать приходится часто…Восстанавливаем рефлекс засыпания или что можно попробовать сделать самому при попытке починить бессонницу, перед тем, как обратиться к специалисту. Читать далее

6 мая 2026, среда 11:15 Источник
Квантование эмбеддингов: что это, зачем оно нужно и как его правильно готовить

Привет, меня зовут Женя. Сегодня я расскажу, что такое квантование эмбеддингов, какие бывают способы квантования и как с их помощью мы в Яндекс.Дзене смогли сократить использование памяти, рейта записи и сетевого трафика в четыре раза. Будет совсем немного математики, умеренно…

2 февраля 2021, вторник 12:41 Источник

Восстанавливаем предложения из эмбеддингов LaBSE

Комментарии

Похожие материалы

Малоресурсный язык ломает коммерческие embedding: R@1 0,83 (LaBSE) vs 0,21 (OpenAI) на армянском EPG

Восстанавливаем рефлекс засыпания (попытка починить бессонницу)

Квантование эмбеддингов: что это, зачем оно нужно и как его правильно готовить