Дообучение модели машинного перевода

Дообучение модели машинного перевода

Разработчики машинного перевода часто рассказывают об использовании предварительно обученных моделей. Захотелось дообучить такую модель самому, но пришлось приложить усилия, чтобы найти понятный пример. Поэтому после того, как код заработал, решил поделиться скриптами. Читать далее

6 июня 2023, вторник 22:18 Оставить комментарий Источник

Похожие материалы

Дообучение saiga2_7b_lora

Дообучение 7-миллиардной модели Saiga2 под свои задачи, используя сгенерированный датасет с помощью GPT. В данной статье есть все необходимые ссылки и код для предобработки и запуска обучения модели, а также квантования модели. Читать далее

28 ноября 2023, вторник 13:08 Источник
GNMT, epic fail или тонкости машинного перевода

После прочтения статьи "Нейронный машинный перевод Google" вспомнился курсирующий последнее время в интернет очередной epic-fail машинного перевода от Google. Кому сильно не терпится сразу мотаем в низ статьи. Ну а для начала немного теории: GNMT есть система нейронного машинного перевода…

18 июня 2018, понедельник 23:11 Источник
Ландшафт сервисов облачного машинного перевода. Лекция в Яндексе

Это последний доклад с шестого Гипербатона, который мы опубликуем на Хабре. Григорий Сапунов из Intento поделился подходом к оценке качества сервисов облачного машинного перевода, рассказал о результатах оценки и главных отличиях между доступными сервисами. — Меня зовут Григорий Сапунов, я расскажу про ландшафт сервисов облачного машинного перевода. Мы измеряем этот ландшафт уже больше года, он очень динамичен и интересен. Читать дальше →

18 ноября 2018, воскресенье 15:09 Источник

Дообучение модели машинного перевода

Комментарии

Похожие материалы

Дообучение saiga2_7b_lora

GNMT, epic fail или тонкости машинного перевода

Ландшафт сервисов облачного машинного перевода. Лекция в Яндексе