Дообучение saiga2_7b

Дообучение saiga2_7b_lora

Дообучение 7-миллиардной модели Saiga2 под свои задачи, используя сгенерированный датасет с помощью GPT. В данной статье есть все необходимые ссылки и код для предобработки и запуска обучения модели, а также квантования модели. Читать далее

28 ноября 2023, вторник 13:08 Оставить комментарий Источник

Похожие материалы

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

Что такое дообучение LLM и зачем оно нужно?Дообучение больших языковых моделей (LLM) — это способ адаптировать их под свои задачи, сделать их умнее на своих данных и сэкономить ресурсы.Когда стоит дообучать, а когда хватит prompt engineering или RAG? Если задача уникальная или данных много — дообучай. Если задача простая — попробуй сначала промпты. Читать далее

8 июля 2025, вторник 13:15 Источник
Дообучение EasyOCR

Всем привет!Представляю краткий tutorial по дообучению EasyOCR. возможно обучение на Google colab. Читать далее

5 октября 2022, среда 12:49 Источник
Дообучение модели машинного перевода

Разработчики машинного перевода часто рассказывают об использовании предварительно обученных моделей. Захотелось дообучить такую модель самому, но пришлось приложить усилия, чтобы найти понятный пример. Поэтому после того, как код заработал, решил поделиться скриптами. Читать далее

6 июня 2023, вторник 22:18 Источник

Дообучение saiga2_7b_lora

Комментарии

Похожие материалы

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

Дообучение EasyOCR

Дообучение модели машинного перевода