От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

Что такое дообучение LLM и зачем оно нужно?Дообучение больших языковых моделей (LLM) — это способ адаптировать их под свои задачи, сделать их умнее на своих данных и сэкономить ресурсы.Когда стоит дообучать, а когда хватит prompt engineering или RAG? Если задача уникальная или данных много — дообучай. Если задача простая — попробуй сначала промпты. Читать далее

8 июля 2025, вторник 13:15 Оставить комментарий Источник

Похожие материалы

Как дообучать LLM на лету с помощью памяти вместо файнтюнинга

Реальные агентные задачи требуют множества шагов, вызова инструментов и гибкой памяти. Исследователи нашли возможность улучшать агента без файнтюнинга весов языковой модели: предлагается хранить удачные и неудачные кейсы и опираться на них при планировании. В итоге получились шикарные метрики на бенчмарках GAIA, SimpleQA и Human Last Exam. Разбираемся, как это работает. Читать далее

26 августа 2025, вторник 15:03 Источник
[Перевод] Краткий обзор LLM бенчмарков

Когда мы говорим о бенчмаркинге LLM в какой-то предметной области, то имеем в виду две разные концепции: бенчмарки моделей LLM и бенчмарки систем LLM. Бенчмаркинг моделей LLM заключается в сравнении базовых моделей общего назначения (например, GPT, Mistral, Llama, Gemini, Claude и так далее). Нам не…

17 октября 2024, четверг 12:15 Источник
Как научить LLM понимать видео? Часть 2

Привет, Хабр! В прошлой статье мы рассказали про эволюцию подходов к обучению мультимодальных больших языковых моделей для решения задачи понимания видео. Сегодня хотим рассказать про то, как мы учим LLM понимать видео и поддерживать диалог по ним на русском языке, и как мы оцениваем этот навык, чтобы сравнивать разные модели между собой. Читать далее

25 октября 2024, пятница 13:28 Источник

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

Комментарии

Похожие материалы

Как дообучать LLM на лету с помощью памяти вместо файнтюнинга

[Перевод] Краткий обзор LLM бенчмарков

Как научить LLM понимать видео? Часть 2