Взгляд на самую большую проблему в мире ИИ, почему это важно для вас и почему это так ценно.Согласованность — одна из самых важных тем в современной области машинного обучения (ML). Независимо от того, являетесь ли вы пользователем продуктов ML, человеком, который их разрабатывает, или компанией, решающей с их помощью задачи, вам стоит знать и хорошо понимать, что такое согласованность. Читать далее
Продолжаем разбирать внутренние детали пайплайна RLHF (обучение с подкреплением на основе обратной связи от человека). Это крайне популярный и широко используемый способ повысить согласованность языковой модели. Разбираем части пайплайна RLHF с точки зрения…
Директор Акселератора ФРИИ Дмитрий Калаев рассказал на онлайн-конференции «Как построить бизнес на основе технологии» о типах конкурентных преимуществ технологичных стартапов, как сформулировать ценность и конкурентное преимущество, которые помогут в продаже продукта клиентам, и в какой момент компании стоит задуматься о масштабировании. Читать дальше →
Что если ошибочные ответы модели — не мусор, а ценный обучающий материал? В данной статье мы разберём метод Hindsight Instruction Relabeling (HIR), который позволяет дообучать LLM модели иногда даже лучше, чем RLHF. Кроме того, данный метод требует меньшего количества вычислений, не использует дополнительные модели и вдобавок ко всему максимально использует имеющийся датасет. Читать далее