Привет! Я Сергей Кляхандлер, senior DS-инженер в команде LLM Авито. В статье рассказываю, как мы разработали ML-модель, которая автоматически генерирует описания для объявлений из категории Одежда и Обувь. Подробно расписываю, откуда мы брали данные для обучения, какую архитектуру использовали и как тренировали модель. А в конце говорю про важную часть работы — фейлы.Статья будет полезна DS-инженерам, которые работают с мультимодальными LLM-моделями. Читать далее
Существует классическая проблема на любой электронной торговой площадке, связанная с тем, как категоризировать и понять описания товаров. Особенно она усугубляется тем, что пользователи создают запутанные описания даже для самых простых продуктов. Например, обычная синяя футболка может быть описана как небесно-голубая или даже тёмно-сине-аквамариновая. Что могут предложить современные LLM и VLM для решения проблеммы? Читать далее
Существует классическая проблема на любой торговой площадке, связанная с тем, как категоризировать и понять описания товаров. Особенно она усугубляется тем, что пользователи создают запутанные описания даже для самых простых продуктов. Например, обычная синяя футболка может быть описана как небесно-голубая или даже тёмно-сине-аквамариновая. Что могут предложить современные LLM и VLM для решения проблемы? Читать далее
Проблемы качества базы данных LLM[1] и необучаемости LLM в силу ограничения размеров контекстного окна сводятся к одной проблеме никак с LLM не связанной – оценке доверия к публикациям и их авторам вообще. Вторая проблема – LLM не умеет решать простые логические задачи легко решаемые