Fine-tune Qwen3 Embeddings для классификации категорий товаров

Fine-tune Qwen3 Embeddings для классификации категорий товаров

Мы взяли размеченный корпус товаров из Web Data Commons, дообучили Qwen3 Embedding с помощью LoRA и получили лёгкий чекпойнт на ~615M параметров, который сопоставляет «сырые» названия товаров с 6 верхнеуровневыми категориями с результатом macro-F1 = 0.836, может работать в реальном времени на одной видеокарте. Код доступен в гитхабе так же английская версия этого поста. Читать далее

6 сентября 2025, суббота 13:31 Оставить комментарий Источник

Похожие материалы

Fine-tune Qwen3 за написание позитивных отзывов о ресторанах

Генератор отзывов о ресторане:Собрано почти 16 000 положительных отзывов от ресторанов с оценкой выше 4,7 (из 5), расположенных в Москве с https://yandex.ru/maps. Использованная модель — Qwen3-4B Qwen3 как поддерживающий русский язык. Для обучения модели в течение двух эпох использовалась библиотека Unsloth с LoRA. В результате был выбран LoRA 32-го ранга и обучено 66 млн параметров. Теперь модель может дать хороший новый обзор:Целью было понять, как можно начать проект с нуля. Читать далее

5 декабря 2025, пятница 17:47 Источник
Qwen3-ASR-Toolkit: бесплатный инструмент для транскрипции аудио любой длительности

Команда Alibaba Cloud выпустила Qwen3-ASR-Toolkit — открытый инструмент для транскрипции аудио- и видеофайлов любой длительности. Решение построено на базе модели Qwen3-ASR (ранее Qwen3-ASR-Flash) и устраняет ключевую проблему большинства API для распознавания речи — ограничение по длительности файла. Читать далее

21 сентября 2025, воскресенье 15:18 Источник
Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon

Сравнил полнотекстовый поиск PostgreSQL (tsvector/tsquery + GIN-индекс) с семантическим поиском через pgvector (cosine distance) на датасете из 10 019 товарных категорий Ozon.Три embedding-модели:GigaChat EmbeddingsGigaR (Сбер, 2560-мерные векторы, API)Qwen3-Embedding-0.6B (Alibaba, 1024-мерные, локальный инференс через HF Text Embeddings Inference на…

14 марта 2026, суббота 12:40 Источник

Fine-tune Qwen3 Embeddings для классификации категорий товаров

Комментарии

Похожие материалы

Fine-tune Qwen3 за написание позитивных отзывов о ресторанах

Qwen3-ASR-Toolkit: бесплатный инструмент для транскрипции аудио любой длительности

Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon