Мы взяли размеченный корпус товаров из Web Data Commons, дообучили Qwen3 Embedding с помощью LoRA и получили лёгкий чекпойнт на ~615M параметров, который сопоставляет «сырые» названия товаров с 6 верхнеуровневыми категориями с результатом macro-F1 = 0.836, может работать в реальном времени на одной видеокарте. Код доступен в гитхабе так же английская версия этого поста. Читать далее
Команда Alibaba Cloud выпустила Qwen3-ASR-Toolkit — открытый инструмент для транскрипции аудио- и видеофайлов любой длительности. Решение построено на базе модели Qwen3-ASR (ранее Qwen3-ASR-Flash) и устраняет ключевую проблему большинства API для распознавания речи — ограничение по длительности файла. Читать далее
Недавно вышла коллекция моделей от Alibaba - Qwen3-VL:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe Запустим эту модель на Ubuntu
Вы можете со мной не согласиться, но мне нейросети очень напоминают коллег-новичков. Они полны энтузиазма, все время хотят помочь, но то контекст забудут, то в лимиты 2023 года упрутся, то просто начинают слишком много думать там, где думать практически не нужно. Причем кажется, что от этого страдают почти все ИИ-модели, потому что добиться от них полезных ответов может быть реально проблематично. Но Qwen3 – как раз из тех, кто хочет это исправить. Читать далее