Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

Привет, Хабр!В июне 2025 года команда из Гонконгского университета выложила открытые модели Polaris-4B‑Preview и Polaris-7B‑Preview, обученные с нуля на reasoning‑задачах с использованием Reinforcement Learning. Эти модели не просто догоняют топовые коммерческие аналоги вроде Claude‑Opus и…

4 июля 2025, пятница 11:13 Оставить комментарий Источник

Похожие материалы

Qwen3-ASR-Toolkit: бесплатный инструмент для транскрипции аудио любой длительности

Команда Alibaba Cloud выпустила Qwen3-ASR-Toolkit — открытый инструмент для транскрипции аудио- и видеофайлов любой длительности. Решение построено на базе модели Qwen3-ASR (ранее Qwen3-ASR-Flash) и устраняет ключевую проблему большинства API для распознавания речи — ограничение по длительности файла. Читать далее

21 сентября 2025, воскресенье 15:18 Источник
Fine-tune Qwen3 за написание позитивных отзывов о ресторанах

Генератор отзывов о ресторане:Собрано почти 16 000 положительных отзывов от ресторанов с оценкой выше 4,7 (из 5), расположенных в Москве с https://yandex.ru/maps. Использованная модель — Qwen3-4B Qwen3 как поддерживающий русский язык. Для обучения модели в течение двух эпох использовалась библиотека Unsloth с LoRA. В результате был выбран LoRA 32-го ранга и обучено 66 млн параметров. Теперь модель может дать хороший новый обзор:Целью было понять, как можно начать проект с нуля. Читать далее

5 декабря 2025, пятница 17:47 Источник
Запускаем Qwen3-VL-30B на 48GB VRAM

Недавно вышла коллекция моделей от Alibaba - Qwen3-VL:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe Запустим эту модель на Ubuntu

5 октября 2025, воскресенье 0:43 Источник

Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

Комментарии

Похожие материалы

Qwen3-ASR-Toolkit: бесплатный инструмент для транскрипции аудио любой длительности

Fine-tune Qwen3 за написание позитивных отзывов о ресторанах

Запускаем Qwen3-VL-30B на 48GB VRAM