GSPO (Qwen RL Algorithm by Alibaba Cloud)

GSPO (Qwen RL Algorithm by Alibaba Cloud)

Qwen снова радуют релизом. Но на этот раз это не модель, а новый RL-алгоритм для обучения LLMМетод называется Group Sequence Policy Optimization (GSPO), и именно он лег в основу последних громких моделей компании: Qwen3 Instruct, Coder и Thinking. Статья вышла пару дней назад, но о ней уже говорят все. Значит, пока…

10 августа 2025, воскресенье 22:56 Оставить комментарий Источник

Похожие материалы

Разработка фронтенда интернет-магазина через Qwen 3.6 Plus и Qwen ClI

Привет всем.Расскажу про свой личный опыт разработки через Qwen 3.6 Plus и Qwen ClI. И да, статья полностью написана человеком.Это небольшой pet-проект, сделанный в момент, когда Qwen 3.6 Plus был бесплатным с лимитом в 1000 запросов в день. Проект представляет из себя фронтенд вымышленного интернет-магазина по продаже микрокомпьютеров.Цель была протестировать возможности Qwen. На весь проект у меня ушло 4 дня по 2-3 часа. Читать далее

25 апреля 2026, суббота 17:10 Источник
[Перевод] Как облако Alibaba Cloud управляет десятками тысяч кластеров Kubernetes с помощью… Kubernetes

Куб-на-кубе, метакластеры, соты, распределение ресурсов Рис. 1. Экосистема Kubernetes в облаке Alibaba Cloud С 2015 года Alibaba Cloud Container Service for Kubernetes (ACK) является одним из самых быстрорастущих облачных сервисов в Alibaba Cloud. Он обслуживает многочисленных клиентов, а также поддерживает внутреннюю…

9 января 2020, четверг 11:28 Источник
Qwen 2.5 и Qwen 2.5 Coder — перспективная коллекция LLM для систем агентов

Разработчикам приложений Generative AI стоит обратить внимание на новую коллекцию моделей Qwen 2.5 и Qwen 2.5 Coder. С сентября 2024 года эти модели привлекают внимание разработчиков благодаря своей эффективности.Эти модели созданы Alibaba Cloud и предлагают много полезных для AI-сообщества функций.…

25 ноября 2024, понедельник 13:39 Источник

GSPO (Qwen RL Algorithm by Alibaba Cloud)

Комментарии

Похожие материалы

Разработка фронтенда интернет-магазина через Qwen 3.6 Plus и Qwen ClI

[Перевод] Как облако Alibaba Cloud управляет десятками тысяч кластеров Kubernetes с помощью… Kubernetes

Qwen 2.5 и Qwen 2.5 Coder — перспективная коллекция LLM для систем агентов