[Перевод] Новый метод Tencent учит языковые модели «параллельному мышлению»

[Перевод] Новый метод Tencent учит языковые модели «параллельному мышлению»

Исследователи из Tencent AI Lab в Сиэтле и Университета Мэриленда представили метод обучения с подкреплением Parallel-R1, который помогает большим языковым моделям (LLM) эффективнее использовать масштабирование на этапе инференса при решении сложных задач рассуждения. Читать далее

25 сентября 2025, четверг 15:28 Оставить комментарий Источник

Похожие материалы

HUNYUAN-T1. Tencent наносит ответный удар

Когда-нибудь задумывались, почему большинство моделей ИИ либо умные, ЛИБО быстрые, но никогда не сочетают оба качества? Над этим подумали в Tencent.Tencent только что перевернул эту парадигму с Hunyuan-T1 – ПЕРВОЙ в мире ультра-супер-сверхбольшой моделью, использующей гибридную архитектуру Transformer + Mamba MoE. Чудесно. Хочу прочитать.

26 марта 2025, среда 3:32 Источник
[Из песочницы] Почему умные люди принимают глупые решения

Насколько высок ваш интеллект? Когда дело доходит до принятия правильных решений, коэффициент интеллекта не имеет значения, потому что даже самые светлые умы совершают нелепые поступки. Интеллект и способность к рациональному мышлению – это разные вещи. Именно способность к рациональному мышлению является важным фактором в принятии правильных решений. Читать дальше →

7 августа 2020, пятница 20:35 Источник
[Перевод] Революция в оптимизаторах: DeepMind использует большие языковые модели в роли интеллектуальных оптимизаторов

В новой публикации «Large Language Models as Optimizers» (Большие языковые модели в роли оптимизаторов) команда исследователей Google DeepMind представила инновационный метод оптимизации, названный «оптимизация через промпты» (Optimization by PROmpting, OPRO). При применении этого метода в роли оптимизаторов…

18 сентября 2023, понедельник 13:11 Источник

[Перевод] Новый метод Tencent учит языковые модели «параллельному мышлению»

Комментарии

Похожие материалы

HUNYUAN-T1. Tencent наносит ответный удар

[Из песочницы] Почему умные люди принимают глупые решения

[Перевод] Революция в оптимизаторах: DeepMind использует большие языковые модели в роли интеллектуальных оптимизаторов