24 ноября Anthropic выпустила Claude Opus 4.5 — и это не просто очередной апдейт. Модель стала в 3 раза дешевле ($5 vs $15 за 1M токенов), но при этом обогнала конкурентов по ключевым метрикам.Что изменилось:80.9% на SWE-bench — лучший результат среди всех LLM для кодаРаботает автономно 30+ минут без вашего…
Где-то в недрах Anthropic сидят люди, чья работа - выяснить, не пытается ли их самая умная модель тихо сломать мир. Они выпустили 53-страничный отчёт о том, как искали зло в Claude Opus 4.6. Anthropic взяли Claude Opus 4.6 - модель, которая уже вовсю пишет код на их собственной инфраструктуре, генерирует…
Недавно вышла Claude Opus 4.7 флагманская модель от Антропик. В выпущенных пресс-релизах и графиках маркетологи обещали пользователям, что модель станет ещё умнее, ещё точнее и так далее. На деле же получился феерический провал. Под катом - подробности этой истории и рецепт возврата вашего душевного равновесия. Читать далее
Доброго времени суток, «Хабр»!Год близится к завершению, и за это время мы получили в распоряжение множество вполне достойных моделей. Взять хотя бы тот факт, что в ближайшее время ожидается выход новой версии GPT. К тому же, после моей предыдущей статьи о Claude Opus 4.5 родилась идея: почему бы не устроить состязание среди лидирующих сейчас текстовых моделей?Сегодня в битве участвуют: GPT-5, Claude Opus 4.5 и Gemini 3 Pro. Делайте ставки, а я приступаю к сравнению. Читать далее