Anthropic отчиталась, что больше 80% её кода теперь пишет Claude, — а её же автоматический проверяющий ловит лишь треть прошлых ошибок, то есть две трети пропускает. Если код пишет один ИИ, а проверяет такой же — они слепнут в одних и тех же местах, и второй контур даёт не защиту, а общую слепую зону. Разбираю на инженерном уровне, почему «проверка ИИ» не равна независимой проверке, как измерить слепое пятно и как сюда ложится двухконтурная схема из мира промышленной безопасности (IEC 61508). Читать далее
Где-то в недрах Anthropic сидят люди, чья работа - выяснить, не пытается ли их самая умная модель тихо сломать мир. Они выпустили 53-страничный отчёт о том, как искали зло в Claude Opus 4.6. Anthropic взяли Claude Opus 4.6 - модель, которая уже вовсю пишет код на их собственной инфраструктуре, генерирует…
Год назад компания Anthropic выпустила Claude Code, заставив других конкурентов догонять.Даже генеральный директор Anthropic Дарио Амодей был удивлен тем, с каким энтузиазмом поначалу отнеслись к следующему прорывному продукту стартапа. Читать далее
Anthropic сделала публичной самую мощную модель — Claude Fable 5. Это «безопасная» версия нашумевшей Mythos, которую до сих пор не выпускали за пределы узкого круга партнёров10 июня Anthropic официально открыла доступ к модели Claude Fable 5. Это первый случай, когда версия флагманской архитектуры Mythos…