Буквально несколько часов назад (на момент написания этой статьи), компания Anthropic предоставила свое новое исследование по обходу защитных механизмов LLM в открытый доступ.Новый способ взлома «Best‑of‑N Jailbreaking» описывает универсальный метод обхода защиты передовых…
В последние годы развитие технологий искусственного интеллекта стало одним из самых значимых направлений в IT-сфере. Среди множества компаний, работающих в этой сфере, особое место занимает американская Anthropic. Она за короткое время смогла стать одним из ведущих игроков в отрасли, который ориентирован на создание безопасных и этичных систем ИИ. Рассказываем в нашей статье историю успеха Anthropic. И при чем тут уничтожение книг. Читать далее
Сегодня я решил изучить новую библиотеку Cloudflare OAuth provider, которую, судя по заявлениям, почти полностью написали при помощи LLM Claude компании Anthropic:Эта библиотека (в том числе и документация по схеме) была по большей мере написана при помощи Claude — ИИ-модели компании Anthropic. Результаты…
В предыдущих постах мы рассказали о том, что грозит владельцам подключённых автомобилей, и обсудили способы взлома таких транспортных средств. В этом посте обсудим обобщённый метод взлома и модель угроз для интеллектуальных транспортных средств, ставшие результатом работы над третьей частью нашего исследования Driving Security Into Connected Cars: Threat Model and Recommendations. Читать далее