Garak: инструмент Red-Team для поиска уязвимостей в LLM

Garak: инструмент Red-Team для поиска уязвимостей в LLM

«ChatGPT раскрывает личные данные реальных людей!», «Атака на ChatGPT по сторонним каналам!», «Чат-бот ChatGPT стал причиной утечки секретных данных!», «Хакеры стали использовать ChatGPT в схемах фишинга!». — Эти новостные заголовки раскрывают нам тёмную сторону больших языковых моделей. Да,…

16 сентября 2024, понедельник 14:04 Оставить комментарий Источник

Похожие материалы

Red Fox Team Fox 2

Red Fox Team Fox 2 — вместительный жилой модуль для использования внутри палатки Team Fox 2. Модель легко прикрепляется, оснащена двумя входами с противомоскитными сетками. • Материал модуля: полиэстер 190T W/R BR • Материал дна: нейлон 190T W/R PU 9000 • Вместимость: 5-10 чел. • Размеры: 290х380х210 см. • Вес: 2,9 кг. Red Fox Team […]

24 июля 2016, воскресенье 1:54 Источник
CVE-2013-2165 (jboss_enterprise_application_platform, jboss_enterprise_brms_platform, jboss_enterprise_portal_platform, jboss_enterprise_soa_platform, jboss_enterprise_web_platform, jboss_operations_network, jboss_web_framework_kit, richfaces)

ResourceBuilderImpl.java in the RichFaces 3.x through 5.x implementation in Red Hat JBoss Web Framework Kit before 2.3.0, Red Hat JBoss Web Platform through 5.2.0, Red Hat JBoss Enterprise Application Platform through 4.3.0 CP10 and 5.x through 5.2.0, Red Hat JBoss BRMS through 5.3.1, Red Hat JBoss SOA Platform through 4.3.0 CP05 and 5.x through 5.3.1, Red Hat JBoss Portal through 4.3 CP07 and 5.x through 5.2.2, and Red Hat JBoss Operations Network through 2.4.2 and 3.x through 3.1.2 does not restrict the…

13 июня 2017, вторник 2:00 Источник
Исследование уязвимостей LLM-агентов: опыт Red Teaming

Привет, Хабр!Сначала об определениях. LLM Red teaming — практика тестирования больших языковых моделей (например, GPT), направленная на выявление уязвимостей, нежелательного поведения и способов их взлома (jailbreak). Суть в том, чтобы через специальные подсказки или методы…

30 марта 2025, воскресенье 20:17 Источник

Garak: инструмент Red-Team для поиска уязвимостей в LLM

Комментарии

Похожие материалы

Red Fox Team Fox 2

CVE-2013-2165 (jboss_enterprise_application_platform, jboss_enterprise_brms_platform, jboss_enterprise_portal_platform, jboss_enterprise_soa_platform, jboss_enterprise_web_platform, jboss_operations_network, jboss_web_framework_kit, richfaces)

Исследование уязвимостей LLM-агентов: опыт Red Teaming