Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

В этой статье разберём исследование от компании Anthropic, которое демонстрирует практическую возможность вскрытия «черного ящика» больших языковых моделей для обеспечения их контролируемости и безопасности с помощью разреженных автоэнкодеров (SAE - Sparse AutoEncoders). И в конце, попробуем поуправлять поведением модели - заставим думать, что она Санта Клаус ????. Читать далее

12 января 2026, понедельник 20:32 Оставить комментарий Источник

Похожие материалы

CVE-2019-9496

An invalid authentication sequence could result in the hostapd process terminating due to missing state validation steps when processing the SAE confirm message when in hostapd/AP mode. All version of hostapd with SAE support are vulnerable. An attacker may force the hostapd process to terminate, performing a denial of service attack. Both hostapd with SAE support and wpa_supplicant with SAE support prior to and including version 2.7 are affected.

17 апреля 2019, среда 22:00 Источник
Автоэнкодеры в Keras, Часть 2: Manifold learning и скрытые (latent) переменные

Содержание Часть 1: Введение Часть 2: Manifold learning и скрытые (latent) переменные Часть 3: Вариационные автоэнкодеры (VAE) Часть 4: Conditional VAE Часть 5: GAN (Generative Adversarial Networks) и tensorflow Часть 6: VAE + GAN Для того, чтобы лучше понимать, как работают автоэнкодеры, а также чтобы в последствии генерировать из кодов что-то новое, стоит разобраться в том, что такое коды и как их можно интерпретировать. Читать дальше →

23 июня 2017, пятница 16:40 Источник
Автоэнкодеры в Keras, Часть 1: Введение

Автоэнкодеры в Keras Часть 1: Введение Содержание Часть 1: Введение Часть 2: Manifold learning и скрытые (latent) переменные Часть 3: Вариационные автоэнкодеры (VAE) Часть 4: Conditional VAE Часть 5: GAN (Generative Adversarial Networks) и tensorflow Часть 6: VAE + GAN Во время погружения в Deep Learning зацепила меня тема автоэнкодеров,…

23 июня 2017, пятница 16:38 Источник

Как «думает» ИИ: гроккаем разреженные автоэнкодеры (SAE)

Комментарии

Похожие материалы

CVE-2019-9496

Автоэнкодеры в Keras, Часть 2: Manifold learning и скрытые (latent) переменные

Автоэнкодеры в Keras, Часть 1: Введение