[Перевод] Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий идентичность

[Перевод] Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий идентичность

«Аномальные», «глючные» и «непроизносимые» токены в больших языковых моделях (LLM) — это те, которые вызывают странное поведение или не функционируют как обычный текст. Это явление было впервые открыто и задокументировано в случае GPT-2 и GPT-3, но до сих…

28 января 2025, вторник 18:06 Оставить комментарий Источник

Похожие материалы

Аномалии электоральной статистики на выборах в Государственную Думу 2021 года по 125 ОИК, КОИБ or not КОИБ

В статье 2021 года мы пронаблюдали аномалии результатам выборов в Государственную думы 2021 года подмосковному 125 избирательному округу. На некоторых избирательных участках прослеживались аномалии явки, аномалии темпа голосования в последние часы выборов, причем часто эти…

6 сентября 2023, среда 23:15 Источник
Интервью с DeepSeek: в чем смысл жизни и свиных крылышек

Китайский стартап DeepSeek выпустил в открытый доступ свою большую языковую модель DeepSeek-R1, которая, как заявлено, лучше аналогов от OpenAI, а обучение этой модели было гораздо дешевле. Кроме того, DeepSeek действительно открытая и ее можно запустить локально. В этой статье вас ждет действительно простая инструкция по развертыванию локальной модели DeepSeek. А также короткое, но разнообразное интервью на русском языке с DeepSeek-R1, ее локальной копией, ChatGPT-4o и ChatGPT-o1. Читать дальше →

29 января 2025, среда 16:14 Источник
[Перевод] Ритуальная драма и изменение культуры

Данная публикация является переводом статьи "Ritual Drama and Culture Change" опубликованной Cambridge University Press. Статья основана на наблюдениях за церемониями и обществами индейцев Южной Америки. Рассказывает о том, как меняют культуру людей и обществ через церемонии и наборы правил церемоний, взаимодействуют между сообществами, выстраивают общественные структуры, иерархии, формируют идентичность, изменяют идентичность и многое другое. Читать далее

16 сентября 2024, понедельник 12:15 Источник

[Перевод] Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий идентичность

Комментарии

Похожие материалы

Аномалии электоральной статистики на выборах в Государственную Думу 2021 года по 125 ОИК, КОИБ or not КОИБ

Интервью с DeepSeek: в чем смысл жизни и свиных крылышек

[Перевод] Ритуальная драма и изменение культуры