Почему даже самые передовые языковые модели, такие как GPT-4, справляются с умножением четырёхзначных чисел только в 4% случаев и дают правильный ответ в сложной головоломке лишь в 10% случаев? Исследования показывают, что трансформеры сталкиваются с фундаментальными математическими ограничениями. Учёные ищут способы расширить их возможности — от встроенной позиции чисел до подсказок цепочки мыслей. Читать далее
В апреле 2025 года OpenAI представила серию моделей GPT‑4.1 – сразу три версии: GPT‑4.1 (полноразмерная), GPT‑4.1 mini и GPT‑4.1 nano. Все они значительно превосходят предшественников (GPT‑4.0, также называемый GPT‑4o, и GPT‑4o mini) по качеству кодирования, следованию инструкциям и работе с…
???? ОписаниеНа этой неделе разбираем релиз GPT-OSS — первых полностью открытых моделей OpenAI с момента GPT-2 в 2019 году. Две модели: gpt-oss-20b и gpt-oss-120b представляют собой современные LLM с архитектурой MoE (Mixture of Experts), оптимизированные для рассуждений и способные работать на одном GPU благодаря квантованию MXFP4. Читать далее
Что такое GPT? ОГЛАВЛЕНИЕ1. Введение 2. Структура GPT 3. Что такое GPT-раздел типа Intel? 3.1. Структура заголовка нового GPT-раздела 3.2. Структура записи описания нового GPT-раздела 4. Заключение. 5. Источники информации 1. Введение Продолжаем рассматривать строение программной части (software)…