Когда нажимаешь кнопку Thinking и видишь, как модель несколько секунд «размышляет» перед ответом — легко решить, что она просто старается сильнее. Работает усерднее. Думает глубже. Может, перебирает больше вариантов из какой-то внутренней базы знаний.Это не так. Thinking-режим — это…
— Стало быть, эта штуковина только выглядит так, будто умеет думать? — Э… да. — А на самом деле не думает? — Э… нет. — То есть просто создаёт впечатление, будто бы думает, а на самом деле это всё показуха? — Э… да. — Ну точь-в-точь как все мы.…
Google полностью обновила сайт и приложение Gemini. Появился выбор уровня мышления, новый дизайн и модель Flash Lite. Однако у пользователей забрали Thinking модель и сильнее ограничили Pro модель. Читать далее
LLM-систем есть класс уязвимостей, которого нет в обычных веб-приложениях. Извлёк системный промпт Grok двумя способами, поймал утечку thinking tokens в NDJSON-стриме и обошёл safety-фильтры в 14 из 22 категорий. Самое неожиданное — Grok активно помогал мне себя ломать. Читать далее