Бенчмарки LLM множатся как грибы после дождя, но обычному пользователю от них мало толку. Оценки программирования, математики, этики — всё это важно для разработчиков, но что, если вы просто хотите получить помощь в повседневных задачах?Я решил проверить популярные модели на том, что действительно важно:- Креативность без потери здравого смысла - Логика без галлюцинаций - Внимание к деталям без педантизма Все промпты — в статье. Можете повторить и проверить мои выводы. Читать далее
Один из ключевых фундаментальных принципов обработки данных, согласно GDPR, это право человека на объяснение принятого решения и честность этого решения. И сегодня мы поговорим о том, что же такое честность модели машинного обучения. Картинка взята отсюда И разберем на простом…
Всем привет! Недавно я вновь сменил свою основную LLM-модель. Долгое время пользовался Claude, потом перешел на ChatGPT, затем на Gemini, и вот я опять оплатил Claude и снова отменил подписку. Почему? Потому что Gemini, который поначалу казался невероятно мощным, в какой-то момент просто перестал справляться с моими основными задачами, а до этого так же сделал Claude и ChatGPT. Они стали лениться, игнорировать части промпта и выдавать поверхностные ответы. Читать далее
Я использовал новый функционал от Claude - Claude Cowork.Claude Cowork - это новый агентский режим от Anthropic, доступный в приложении Claude Desktop, который сейчас доступен только на macOS по подписке.Я попросил его сгенерировать план изучения Go. В статье разбираю особенности и ограничения. Разочароваться в ИИ