В 2025 году на NeurIPS — главной мировой конференции по ИИ — прошло соревнование CURE‑Bench, организованное исследователями из Гарварда и Массачусетского Технологического Института. Целью соревнования являлась масштабная проверка способностей агентов и рассуждающих
Задачи висят без исполнителей, бэклог превращается в свалку и ещё 9 проблем, которые можно решить за пару минут с помощью бесплатных расширений YouGile. Читать далее
Все говорят, что скоро Claude и GPT заменят программистов. Я руковожу студией разработки и вижу другую картину: AI не заменяет инженеров, но беспощадно наказывает за лень и отсутствие архитектурного мышления.В этой статье я на живом примере покажу разницу между популярным…
Классические подходы к управлению услугами трансформируются, чтобы соответствовать вызовам современных реалий. Давайте разберемся, в какую сторону идет ITSM / ESM и о каких тенденциях мы будем говорить ближайший год. Читать далее
Представьте: вы открываете письмо, кликаете по безобидной ссылке, и ваш корпоративный аккаунт теперь принадлежит кому-то другому. И это лишь один из четырех критических багов в коробочном SSO-решении, которые мы обнаружили во время рутинного пентеста.Мы покажем, как одна логическая ошибка в продукте может привести к полному захвату аккаунтов, и объясним, как действовать, когда находишь подобный «подарок» в своей инфраструктуре. Читать далее
В последние два года мировые отчёты — от McKinsey до Gartner — фиксируют одну и ту же линию: агентные системы перестают быть экспериментом и начинают становиться инфраструктурой.Не только в моде, финансах или ритейле — практически везде, где есть данные, процессы и необходимость…
Соревнование MindGames Arena проводится как часть одной из ключевых конференций в области ИИ NeurIPS 2025 и проверяет, могут ли агенты демонстрировать социально‑стратегические способности — моделировать убеждения других, обнаруживать обман, координироваться и…
Привет, Хабр!Мне нравится рассказывать про красивые и удобные интерфейсы. Всю свою карьеру я старался делать всё, что мог для комфорта пользователя.Но также я встречал фронтендеров, которые не тратили много времени, продумывая взаимодействие пользователя с интерфейсом. Им было
Когда твой тестовый стенд разбросан по этажам, IP-адреса живут своей жизнью, а нужное устройство стабильно «гуляет» между кабинетами — это не инфраструктура, это квест. Три года назад я подключался к железкам по SSH и даже не знал, где они физически находятся. Сегодня всё иначе: у…
Как я перестал читать сотни резюме и научил ИИ проводить первичный отбор кандидатов. От поиска товаров к поиску людей. История о том, как превратить рутинный найм в автоматизированный процесс с помощью API HH.ru и Gemini. Привет! На связи снова Евгений. Это четвертая часть цикла о…