Иногда одна строка датасета соответствует не одному объекту, а целому набору связанных объектов: новостям, комментариям, изображениям или событиям. Каждый из них можно превратить в эмбеддинг, но модель обычно ждет фиксированный набор признаков. В статье разбираю, как с этим работать на практике: от простых агрегатов и pooling до MIL, LLM‑разметки и гибридных подходов. Читать далее
Спойлер: я не выпускник МФТИ, не олимпиадник и ненавидел программирование. У меня было 45 баллов ЕГЭ по математике, диплом инженера ПГУПС и стойкое ощущение, что в IT мне не светит ничего. Сейчас я Senior Data Scientist в крупном банке, а в 26/27 буду преподавать в ИТМО. В этой статье - как именно так получилось, и что нужно понять, чтобы не сидеть годами на одной работе за 100к, когда соседняя сфера платит втрое больше. Читать далее
Статья о том, почему не надо учить Redux и прочие внешние сторы За два года я ни разу не написал ни одного редьюсера Везде антипаттерны, да ?
Вышла недавно статья на Хабре, которая осталась незамеченной.Девушка, которая не шарит в программировании, навайбкодила телеграм-бота для практики английского. Бот буквально является оберткой над ChatGPT.Что не так с этой историей... Читать далее
В феврале 2026 года эксперты F6 Threat Intelligence обнаружили файл, исследование которого привело к раскрытию инфраструктуры ранее неизвестной группировки. Специалисты F6 назвали её SiribClone – по метаданным одного из атакующих и используемому инструменту rclone (утилита командной строки с…
В начале XIX века английские ткачи ломали станки — не потому что не понимали технологию, а потому что понимали слишком хорошо. Два века спустя эта тревога возвращается. Перевод статьи Why the Biggest Threat to Robotics Isn't Technical (Six Degrees of Robotics, Аарон Прейтер, май 2026) о том, почему главная угроза робототехнике сегодня — не техническая, с моими пояснениями для тех, кто следит за темой снаружи индустрии. Читать далее
Remote Photoplethysmography (rPPG) — это технология бесконтактного измерения физиологических сигналов человека по видеозаписи. Изначально метод создавался для оценки пульса через обычную камеру, но позже стал одним из важных инструментов обнаружения дипфейков.Основная идея очень…
Один лагерь показывает 0,1% обращений в логах и хоронит файл. Другой обещает прирост цитируемости на 30–60%. Обе цифры реальны. Они измеряют разные вещи, и пока спорщики этого не видят, спор идёт по кругу.Я полгода вожусь с llms.txt на клиентских проектах и на собственном сайте. В мае…
Компании уже оплачивают сотрудникам Claude Code, Cursor или Codex, но не всегда видят рост производительности. Проблема часто не в модели, а в том, что знания о процессах, решениях и ошибках остаются на локальных компьютерах сотрудников. Разбираю, зачем команде общая память, и при чём тут GBrain, OpenBrain и обычные Markdown-файлы. Научиться работать с контекстом
В этом тексте я произвел обзор микросхемы SPI-NOR FLASH памяти MX25L6433F. Показан код, который позволит запустить на микросхеме файловую систему LittleFS. Читать далее