Что общего между нейросетью и радиопередатчиком? В этой статье я рассматриваю кодирование категориальных признаков как процесс передачи информации через сигнальные каналы — с гармониками, фазами, QAM-созвездиями и функциями активации, превращающими данные в управляемые сигналы. Читать далее
В этой статье я выскажу свою точку зрения о том, что из себя представляют категориальные признаки. Расскажу про способы работы с ними, которыми пользуюсь сам как антифрод-аналитик в Каруне. Читать далее
Target encoding кажется удобным способом «сжать» категориальные признаки и добавить модели сигнал, но вместе с этим он легко приводит к утечке таргета и завышенным метрикам, которые не переживают прод. В статье разбирается, где именно возникает leakage, почему наивная реализация ломает модель и как правильно считать признаки через LOO и K-Fold, чтобы получать честный результат, а не иллюзию качества. Читать далее
Нейросети оперативно анализируют гигантские массивы текстовой информации, обучаются на промахах и обеспечивают перевод довольно точно. Сегодня даже профильные лингвисты нередко применяют подобный метод перевода больших текстов. Можно ли довериться переводу нейросети и когда его хватит?Конечно, нейросети сильно упрощают нашу жизнь. Но даже самые современные нейронки делают ошибки. Уже набралось немало примеров, когда машинный перевод оказался не слишком удачным. Читать далее