Эта статья — своеобразный мастер-класс «DVC для автоматизации ML экспериментов и версионирования данных», который прошел 18 июня на митапе ML REPA (Machine Learning REPA: Reproducibility, Experiments and Pipelines Automation) на площадке нашего банка. Тут я расскажу об особенностях внутренней работы DVC и способах применения его в проектах. Примеры кода, используемые в статье доступны здесь. Код тестировался на MacOS и Linux (Ubuntu). Читать дальше →
Сообщество ML-REPA приглашает на открытый митап по вопросам воспроизводимости и управлению экспериментами в computer vision, который пройдет 15 августа в офисе Райффайзенбанк в Нагатино. На митапе будем разбираться с особенностями обеспечения воспроизводимости экспериментов в Computer Vision, автоматизации пайплайнов и версионирование моделей. Где может пригодиться DVC или MLFlow? А где лучше написать свой “велосипед“? Также глубже посмотрим на реализацию Catalyst и его применение. Читать дальше →
У вас тоже куча файлов и страниц? Да еще и непонятно, какие из них актуальные и нужные? Но вроде ведь такого быть не должно, как так?Что такое семантическое версионирование?Семантическое версионирование (Semantic Versioning, SemVer) — это система версионирования, которая помогает…
Дата-сайентистам необходимо следить, на каком наборе данных ML-модели проявляют себя наилучшим образом и почему. Для этого есть специализированные решения, которые помогают реализовать версионирование данных. Меня зовут Павел Куницын, я главный специалист по анализу данных и МО в ПГК Диджитал, и сегодня хотел бы рассказать о некоторых профильных open source инструментах Читать далее