Как собрать датасет за неделю: опыт студентов магистратуры «Наука о данных»

Как собрать датасет за неделю: опыт студентов магистратуры «Наука о данных»

Привет, Хабр! Сегодня хотим представить вам некоммерческий открытый датасет, собранный командой студентов магистратуры «Наука о данных» НИТУ МИСиС и Zavtra.Online (подразделении SkillFactory по работе с вузами) в рамках первого учебного Дататона. Мероприятие проходило как один из форматов

24 декабря 2020, четверг 15:13 Оставить комментарий Источник

Похожие материалы

Нужно больше датасетов. Музыка, IT-скилы и котики

Привет, Хабр! Совсем недавно мы писали про открытый датасет, собранный командой студентов магистратуры «Наука о данных» НИТУ МИСиС и Zavtra.Online (подразделение SkillFactory по работе с университетами) в рамках первого учебного Дататона. А сегодня представим вам целых 3 датасета от команд,

11 февраля 2021, четверг 19:36 Источник
Огромный открытый датасет русской речи версия 1.0

В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. Подробнее о нашей мотивации и о том, как всё начиналось, можно прочитать в этой статье — Огромный открытый датасет русской речи. С тех пор наш проект прошел через ряд…

5 ноября 2019, вторник 12:28 Источник
Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках

Мы выложили в публичный доступ гигантский датасет для детекции речи (voice activity detection).Датасет содержит порядка 150 тысяч часов аудио более чем на 6,000 языках. Количество уникальных ISO-кодов данного датасета не совпадает с фактическим количеством языков, так как близкие языки могут…

11 апреля 2024, четверг 8:26 Источник

Как собрать датасет за неделю: опыт студентов магистратуры «Наука о данных»

Комментарии

Похожие материалы

Нужно больше датасетов. Музыка, IT-скилы и котики

Огромный открытый датасет русской речи версия 1.0

Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках