Помните, я обещал рассказать про датасет, на котором можно сойти с ума? Ну вот, однажды пришли к нам инженеры производства и говорят, что надо помочь с отладкой. Цеха. Дано: огромное литейно-прокатное производство, самая главная установка на котором — МНЛЗ (машина непрерывного…
В Минобороны ДНР полагают, что нельзя серьезно воспринимать заявления секретаря совета национальной безопасности и обороны Украины Александра Турчинова, который на своем посту «совершенно сошел с ума».
В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. Подробнее о нашей мотивации и о том, как всё начиналось, можно прочитать в этой статье — Огромный открытый датасет русской речи. С тех пор наш проект прошел через ряд…
Мы выложили в публичный доступ гигантский датасет для детекции речи (voice activity detection).Датасет содержит порядка 150 тысяч часов аудио более чем на 6,000 языках. Количество уникальных ISO-кодов данного датасета не совпадает с фактическим количеством языков, так как близкие языки могут…