Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках

Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках

Мы выложили в публичный доступ гигантский датасет для детекции речи (voice activity detection).Датасет содержит порядка 150 тысяч часов аудио более чем на 6,000 языках. Количество уникальных ISO-кодов данного датасета не совпадает с фактическим количеством языков, так как близкие языки могут…

11 апреля 2024, четверг 8:26 Оставить комментарий Источник

Похожие материалы

Огромный открытый датасет русской речи версия 1.0

В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. Подробнее о нашей мотивации и о том, как всё начиналось, можно прочитать в этой статье — Огромный открытый датасет русской речи. С тех пор наш проект прошел через ряд…

5 ноября 2019, вторник 12:28 Источник
RealTime FaceSwap-10k — датасет для задачи детекции real-time дипфейков

Мы в Контуре собрали собственный датасет и использовали его для обучения детектора, ориентированного на работу в сценариях видеосвязи. В статье расскажем, откуда брали материалы, как организовали сбор и тегирование, как генерировали фейки и почему важно заранее продумывать систему тегов. Датасет открыт для сообщества, ссылки оставили в конце статьи. Читать далее

22 декабря 2025, понедельник 12:13 Источник
Огромный открытый датасет русской речи

Специалистам по распознаванию речи давно не хватало большого открытого корпуса устной русской речи, поэтому только крупные компании могли позволить себе заниматься этой задачей, но они не спешили делиться своими наработками. Мы торопимся исправить это годами длящееся недоразумение. Итак, мы предлагаем вашему вниманию набор данных из 4000 часов аннотированной устной речи, собранный из различных интернет-источников. Подробности под катом. Читать дальше →

6 мая 2019, понедельник 23:36 Источник

Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках

Комментарии

Похожие материалы

Огромный открытый датасет русской речи версия 1.0

RealTime FaceSwap-10k — датасет для задачи детекции real-time дипфейков

Огромный открытый датасет русской речи