audiogear: как разметить миллионы аудиозаписей для TTS

audiogear: как разметить миллионы аудиозаписей для TTS

Конвейер на Python + Hydra, который превращает папку с аудио в богато размеченный датасет: качество речи, просодия, разборчивость, спикер, транскрипция — по колонке на запись. От одной видеокарты до кластера, карты под нагрузкой, и он не падает на «длинном хвосте» записей, на которых обычно рассыпается наивный скрипт. Читать далее

1 июля 2026, среда 6:11 Оставить комментарий Источник

Похожие материалы

«ВКонтакте» добавит в свое приложения стриминга VK Live возможность воспроизведения аудиозаписей

Социальная сеть «ВКонтакте» планирует добавить функцию воспроизведения аудиозаписей из соответствующего раздела прямо во время стримов через свое приложение VK Live, сообщают «Известия». Автор трансляции сможет включать любой трек из своих аудиозаписей, который впоследствии…

20 марта 2017, понедельник 15:05 Источник
Как мы выбирали TTS для озвучек примеров в Словаре

Словарь в Puzzle English помогает пользователям учить лексику наряду с аудио- и видеопазлами, подкастами, фильмами, сериалами и песнями. В Словаре переводы сопровождаются аудиопримерами слов и выражений. Для озвучек мы используем записи живых дикторов и TTS — text-to-speech system, синтезаторы речи из текста. Сегодня расскажем, как выбрали TTS-движок Vocalware, почему хотим подключить вместо него систему Amazon Polly и какие задачи человек пока решает лучше робота. Читать дальше →

3 октября 2018, среда 16:11 Источник
Как краудсорсинговая платформа Яндекса помогает обучать беспилотники и оценивать качество сервисов

В работе часто встречаются долгие и однообразные задачи, для решения которых нужно много людей. Например, расшифровать несколько сотен аудиозаписей, разметить тысячи изображений или отфильтровать комментарии, число которых постоянно растет. Для этих целей можно содержать…

25 октября 2018, четверг 15:47 Источник

audiogear: как разметить миллионы аудиозаписей для TTS

Комментарии

Похожие материалы

«ВКонтакте» добавит в свое приложения стриминга VK Live возможность воспроизведения аудиозаписей

Как мы выбирали TTS для озвучек примеров в Словаре

Как краудсорсинговая платформа Яндекса помогает обучать беспилотники и оценивать качество сервисов