Бывают моменты, когда сидишь в чате и вдруг осознаёшь: ты стал молчаливее. У тебя вроде бы есть слова — но они прячутся где-то под слоями «ок», «норм» и эмодзи.Ты тянешься к кнопке микрофона. Но палец замирает. Потому что говорить вслух кажется таким же странным, как приехать на свидание в костюме из бархата и с перьями на плечах.Мы живём в мире, где все всё говорят — но всё меньше говорят словами. И это пугает куда больше, чем кажется. Провалиться
С тех пор, как на сцену распознавания речи вышло глубинное обучение, количество ошибок в распознавании слов кардинально уменьшилось. Но, несмотря на все те статьи, которые вы могли читать, у нас до сих пор нет распознавания речи человеческого уровня. У распознавателей речи…
Специалистам по распознаванию речи давно не хватало большого открытого корпуса устной русской речи, поэтому только крупные компании могли позволить себе заниматься этой задачей, но они не спешили делиться своими наработками. Мы торопимся исправить это годами длящееся недоразумение. Итак, мы предлагаем вашему вниманию набор данных из 4000 часов аннотированной устной речи, собранный из различных интернет-источников. Подробности под катом. Читать дальше →
Всем привет! Ранее мы выкладывали статью про наше распознавание речи, сегодня мы хотим рассказать вам о нашем опыте по созданию синтеза речи на русском языке, а также поделиться ссылками на репозитории и датасеты для свободного использования в любых целях. Если вам интересна история о том, как мы разработали собственный сервис синтеза речи и каких результатов нам удалось достигнуть, то добро пожаловать под кат. Читать дальше →