Dusha: самый большой открытый датасет для распознавания эмоций в устной речи на русском языке

Dusha: самый большой открытый датасет для распознавания эмоций в устной речи на русском языке

У нас в SberDevices очень сильная команда, разрабатывающая и развивающая решения в сфере речевых технологий. Раньше мы уже рассказывали о том, как обучить модель распознавания речи на открытых данных, и о том, как устроен наш синтез. Однако, помимо распознавания и синтеза речи, мы…

8 февраля 2023, среда 15:32 Оставить комментарий Источник

Похожие материалы

Огромный открытый датасет русской речи версия 1.0

В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. Подробнее о нашей мотивации и о том, как всё начиналось, можно прочитать в этой статье — Огромный открытый датасет русской речи. С тех пор наш проект прошел через ряд…

5 ноября 2019, вторник 12:28 Источник
Огромный открытый датасет русской речи

Специалистам по распознаванию речи давно не хватало большого открытого корпуса устной русской речи, поэтому только крупные компании могли позволить себе заниматься этой задачей, но они не спешили делиться своими наработками. Мы торопимся исправить это годами длящееся недоразумение. Итак, мы предлагаем вашему вниманию набор данных из 4000 часов аннотированной устной речи, собранный из различных интернет-источников. Подробности под катом. Читать дальше →

6 мая 2019, понедельник 23:36 Источник
GigaAM-v3: открытая SOTA-модель распознавания речи на русском

В прошлой статье мы рассказывали о GigaAM — семействе открытых акустических моделей для русского языка и их дообученных вариантах под распознавание речи и эмоций. Сейчас мы представляем GigaAM-v3 — новую версию модели, которая ещё сильнее поднимает планку качества open source-моделей распознавания речи (Automatic Speech Recognition, ASR) на русском языке: поддерживает новые домены и end-to-end нормализацию текста. Читать далее

4 декабря 2025, четверг 12:00 Источник

Dusha: самый большой открытый датасет для распознавания эмоций в устной речи на русском языке

Комментарии

Похожие материалы

Огромный открытый датасет русской речи версия 1.0

Огромный открытый датасет русской речи

GigaAM-v3: открытая SOTA-модель распознавания речи на русском