Опыт дистилляции моделей распознавания речи

Опыт дистилляции моделей распознавания речи

Небольшая история про наш опыт дистилляции моделей для распознавания речи. Как у нас получилось уменьшить модель в 160 раз и не проиграть по качеству. Читать далее

24 мая 2024, пятница 13:16 Оставить комментарий Источник

Похожие материалы

[Перевод] Задача распознавания речи пока не решена

С тех пор, как на сцену распознавания речи вышло глубинное обучение, количество ошибок в распознавании слов кардинально уменьшилось. Но, несмотря на все те статьи, которые вы могли читать, у нас до сих пор нет распознавания речи человеческого уровня. У распознавателей речи…

8 ноября 2017, среда 15:14 Источник
Законы масштабирования дистилляции

После того, как DeepSeek представил в open source свой метод дистилляции знаний для R1, исследователи из Apple и Оксфордского университета быстро предложили закон масштабирования дистилляции и уже 28 февраля завершили все эксперименты и загрузили 67-страничную статью на arXiv.Apple исследовали…

16 марта 2025, воскресенье 14:17 Источник
GigaAM-v3: открытая SOTA-модель распознавания речи на русском

В прошлой статье мы рассказывали о GigaAM — семействе открытых акустических моделей для русского языка и их дообученных вариантах под распознавание речи и эмоций. Сейчас мы представляем GigaAM-v3 — новую версию модели, которая ещё сильнее поднимает планку качества open source-моделей распознавания речи (Automatic Speech Recognition, ASR) на русском языке: поддерживает новые домены и end-to-end нормализацию текста. Читать далее

4 декабря 2025, четверг 12:00 Источник

Опыт дистилляции моделей распознавания речи

Комментарии

Похожие материалы

[Перевод] Задача распознавания речи пока не решена

Законы масштабирования дистилляции

GigaAM-v3: открытая SOTA-модель распознавания речи на русском