End2End-подход в задачах Automatic Speech Recognition

End2End-подход в задачах Automatic Speech Recognition

Что такое End2End-распознавание речи, и зачем же оно нужно? В чем его отличие от классического подхода? И почему для обучения хорошей модели на основе End2End нам потребуется огромное количество данных — в нашем сегодняшнем посте. Классический подход к распознаванию речи Прежде чем рассказать про End2End-подход, стоит сначала поговорить про классический подход к распознаванию речи. Что он из себя представляет? Читать дальше →

25 сентября 2019, среда 14:54 Оставить комментарий Источник

Похожие материалы

Распознавание речи, генерация субтитров и изучение языков при помощи Whisper

Есть ряд платных решений по переводу речи в текст (Automatic Speech Recognition). Сравнительно малыми усилиями можно сделать бесплатное решение, — дообучить на своих данных end2end модель (например, взять фреймворк NeMo от NVIDIA) или гибридную модель типа kaldi. Сверху понадобится прикрутить…

10 октября 2022, понедельник 15:02 Источник
End2End-подход к пониманию разговорной речи

Существует несколько подходов к понимаю машиной разговорной речи: классический трехкомпонентный подход (включает компонент распознавания речи, компонент понимания естественного языка и компонент, отвечающий за некую бизнес-логику) и End2End-подход, который предполагает четыре…

8 мая 2019, среда 16:58 Источник
[Перевод] Node.js + face-recognition.js: простое и надёжное распознавание лиц с помощью глубокого обучения

Перевод статьи Node.js + face-recognition.js: Simple and Robust Face Recognition using Deep Learning. В этой статье мы расскажем, как реализовать надёжную систему распознавания лиц с использованием face-recognition.js. Мы искали подходящую Node.js-библиотеку, которая умела бы аккуратно распознавать лица, но ничего не нашли.…

20 марта 2018, вторник 12:39 Источник

End2End-подход в задачах Automatic Speech Recognition

Комментарии

Похожие материалы

Распознавание речи, генерация субтитров и изучение языков при помощи Whisper

End2End-подход к пониманию разговорной речи

[Перевод] Node.js + face-recognition.js: простое и надёжное распознавание лиц с помощью глубокого обучения