Наш новый LLM-based синтез речи

Наш новый LLM-based синтез речи

Рассказываем о нашем новом синтезе речи.Мы так и называем его — «новый синтез», или GigaTTS. Под капотом у него GigaChat 3b, аудио адаптер, собственный токенизатор речи и 30 тысяч часов данных. Никаких диффузий. Очень много работы было проделано над обучением модели, на студии и при…

21 ноября 2025, пятница 9:07 Оставить комментарий Источник

Похожие материалы

Теперь наш синтез на 22 языках с кириллицей и ещё в 4 раза быстрее

Источник карты — Проект «Языки России» Институт языкознания РАН, 2021 годДавненько мы не выпускали новых статей про наш синтез речи! В прошлый раз мы добавили синтез на 9 языках народов Индии, существенно улучшили автоматическую простановку ударений, добавили 1 русский голос и…

17 августа 2023, четверг 14:38 Источник
Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество. Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом…

12 апреля 2022, вторник 22:58 Источник
Open Source синтез речи SOVA

Всем привет! Ранее мы выкладывали статью про наше распознавание речи, сегодня мы хотим рассказать вам о нашем опыте по созданию синтеза речи на русском языке, а также поделиться ссылками на репозитории и датасеты для свободного использования в любых целях. Если вам интересна история о том, как мы разработали собственный сервис синтеза речи и каких результатов нам удалось достигнуть, то добро пожаловать под кат. Читать дальше →

18 ноября 2020, среда 1:14 Источник

Наш новый LLM-based синтез речи

Комментарии

Похожие материалы

Теперь наш синтез на 22 языках с кириллицей и ещё в 4 раза быстрее

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

Open Source синтез речи SOVA