Обрести свой голос: сложность выбора TTS-архитектуры для ИИ-агента

Обрести свой голос: сложность выбора TTS-архитектуры для ИИ-агента

Продолжение цикла о разработке собственного TTS-сервиса для targetai. В первой - о критериях оценки и методологии бенчмарка. Эта — о том, как мы применили эти критерии на практике.Источник изображения: senivpetro на ресурсе Magnific Читать далее

16 июня 2026, вторник 10:24 Оставить комментарий Источник

Похожие материалы

Как мы выбирали TTS для озвучек примеров в Словаре

Словарь в Puzzle English помогает пользователям учить лексику наряду с аудио- и видеопазлами, подкастами, фильмами, сериалами и песнями. В Словаре переводы сопровождаются аудиопримерами слов и выражений. Для озвучек мы используем записи живых дикторов и TTS — text-to-speech system, синтезаторы речи из текста. Сегодня расскажем, как выбрали TTS-движок Vocalware, почему хотим подключить вместо него систему Amazon Polly и какие задачи человек пока решает лучше робота. Читать дальше →

3 октября 2018, среда 16:11 Источник
Как я написал ASR-движок на Rust: от разочарования в одной модели до мульти-модельной архитектуры

Привет, Хабр! В предыдущей статье я рассказывал, как портировал модель синтеза речи Qwen3-TTS на Rust. Тот проект (RustTTS) получился достаточно успешным — один бинарник, мгновенный старт, никаких Python-зависимостей.Естественным продолжением стала обратная задача — распознавание речи (ASR, Automatic Speech Recognition). Логика казалась простой: у Qwen есть и TTS и ASR, архитектуры похожи, опыт с Candle уже есть, значит справимся за пару недель. Ну... не совсем. Читать далее

11 февраля 2026, среда 13:49 Источник
Снижаем когнитивную сложность при проектировании архитектуры приложения

Когнитивная сложность - это понятие, описывающее сложность процесса познания и мышления. Оно используется в разных областях: в психологии оно характеризует индивидуальную способность к восприятию и обработке информации. Более высокая когнитивная сложность означает, что

19 ноября 2025, среда 18:42 Источник

Обрести свой голос: сложность выбора TTS-архитектуры для ИИ-агента

Комментарии

Похожие материалы

Как мы выбирали TTS для озвучек примеров в Словаре

Как я написал ASR-движок на Rust: от разочарования в одной модели до мульти-модельной архитектуры

Снижаем когнитивную сложность при проектировании архитектуры приложения