[Перевод] Распознаем речь с помощью IBM Speech-to-Text API

[Перевод] Распознаем речь с помощью IBM Speech-to-Text API

Извлекаем разговоры из аудиозаписи с легкостью, используя Python.В этой статье вы узнаете, как использовать IBM Speech to Text API для распознавания речи из файла аудиозаписи. Мы будем использовать бесплатную версию API, которая имеет некоторые ограничения, такие как, например, длина звукового файла. Подробнее об API я расскажу в этой статье чуть позже. Позвольте мне начать с предоставления вам некоторой справочной информации о применении распознавания речи в нашей повседневной жизни. Читать далее

17 февраля 2021, среда 20:23 Оставить комментарий Источник

Похожие материалы

CVE-2019-0985

A remote code execution vulnerability exists when the Microsoft Speech API (SAPI) improperly handles text-to-speech (TTS) input, aka 'Microsoft Speech API Remote Code Execution Vulnerability'.

12 июня 2019, среда 22:00 Источник
[Из песочницы] Нормализация текста в задачах распознавания речи

При решении задач, связанных с распознаванием (Speech-To-Text) и генерацией (Text-To-Speech) речи важно, чтобы транскрипт соответствовал тому, что произнёс говорящий — то есть реально устной речи. Это означает, что прежде чем письменная речь станет нашим транскриптом, её нужно нормализовать.…

5 марта 2020, четверг 22:50 Источник
Все переводчики речи в реальном времени — херня. Я написал свой. Тоже херня, но бесплатная

Перепробовал всё что есть на рынке, потратил на подписки больше чем на кофе, и в итоге сел писать с нуля. Вот что вышлоAI Open Source Voice AI Real-time перевод Deepgram Groq Piper TTS STT TTS LLM Google Meet Zoom Личный опыт Elixir Rust macOS Apple Silicon Speech-to-Text Text-to-Speech Сижу на рабочем созвоне. Обсуждаем архитектуру нового…

5 апреля 2026, воскресенье 10:57 Источник

[Перевод] Распознаем речь с помощью IBM Speech-to-Text API

Комментарии

Похожие материалы

CVE-2019-0985

[Из песочницы] Нормализация текста в задачах распознавания речи

Все переводчики речи в реальном времени — херня. Я написал свой. Тоже херня, но бесплатная