语音到文本API

我正尝试在C#windows应用程序中创建一个应用程序,该应用程序应使用IBM Watson服务执行语音到文本转换。

我们如何实现IBM Watson Speech to Text API服务https://stream.watsonplatform.net/speech-to-text/api,它应该监听用户语音并编写输出文本。

我搜索了很多文章,在所有这些例子中,.wav(音频)文件作为输入传递并输出文本。

我正在尝试将此语音更加实时地发送到文本,而不是传递现有或存储的音频(.wav)文件。

使用Microsoft.Speech和类似于Recognizer.SetInputToDefaultAudioDevice()的代码可以完成相同的功能。 这里的缺点是,我们必须喂养DictationGrammer。 这样应用程序就可以识别语音并转换为文本。

是否有可能通过Watson API服务来完成类似的任务?


IBM Watson SDK for .NET支持WebSockets,它可以满足您在上传音频文件时更加实时地转录的需求:

WebSocket包含一个通过WebSocket协议与服务建立持久连接的单个调用。

SDK可以在这里找到,SDK中的Speech to Text的具体细节可以在这里找到。

链接地址: http://www.djcxy.com/p/64565.html

上一篇: Speech to Text API

下一篇: System.Speech.Recognition; background control or voice recognition