语音到文本API

2018-06-23 00:35:09

我正尝试在C＃windows应用程序中创建一个应用程序，该应用程序应使用IBM Watson服务执行语音到文本转换。

我们如何实现IBM Watson Speech to Text API服务https://stream.watsonplatform.net/speech-to-text/api，它应该监听用户语音并编写输出文本。

我搜索了很多文章，在所有这些例子中，.wav（音频）文件作为输入传递并输出文本。

我正在尝试将此语音更加实时地发送到文本，而不是传递现有或存储的音频（.wav）文件。

使用Microsoft.Speech和类似于Recognizer.SetInputToDefaultAudioDevice（）的代码可以完成相同的功能。这里的缺点是，我们必须喂养DictationGrammer。这样应用程序就可以识别语音并转换为文本。

是否有可能通过Watson API服务来完成类似的任务？

IBM Watson SDK for .NET支持WebSockets，它可以满足您在上传音频文件时更加实时地转录的需求：

WebSocket包含一个通过WebSocket协议与服务建立持久连接的单个调用。

SDK可以在这里找到，SDK中的Speech to Text的具体细节可以在这里找到。

链接地址: http://www.djcxy.com/p/64565.html