Google语音识别库或API

Google近期在语音识别软件方面取得了长足的进步,语音识别软件已用于多种开源产品,如Chromium Web Speech和Android Handsfree发短信。 我想使用他们的语音识别作为我的服务器堆栈的一部分,但我找不到太多。

文本识别软件是否可以作为图书馆或包? 或者,我可以从另一个程序调用铬来将某些音频文件转录为文本吗?


Web Speech API的设计仅适用于Chrome或Android环境。 在客户端中有很多工作要做,所以没有公共的服务器API来接收音频文件并处理它。

如果您搜索github,您可以找到诸如https://gist.github.com/alotaiba/1730160之类的工具,但我相当肯定这种访问方式100%不受支持,认可或确认可以继续工作。


先前在https://gist.github.com/alotaiba/1730160上陈述的方法确实对我有用。 我在家庭自动化计划中每天都会使用它。 我使用python脚本来捕捉音频并确定什么是有用的音频或噪声,然后将小音频片段发送到谷歌,并在一秒钟内返回文本! 我已经成功地将它集成到我的程序中,如果你在谷歌周围,你会发现更多的人也有!

链接地址: http://www.djcxy.com/p/34349.html

上一篇: Google speech recognition library or API

下一篇: PhoneGap + Speech Recognition SDK