Google语音识别库或API

2018-06-11 23:55:12

Google近期在语音识别软件方面取得了长足的进步，语音识别软件已用于多种开源产品，如Chromium Web Speech和Android Handsfree发短信。我想使用他们的语音识别作为我的服务器堆栈的一部分，但我找不到太多。

文本识别软件是否可以作为图书馆或包？或者，我可以从另一个程序调用铬来将某些音频文件转录为文本吗？

Web Speech API的设计仅适用于Chrome或Android环境。在客户端中有很多工作要做，所以没有公共的服务器API来接收音频文件并处理它。

如果您搜索github，您可以找到诸如https://gist.github.com/alotaiba/1730160之类的工具，但我相当肯定这种访问方式100％不受支持，认可或确认可以继续工作。

先前在https://gist.github.com/alotaiba/1730160上陈述的方法确实对我有用。我在家庭自动化计划中每天都会使用它。我使用python脚本来捕捉音频并确定什么是有用的音频或噪声，然后将小音频片段发送到谷歌，并在一秒钟内返回文本！我已经成功地将它集成到我的程序中，如果你在谷歌周围，你会发现更多的人也有！

链接地址: http://www.djcxy.com/p/34349.html

上一篇: Google speech recognition library or API

下一篇: PhoneGap + Speech Recognition SDK