Google语音识别如何工作?

我知道音频指纹识别音频文件,它很棒,但我真正想知道的是Google如何制作语音识别API,他们如何获取音频和返回的文字。

我写了一个gem来指纹wav音频文件并对它们进行比较,但是如果我使用指纹来比较我的语音与充满指纹的数据库,那么它可能会花费很长时间。 Google如何做到这一点?

目的:

我非常喜欢语音识别,我想要一个地方开始编码,但我不知道从哪里开始。 DragonVoice是语音识别软件的另一个例子,所有这些软件都非常快。

我想知道服务器流从获取音频记录转换为文本。


使用源代码Luke :-)

最佳的开源语音识别软件(imho):CMUSphinx http://cmusphinx.sourceforge.net/

学习曲线有点陡峭,但应该值得...

FWIW,Stackoverflow上对标签语音识别的描述说:语音识别意味着识别说话的人,而且经常误用意思是“语音识别” - 识别所说的内容。

正如引用的那样,这是一个非常常见的错误:-)

玩的开心 !

链接地址: http://www.djcxy.com/p/34443.html

上一篇: How Google Speech Recognition works?

下一篇: Speech recognition for recorded audio files in .3gp or wav format