自动语音匹配的开放源代码?
自动语音匹配不是自动语音识别,它是比较两段语音音频信号并返回这两个音频信号匹配的百分比。
这种技术通常会像这样的场景使用:
我们可以从上面的单个单词延伸到一个句子。 那么如何匹配这些音频信号呢?
这里的问题是为ASM寻找一些好的开源或商业解决方案。
或者是否有其他针对这些实际需求的良好解
提前致谢 !
与模板的比较不会带来任何好处,因为它不会实际暗示错误地发音。 良好的发音学习框架与模板不匹配,但是声学模型代表正确和错误的发音。 这样它可以检测学习者所做的言语错误。 你可以阅读
SRI EduSpeakTM系统:识别和发音评分http://www.speech.sri.com/people/hef/papers/EduSpeak.ps
为了在iPhone上实现这个算法,你可以检查
http://ottercall.com
链接地址: http://www.djcxy.com/p/34429.html上一篇: Open source for Automatic Speech Matching ?
下一篇: Open Source Software For Transcribing Speech in Audio Files