自动语音匹配的开放源代码？

2018-06-12 00:36:32

自动语音匹配不是自动语音识别，它是比较两段语音音频信号并返回这两个音频信号匹配的百分比。

这种技术通常会像这样的场景使用：

举例来说，学习的标准发音信号是“Hello”，对于正在学习英语的学生来说，他们会发出自己的“Hello”，所以我们需要使用ASM技术来比较学生发音的相似程度或正确度。所以我们需要找出各种算法来比较这两个一维音频信号。

我们可以从上面的单个单词延伸到一个句子。那么如何匹配这些音频信号呢？

这里的问题是为ASM寻找一些好的开源或商业解决方案。

或者是否有其他针对这些实际需求的良好解

提前致谢！

与模板的比较不会带来任何好处，因为它不会实际暗示错误地发音。良好的发音学习框架与模板不匹配，但是声学模型代表正确和错误的发音。这样它可以检测学习者所做的言语错误。你可以阅读

SRI EduSpeakTM系统：识别和发音评分http://www.speech.sri.com/people/hef/papers/EduSpeak.ps

为了在iPhone上实现这个算法，你可以检查

http://ottercall.com

链接地址: http://www.djcxy.com/p/34429.html