自动语音匹配的开放源代码?

自动语音匹配不是自动语音识别,它是比较两段语音音频信号并返回这两个音频信号匹配的百分比。

这种技术通常会像这样的场景使用:

  • 举例来说,学习的标准发音信号是“Hello”,对于正在学习英语的学生来说,他们会发出自己的“Hello”,所以我们需要使用ASM技术来比较学生发音的相似程度或正确度。 所以我们需要找出各种算法来比较这两个一维音频信号。
  • 我们可以从上面的单个单词延伸到一个句子。 那么如何匹配这些音频信号呢?

    这里的问题是为ASM寻找一些好的开源或商业解决方案。

    或者是否有其他针对这些实际需求的良好解

    提前致谢 !


    与模板的比较不会带来任何好处,因为它不会实际暗示错误地发音。 良好的发音学习框架与模板不匹配,但是声学模型代表正确和错误的发音。 这样它可以检测学习者所做的言语错误。 你可以阅读

    SRI EduSpeakTM系统:识别和发音评分http://www.speech.sri.com/people/hef/papers/EduSpeak.ps

    为了在iPhone上实现这个算法,你可以检查

    http://ottercall.com

    链接地址: http://www.djcxy.com/p/34429.html

    上一篇: Open source for Automatic Speech Matching ?

    下一篇: Open Source Software For Transcribing Speech in Audio Files