基于Windows语音识别的模糊模拟识别

Microsoft C#API提供SpeechRecognitionEngine来识别音频流。 测试识别的一种方法是调用SpeechRecognizer.EmulateRecognize方法

根据文件:

recognizers ignore case and character width when applying 
grammar rules to the input phrase

我想知道是否有办法处理更多模糊的字符串,因为即使拼写错误的文本信心也很低! 远离现实生活...

  • 随着音频我可以说,你好,赫洛,赫洛有一个很好的信心
  • 用文本引擎是非常严格的
  • 编辑:为了什么目的?

    我的语音引擎工作正常,但我也想从文本输入中触发它。

    让我们说你的手机,并使用HTML5 SpeechRecognition。 我想将识别的文本发送到引擎以获得与语音相同的行为


    好的,我找到了答案! 我应该更好地阅读文档!

    SpeechRecognizer.EmulateRecognize
    

    真的很简单,并测试给定的字符串,但

    SpeechRecognizer.SimulateRecognize
    

    将尝试构建输入词组的“理想化”音频表示(基于引擎的词典和声学模型)

    所以它工作得很好!


    当您将音频发送到识别器时,SR引擎会做很多工作来创建一组音素(通过声学建模),然后创建一组字符串(通过音素建模)。 在这个过程中,许多歧义被消除。 EmulateRecognize不会生成通过SR引擎处理的音频; 它跳过所有的建模,只是做一个字符串匹配。

    没有办法解决这个问题,不需要太多的工作(例如,实现一个只支持EmulateRecognize的SAPI兼容的SR引擎)。


    在SpeechSynthesizer.Speak()中输入您的字符串并将其用作SpeechRecognitionEngine的输入?

    链接地址: http://www.djcxy.com/p/64561.html

    上一篇: Fuzzy EmulateRecognize on Windows Speech Recognition

    下一篇: Reuse Speech Recognition Training Profile on another Computer