基于Windows语音识别的模糊模拟识别
Microsoft C#API提供SpeechRecognitionEngine来识别音频流。 测试识别的一种方法是调用SpeechRecognizer.EmulateRecognize方法
根据文件:
recognizers ignore case and character width when applying
grammar rules to the input phrase
我想知道是否有办法处理更多模糊的字符串,因为即使拼写错误的文本信心也很低! 远离现实生活...
编辑:为了什么目的?
我的语音引擎工作正常,但我也想从文本输入中触发它。
让我们说你的手机,并使用HTML5 SpeechRecognition。 我想将识别的文本发送到引擎以获得与语音相同的行为
好的,我找到了答案! 我应该更好地阅读文档!
SpeechRecognizer.EmulateRecognize
真的很简单,并测试给定的字符串,但
SpeechRecognizer.SimulateRecognize
将尝试构建输入词组的“理想化”音频表示(基于引擎的词典和声学模型)
所以它工作得很好!
当您将音频发送到识别器时,SR引擎会做很多工作来创建一组音素(通过声学建模),然后创建一组字符串(通过音素建模)。 在这个过程中,许多歧义被消除。 EmulateRecognize
不会生成通过SR引擎处理的音频; 它跳过所有的建模,只是做一个字符串匹配。
没有办法解决这个问题,不需要太多的工作(例如,实现一个只支持EmulateRecognize
的SAPI兼容的SR引擎)。
在SpeechSynthesizer.Speak()中输入您的字符串并将其用作SpeechRecognitionEngine的输入?
链接地址: http://www.djcxy.com/p/64561.html上一篇: Fuzzy EmulateRecognize on Windows Speech Recognition
下一篇: Reuse Speech Recognition Training Profile on another Computer