未经指导的语音转换为文本

我正试图想出一种将讲话转换为文本的方式。 我正在尝试使用狮身人面像来达到此目的。 我的意思是说,对于文本而言,没有引导性的言论是,说话者不一定要从一组明确的句子中说话。 相反,他可能会说任何一句话。 所以我不可能拥有一个语法文件,其中每个单词都是预先写在语法文件中的备选文件之一。 我知道我必须以某种方式训练狮身人面像来做到这一点。

但我是狮身人面像的初学者。 如何开始训练狮身人面像转换非制导言论? 是否有可能通过Sphinx实现无导向转换?


目前,你所要完成的任务还不能完成,至少不能满足精确性。

至于基于狮身人面像的解决方案:您将不得不创建包含所有要识别的单词的字典。 没有其他办法。

一旦你有了字典,你就可以基于它生成一个简单的n元语法模型,用ony unigrams - 每个单元将会是一个单词。 每一个的概率可能相同,或者您可能试图对将使用的单词进行一些统计分析。

链接地址: http://www.djcxy.com/p/34399.html

上一篇: Unguided speech to text conversion

下一篇: Speech recognition online (similar to google voice search)