无需字典即可识别未转录语音的开源工具
只是做一些普通的研究。 是否有任何开源(甚至付费?)工具/程序可以执行以下操作:
INPUT(输入):一些无标签语音的音频文件,可能只有几句话(没有指出音频中的语音标注是什么)
OUTPUT:音频文件(在IPA alphebet中)与音频对齐并标记在一起
这可能只需要一个语音词典和一个词典就可以完成吗?
狮身人面像有一个所有的电话功能,将产生这种输出假设。 但是大多数语音识别通过使用语音词典和n-gram语言模型而得到了很大的改进。 可以在创建假设时使用这些东西,然后用Sphinx将其转换为带标记的对齐音素。
这是一个仅用于拼音的例子。
http://cmusphinx.sourceforge.net/wiki/phonemerecognition
但是我很久没有离开演讲录音游戏了。 我相信大多数人现在正在为这些概念寻求神经网络,并且我不知道那个空间中有任何开放的神经网络。
链接地址: http://www.djcxy.com/p/5877.html上一篇: Open source tools for recognizing untranscribed speech without a dictionary
下一篇: how to give an audio file as input to the google speech to text api?