无需字典即可识别未转录语音的开源工具

2018-05-31 01:05:39

只是做一些普通的研究。是否有任何开源（甚至付费？）工具/程序可以执行以下操作：

INPUT（输入）：一些无标签语音的音频文件，可能只有几句话（没有指出音频中的语音标注是什么）

OUTPUT：音频文件（在IPA alphebet中）与音频对齐并标记在一起

这可能只需要一个语音词典和一个词典就可以完成吗？

狮身人面像有一个所有的电话功能，将产生这种输出假设。但是大多数语音识别通过使用语音词典和n-gram语言模型而得到了很大的改进。可以在创建假设时使用这些东西，然后用Sphinx将其转换为带标记的对齐音素。

这是一个仅用于拼音的例子。

http://cmusphinx.sourceforge.net/wiki/phonemerecognition

但是我很久没有离开演讲录音游戏了。我相信大多数人现在正在为这些概念寻求神经网络，并且我不知道那个空间中有任何开放的神经网络。

链接地址: http://www.djcxy.com/p/5877.html