语音识别和信号可视化同步

我正在使用Kinect + Microsoft.Speech进行语音识别。

要获得输入音频流,必须执行以下操作

Stream kinectAudioStream = myKinect.AudioSource.Start();

并开始语音识别

speechRecognitionEngine.SetInputToAudioStream(kinectAudioStream, new   SpeechAudioFormatInfo(...));
speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);

我的目标是实时可视化输入信号(如示波器)并同时进行语音识别。

我尝试了在多个线程中将语音识别添加到Microsoft“AudioBasics-WPF C#示例”中。 它的工作原理,但延迟非常非常糟糕。 语音识别和可视化中的很多中断。

有没有办法提高性能? 有没有人有想法?


那么,你最好的选择是下降到Kinect DMO并连接一个SmartTee过滤器,但这要求你用C ++编写,因为KinectAudioSource不会公开过滤器本身。

链接地址: http://www.djcxy.com/p/64305.html

上一篇: Speech recognition and signal visualization simultaneously

下一篇: Android voice activity detection offline