科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道基础软件语音合成与识别技术在C#中的应用

语音合成与识别技术在C#中的应用

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

在.net中,对英文语音有较好的支持,但是对中文语音的支持还没有加入进来

作者:tashanzhishi 来源:论坛 2007年11月13日

关键字:

  • 评论
  • 分享微博
  • 分享邮件
但是,这个方法本身并不知道你给的字符串是什么语言,所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的,我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表,然后在根据参数选择相应的语种,比如设置语种为汉语如下所示:

private void SetChinaVoice()
{
 voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;
}

  0表示是汉用,1234都表示英语,就是口音不同。

  这样,我们就设置了语种,如果结合发音方法,我们就可以设计出一个只发汉语语音的方法

private void SpeakChina(string strSpeak)
{
 SetChinaVoice() ;
 Speak(strSpeak) ;
}

  只发英语语音的方法也是类似的,上面程序里有。

  对于一段中英文混合的语言,我们让程序读出混合语音的方法就是:编程把这段语言的中英文分开,对于中文调用SpeakChina方法,英文调用SpeakEnglishi方法;至于怎样判断一个字符是英文还是中文,我采用的是判断asc码的方法,具体的类方法是通过AnalyseSpeak实现的。

  这样,对于一段中英文混合文字,我们只需把它作为参数传递给AnalyseSpeak就可以了,他能够完成中英文的混合发音。

  当然,对于发音的暂定、继续、停止等操作,上面也给出了简单的方法调用,很容易明白。

  下面简单介绍一下中文语音识别的方法:

  先把该语音识别的类源代码贴在下面,然后再做说明:

public class SpRecognition
{
 private static SpRecognition _Instance = null ;
 private SpeechLib.ISpeechRecoGrammar isrg ;
 private SpeechLib.SpSharedRecoContextClass ssrContex =null;
 private System.Windows.Forms.Control cDisplay ;
 private SpRecognition()
 {
  ssrContex = new SpSharedRecoContextClass() ;
  isrg = ssrContex.CreateGrammar(1) ;
  SpeechLib._ISpeechRecoContextEvents_RecognitionEventHandler recHandle = new _ISpeechRecoContextEvents_RecognitionEventHandler(ContexRecognition) ;
  ssrContex.Recognition += recHandle ;
 }

 public void BeginRec(Control tbResult)
 {
  isrg.DictationSetState(SpeechRuleState.SGDSActive) ;
  cDisplay = tbResult ;
 }
 public static SpRecognition instance()
 {
  if (_Instance == null)
   _Instance = new SpRecognition() ;
   return _Instance ;
 }

 public void CloseRec()
 {
  isrg.DictationSetState(SpeechRuleState.SGDSInactive) ;
 }
 private void ContexRecognition(int iIndex,object obj,SpeechLib.SpeechRecognitionType type,SpeechLib.ISpeechRecoResult result)
 {
  cDisplay.Text += result.PhraseInfo.GetText(0,-1,true) ;
 }
}

  我们定义了ssrContex 和isrg为语音识别的上下文和语法,通过设置isrg的DictationSetState方法,我们可以开始或结束识别,在上面的程序中是BeginRec和CloseRec方法。cDisplay 是我们用来输出识别结果的地方,为了能够在大部分控件上都可以显示结果,我用了一个Control 类来定义它。当然,每次语音识别后都会触发ISpeechRecoContextEvents_RecognitionEventHandler 事件,我们定义了一个这样的方法ContexRecognition来响应事件,并且在这个方法里输出识别结果。

  这样,中文语音处理的一些最基本的问题就有了一个简单的解决方法,当然,这种方法还有很多不完善的地方,希望大家多提出批评意见,共同提高。

查看本文来源

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章