买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】前后鼻音韵母的参数合成方法及感知范畴测量方法、装置_北京语言大学_201610149425.8 

申请/专利权人:北京语言大学

申请日:2016-03-16

公开(公告)日:2019-08-16

公开(公告)号:CN105825847B

主分类号:G10L13/10(20130101)

分类号:G10L13/10(20130101)

优先权:

专利状态码:有效-授权

法律状态:2019.08.16#授权;2016.08.31#实质审查的生效;2016.08.03#公开

摘要:本发明的实施方式提供了前后鼻音韵母的参数合成方法及感知范畴测量方法、装置,其中,该前后鼻音韵母的参数合成方法包括:获取包含前后鼻音音节的若干语音信号,并确定关键音段;通过处理每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统;利用第二共振峰连续统、第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统;将关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音。本发明为参数法合成鼻音提供了新方法,所合成的前后鼻音韵母连续统可应用于前后鼻音知觉空间的范畴化测量,打开了计算机辅助鼻音教学的新思路。

主权项:1.一种前后鼻音韵母的参数合成方法,其特征在于,包括:确定一对前后鼻音音节,获取包含所述前后鼻音音节的若干语音信号,并确定每个语音信号的关键音段;提取所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线;通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统;所述第二共振峰连续统包括多条合成的第二共振峰曲线,所述第三共振峰连续统包括多条合成的第三共振峰曲线;利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统;所述关键音段连续统包括多个合成的关键音段;将所述关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音;其中,所述的通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统,包括:按照时间顺序在所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线上各选取N个点,并确定每个点的第二共振峰值和第三共振峰值;其中N为自然数;针对第二共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第二共振峰的平均值;针对第三共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第三共振峰的平均值,其中,i=1,2,3…N;针对第二共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一结束值,将所述第一初始值至所述第一结束值的数值进行M-1等分;将第二共振峰曲线上N个点对应的第k个等分点的数值相连接,将第二共振峰曲线上N个点的第一初始值相连接,将第二共振峰曲线上N个点的第一结束值相连接,共合成M条第二共振峰曲线,将合成的所述M条第二共振峰曲线组成所述第二共振峰连续统;其中,M为自然数,k=1,2,3…M-2;针对第三共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二结束值,将所述第二初始值至所述第二结束值的数值进行M-1等分;将第三共振峰曲线上N个点对应的第k个等分点的数值相连接,将第三共振峰曲线上N个点的第二初始值相连接,将第三共振峰曲线上N个点的第二结束值相连接,共合成M条第三共振峰曲线,将合成的所述M条第三共振峰曲线组成所述第三共振峰连续统;其中,所述的利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统,包括:将所述第二共振峰连续统中的第二共振峰曲线与所述第三共振峰连续统中的第三共振峰曲线两两组合成互不相同的曲线组合;将每个所述曲线组合与第二共振峰和第三共振峰以外的其他共振峰合成关键音段;将所述合成的关键音段组成所述关键音段连续统。

全文数据:前后鼻音韵母的参数合成方法及感知范畴测量方法、装置技术领域本发明的实施方式涉及语音处理技术,特别是关于计算机辅助语音设备中的语音识别技术,具体的讲是一种前后鼻音韵母的参数合成方法及感知范畴测量方法、装置。背景技术本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。日常生活中我们常常遇到前后鼻音不分的人,既包括来自很多方言区的中国人,也包括学习汉语的外国人。而普通话中有鼻音音节502个,约占音节总数的42%;且这502个音节中又有60%左右因为前后鼻音的音位对立造成意义上的不同。前后鼻音不分造成字词的混淆以及意义上的歧解,不仅给我们日常交流带来不便,也对外国人学习汉语语音、鼻音音节所对应的汉字、词汇,甚至理解相应的句子,产生了非常不利的影响。例如对于日本学生而言,大量研究证实,日本学习者在感知和产出普通话前后鼻音节时遇到了较大问题。他们学习汉语的语音时最难的部分即为鼻音。如果能及时发现汉语普通话学习者的鼻音偏误问题,并给予他们准确、有效的反馈,将会大大地提高他们的普通话发音的准确度。另外,在信息科学和计算机科学迅速发展的今天,语音合成技术取得了巨大的进步。高清晰度、高自然度,乃至高表现力的语音合成技术和系统不断涌现,被广泛应用于信息查询、自动报警、人机交互乃至计算机辅助语言学习等领域。语音合成技术甚至可以提供各种人类难以发出的、声学参数精确控制的合成语音,对于语音学、语音感知、语音教学等研究和应用有着重要价值。语音合成技术的种类主要有参数合成和语料库合成两种,参数合成的基本理论假设是语音的产生可以看作滤波器对于激励声源的滤波结果,语料库合成则是基于细小片段语音拼接来产生连续语流的方法。两种方法各有特点,都是目前研究的热点。发明内容前后鼻音韵母在汉语普通话中载有重要的信息传递作用,但是已有的研究表明很多汉语母语者及二语学习者在其习得上存在较大困难。知觉分辨是语音范畴习得的基础,为了能够测量不同母语背景被试的普通话前后鼻音知觉空间,需要有关键声学参数渐变的“前后鼻音韵母连续统”作为测量工具。但是在语音合成研究中,由于鼻腔共鸣的复杂性,相比于其他音素的语音合成,鼻音音节合成一直是一个难点。普通话的前后鼻音音节可分为三个部分:元音段、过渡段和鼻音尾。已有的研究发现鼻韵母的元音段和过渡段含有该鼻韵母的主要辨别信息。在研究本发明的过程中,通过基于自然音节剪切和拼接样本的语音感知实验,发明人发现鼻音尾对于汉语母语者辨认鼻音作用很小,过渡段对于汉语母语者辨别前后鼻音类型起决定性的作用,而当元音段和过渡段位置线索冲突时,汉语母语者又会倾向于依赖过渡段。这也就是说,过渡段载有对于普通话母语背景者关于前后鼻音知觉分辨的关键声学线索,通过进一步研究发现,这一关键声学线索可以归结为前后鼻音音节的过渡段在其第二共振峰F2、第三共振峰F3具有不同的分布情况。基于此项发现,前后鼻音韵母的参数合成就可以绕开复杂的鼻音尾合成问题,而利用一般的参数合成法合成出具有较高前后辨识度的鼻音韵母。为此,本发明提出一种前后鼻音韵母的参数合成方法、一种前后鼻音韵母的感知范畴测量方法、一种前后鼻音韵母的参数合成装置、一种前后鼻音韵母的感知范畴测量装置,为计算机辅助鼻音学习提供条件。在本发明实施方式的第一方面中,提供了一种前后鼻音韵母的参数合成方法,包括:确定一对前后鼻音音节,获取包含所述前后鼻音音节的若干语音信号,并确定每个语音信号的关键音段;提取所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线;通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统;所述第二共振峰连续统包括多条合成的第二共振峰曲线,所述第三共振峰连续统包括多条合成的第三共振峰曲线;利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统;所述关键音段连续统包括多个合成的关键音段;将所述关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音;其中,所述的通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统,包括:按照时间顺序在所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线上各选取N个点,并确定每个点的第二共振峰值和第三共振峰值;其中N为自然数;针对第二共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第二共振峰的平均值;针对第三共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第三共振峰的平均值,其中,i=1,2,3…N;针对第二共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一结束值,将所述第一初始值至所述第一结束值的数值进行M-1等分;将第二共振峰曲线上N个点对应的第k个等分点的数值相连接,将第二共振峰曲线上N个点的第一初始值相连接,将第二共振峰曲线上N个点的第一结束值相连接,共合成M条第二共振峰曲线,将合成的所述M条第二共振峰曲线组成所述第二共振峰连续统;其中,M为自然数,k=1,2,3…M-2;针对第三共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二结束值,将所述第二初始值至所述第二结束值的数值进行M-1等分;将第三共振峰曲线上N个点对应的第k个等分点的数值相连接,将第三共振峰曲线上N个点的第二初始值相连接,将第三共振峰曲线上N个点的第二结束值相连接,共合成M条第三共振峰曲线,将合成的所述M条第三共振峰曲线组成所述第三共振峰连续统;其中,所述的利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统,包括:将所述第二共振峰连续统中的第二共振峰曲线与所述第三共振峰连续统中的第三共振峰曲线两两组合成互不相同的曲线组合;将每个所述曲线组合与第二共振峰和第三共振峰以外的其他共振峰合成关键音段;将所述合成的关键音段组成所述关键音段连续统。在本发明实施方式的第二方面中,提供了一种前后鼻音韵母的感知范畴测量方法,包括:根据前述的前后鼻音韵母的参数合成方法得到前后鼻音韵母连续统;利用所述前后鼻音韵母连续统中的各个合成语音,对若干被试进行前后鼻音感知测试;基于所述前后鼻音感知测试的结果,利用logistic回归模型确定回归系数;利用所述回归系数确定所述若干被试的前后鼻音感知范畴;其中,所述的基于所述前后鼻音感知测试的结果,利用logistic回归模型确定回归系数,包括:利用所述前后鼻音感知测试的结果绘制感知曲线,该感知曲线的第一坐标轴记录所述前后鼻音韵母连续统中各个合成语音的编号,第二坐标轴记录被试的前后鼻音感知比例;在所述感知曲线上选取多个点,并确定所述选取的点的坐标值;将所述选取的点的坐标值代入如下的logistic回归模型中,计算回归系数:其中,x为所述感知曲线上的点在第一坐标轴上的坐标值,L为所述感知曲线上的点在第二坐标轴上的坐标值,PI为回归曲线的识别率,b1为回归曲线的斜率,b0为回归曲线的截距,所述的回归系数包括PI、b1、b0。在本发明实施方式的第三方面中,提供了一种前后鼻音韵母的参数合成装置,包括:关键音段确定模块,用于确定一对前后鼻音音节,获取包含所述前后鼻音音节的若干语音信号,并确定每个语音信号的关键音段;共振峰提取模块,用于提取所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线;共振峰连续统合成模块,用于通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统;所述第二共振峰连续统包括多条合成的第二共振峰曲线,所述第三共振峰连续统包括多条合成的第三共振峰曲线;关键音段连续统合成模块,用于利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统;所述关键音段连续统包括多个合成的关键音段;语音合成模块,用于将所述关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音;所述共振峰连续统合成模块进一步包括:点选取模块,用于按照时间顺序在所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线上各选取N个点,并确定每个点的第二共振峰值和第三共振峰值;其中N为自然数;共振峰平均值计算模块,用于针对第二共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第二共振峰的平均值;针对第三共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第三共振峰的平均值,其中,i=1,2,3…N;第二共振峰连续统合成模块,用于针对第二共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一结束值,将所述第一初始值至所述第一结束值的数值进行M-1等分;将第二共振峰曲线上N个点对应的第k个等分点的数值相连接,将第二共振峰曲线上N个点的第一初始值相连接,将第二共振峰曲线上N个点的第一结束值相连接,共合成M条第二共振峰曲线,将合成的所述M条第二共振峰曲线组成所述第二共振峰连续统;其中,M为自然数,k=1,2,3…M-2;第三共振峰连续统合成模块,用于针对第三共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二结束值,将所述第二初始值至所述第二结束值的数值进行M-1等分;将第三共振峰曲线上N个点对应的第k个等分点的数值相连接,将第三共振峰曲线上N个点的第二初始值相连接,将第三共振峰曲线上N个点的第二结束值相连接,共合成M条第三共振峰曲线,将合成的所述M条第三共振峰曲线组成所述第三共振峰连续统;所述关键音段连续统合成模块,进一步包括:曲线组合模块,用于将所述第二共振峰连续统中的第二共振峰曲线与所述第三共振峰连续统中的第三共振峰曲线两两组合成互不相同的曲线组合;关键音段合成模块,用于将每个所述曲线组合与第二共振峰和第三共振峰以外的其他共振峰合成关键音段;关键音段集成模块,用于将所述合成的关键音段组成所述关键音段连续统。在本发明实施方式的第四方面中,提供了一种前后鼻音韵母的感知范畴测量装置,包括:如前所述的前后鼻音韵母的参数合成装置;测试模块,用于利用所述前后鼻音韵母的参数合成装置合成的前后鼻音韵母连续统中的各个合成语音,对若干被试进行前后鼻音感知测试;回归模型计算模块,用于基于所述前后鼻音感知测试的结果,利用logistic回归模型确定回归系数;范畴确定模块,用于利用所述回归系数确定所述若干被试的前后鼻音感知范畴;所述回归模型计算模块,进一步包括:感知曲线绘制模块,用于利用所述前后鼻音感知测试的结果绘制感知曲线,该感知曲线的第一坐标轴记录所述前后鼻音韵母连续统中各个合成语音的编号,第二坐标轴记录被试的前后鼻音感知比例;坐标选取模块,用于在所述感知曲线上选取多个点,并确定所述选取的点的坐标值;回归系数计算模块,用于将所述选取的点的坐标值代入如下的logistic回归模型中,计算回归系数:其中,x为所述感知曲线上的点在第一坐标轴上的坐标值,L为所述感知曲线上的点在第二坐标轴上的坐标值,PI为回归曲线的识别率,b1为回归曲线的斜率,b0为回归曲线的截距,所述的回归系数包括PI、b1、b0。借助于上述技术方案,本发明基于包含前后鼻音音节的若干语音信号,确定载有前后鼻音区分特征的关键音段元音段和过渡段,或者,只有过渡段,针对关键音段合成具有连续变化趋势的第二共振峰曲线和第三共振峰曲线,在此基础上继续合成具有连续变化趋势的关键音段,最后合成具有连续变化趋势的合成语音,从而得到前后鼻音韵母连续统;利用合成的前后鼻音韵母连续统对被试进行前后鼻音感知测试,结合logistic回归模型可有效确定被试的前后鼻音感知范畴。本发明为参数法合成鼻音提供了新方法,所合成的前后鼻音韵母连续统可用作鼻音知觉空间的范畴化测量,可有效地解决语音教学中的鼻音教学难点问题,打开了计算机辅助鼻音教学的新思路。附图说明通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:图1为本发明提供的前后鼻音韵母的参数合成方法的流程示意图;图2为阴平音节“fan”的语料标注示意图;图3为合成第二共振峰连续统和第三共振峰连续统的流程示意图;图4为第二共振峰连续统的示意图;图5为第三共振峰连续统的示意图;图6为合成关键音段连续统的流程示意图;图7为关键音段连续统的矩阵形式示意图;图8为关键音段连续统中某一关键音段的共振峰曲线示意图;图9为以前鼻音音节an和后鼻音音节为例合成前后鼻音韵母连续统的过程示意图;图10为对合成语音的关键音段进行能量调整的对比示意图;图11为前后鼻音韵母的感知范畴测量方法的流程示意图;图12为根据中国被试的前后鼻音感知测试结果绘制的感知曲线;图13为中国被试对元音段和过渡段的fan-fang组前后鼻音韵母连续统的前后鼻音感知范畴示意图;图14为中国被试对过渡段的fan-fang组前后鼻音韵母连续统的前后鼻音感知范畴示意图;在附图中,相同或对应的标号表示相同或对应的部分。具体实施方式下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件包括固件、驻留软件、微代码等,或者硬件和软件结合的形式。示例性方法一本发明提供一种前后鼻音韵母连续统合成方法,如图1所示,该方法包括:步骤S11,确定一对前后鼻音音节,获取包含前后鼻音音节的若干语音信号,并确定每个语音信号的关键音段;步骤S12,提取每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线;步骤S13,通过处理每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统;第二共振峰连续统包括多条合成的第二共振峰曲线,第三共振峰连续统包括多条合成的第三共振峰曲线;步骤S14,利用第二共振峰连续统、第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统;关键音段连续统包括多个合成的关键音段;步骤S15,将关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音。本发明基于包含前后鼻音音节的若干语音信号,确定载有前后鼻音区分特征的关键音段元音段和过渡段,或者,只有过渡段,针对关键音段合成具有连续变化趋势的第二共振峰曲线和第三共振峰曲线,在此基础上继续合成具有连续变化趋势的关键音段,最后合成具有连续变化趋势的合成语音,这些合成语音之间呈现前鼻音韵母至后鼻音韵母的连续变化趋势。基于本发明的思想,前后鼻音韵母的元音段和过渡段的第二共振峰、第三共振峰存在不同分布,载有关于前后鼻音知觉分辨的关键声学线索,通过修改前后鼻音韵母的元音段和过渡段的第二共振峰、第三共振峰,即可在前鼻音韵母和后鼻音韵母之间进行转换,实现前后鼻音韵母的参数合成。以下分别针对该方法中的每个步骤进行详细介绍:步骤S11,确定一对前后鼻音音节,获取包含该前后鼻音音节的若干语音信号,确定每个语音信号的关键音段。首先,确定一对前后鼻音音节。例如可以是an和也可以是和还可以是in和为了方便说明,以下均以前鼻音音节an和后鼻音音节为例。其次,获取被试朗读的包含该前后鼻音音节的若干语音信号。为确保本发明得到的合成结果更具普遍意义,可令被试朗读多种辅音声母和该前后鼻音音节组成的音节,例如“fan”和“fang”,“dan”和“dang”,“san”和“sang”,“kan”和“kang”,“pan”和“pang”等等。然后,对获取的每个语音信号进行语料标注。具体的,包括标注辅音声母、元音段、过渡段和鼻音尾。图2所示为一位女性被试朗读阴平音节“fan”的语音信号的波形、能量和共振峰。图2中有两层标注,第一层是拼音层,包含音节的声韵调信息,第二层是音段结构层,分为四个部分:辅音声母“f”,元音段“a”,过渡段“a~”和鼻音尾“n”。标注元音段和过渡段的边界时,主要考虑波形、能量和共振峰这三个因素。如图2所示,过渡段的波形与元音段差异较大,同时能量方面大幅衰减,其共振峰也没有元音段那么稳定。另外,标注时应尽量将边界落在元音段、过渡段和鼻音尾的波形起始原点,以便之后合成音节时音段拼接顺畅,提高合成语料的自然度。最后,根据语料标注的结果,确定每个语音信号的关键音段。目前已有的研究发现元音段和过渡段载有分辨前后鼻音的声学线索,尤其过渡段载有分辨前后鼻音的关键声学线索,基于此项研究,本发明着重对元音段和过渡段进行研究。因此,在设定关键音段时需要考虑元音段和过渡段。可选地,令关键音段为元音段和过渡段,或者仅为过渡段,从而确定每个语音信号的关键音段的步骤为确定每个语音信号的元音段和过渡段,或者仅确定每个语音信号的过渡段。为了研究关键音段是否载有分辨前后鼻音的声学线索,本发明通过步骤S12~S14来合成具有连续变化趋势的关键音段,即关键音段连续统。步骤S12,提取所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线。本步骤可采用目前已有的共振峰提取算法实现,本发明对此不作限定,可根据实际需要选择。步骤S13,通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统。本步骤是基于已有的语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成具有连续变化趋势的第二共振峰曲线,和具有连续变化趋势的第三共振峰曲线,以此作为后续合成具有连续变化趋势的关键音段即关键音段连续统的基础。具体实施时,本步骤可通过图3所示的步骤实现:步骤S31,按照时间顺序在每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线上各选取N个点,并确定每个点的第二共振峰值和第三共振峰值。实际发音测试中,不同被试朗读同一音节例如由相同的辅音声母和前后鼻音音节组成所产生的语音信号可能会不同,同一被试在不同时刻朗读同一音节例如由相同的辅音声母和前后鼻音音节组成所产生的语音信号也可能不同,同一被试朗读包含相同前后鼻音音节的不同音节例如同样的前后鼻音音节与不同的辅音声母组成的音节所产生的语音信号也可能不同,这些不同可能体现在语音信号的时长不同,各个音段的共振峰不同等等。考虑到这些,本发明需要获取被试发出的语音信号的平均水平,以使后续的合成结果可信度更高。由于每个语音信号的关键音段的时长可能是不同的,相应的第二共振峰曲线和第三共振峰曲线的长度也是不同的,考虑时长归一化,本步骤选取N个点的过程可以是:将每个语音信号的关键音段的第二共振峰曲线等分成N-1段,各段的端点总共N个,这N个点即被作为被选取点,同样的,将每个语音信号的关键音段的第三共振峰曲线等分成N-1段,各段共N个端点作为被选取点。具体实施时,本步骤选取N个点的过程也可以是其他方式,例如,按照时间顺序,将每个语音信号的关键音段的第二三共振峰曲线等分成N'-1N'>N段,各段的端点总共N'个,从其中选取N个作为最终选取的点。步骤S32,针对所述N个点中的每个点,分别计算所述若干语音信号中所有包含前鼻音音节的语音信号在该点的第二共振峰值的平均值和第三共振峰值的平均值,以及分别计算所述若干语音信号中所有包含后鼻音音节的语音信号在该点的第二共振峰值的平均值和第三共振峰值的平均值。首先,按照包含的是前鼻音音节还是后鼻音音节对步骤S11获取的若干语音信号进行区分,假设分为前鼻音组由全部包含前鼻音音节的语音信号组成和后鼻音组由全部包含后鼻音音节的语音信号组成。其次,针对所述N个点中的每个点,确定前鼻音组中各个语音信号的第二共振峰值和第三共振峰值,计算这些第二共振峰值的平均值,以及这些第三共振峰值的平均值,这两个平均值分别是当前点处前鼻音组的第二共振峰值的平均值和第三共振峰值的平均值。假设当前点记为ii=1,2,3…N,前鼻音组在当前点的第二共振峰值的平均值记为F2ai,则前鼻音组全部N个点的第二共振峰值的平均值为F2a1,F2a2,F2a3,…F2aN,前鼻音组在当前点的第三共振峰值的平均值记为F3ai,则前鼻音组全部N个点的第三共振峰值的平均值为F3a1,F3a2,F3a3,…F3aN。类似的,针对所述N个点中的每个点,确定后鼻音组中各个语音信号的第二共振峰值和第三共振峰值,计算这些第二共振峰值的平均值,以及这些第三共振峰值的平均值,这两个平均值分别是当前点处后鼻音组的第二共振峰值的平均值和第三共振峰值的平均值。当前点记为ii=1,2,3…N,后鼻音组在当前点的第二共振峰值的平均值记为F2bi,则后鼻音组全部N个点的第二共振峰值的平均值为F2b1,F2b2,F2b3,…F2bN,后鼻音组在当前点的第三共振峰值的平均值记为F3bi,则后鼻音组全部N个点的第三共振峰值的平均值为F3b1,F3b2,F3b3,…F3bN。步骤S33,针对N个点中的每个点,以所有包含前鼻音音节的语音信号在该点的第二共振峰值的平均值作为第一初始值,以所有包含后鼻音音节的语音信号在该点的第二共振峰值的平均值作为第一结束值,将第一初始值至第一结束值的数值包含第一初始值和第一结束值进行M-1等分;将N个点对应的第k个k=1,2,3…M-2等分点的数值相连接,将N个点的第一初始值相连接,将N个点的第一结束值相连接,共合成M条第二共振峰曲线,这合成的M条第二共振峰曲线即组成了第二共振峰连续统。图4所示为第二共振峰连续统的示意图。在得到图4的例子中,前鼻音音节为an,后鼻音音节为关键音段包括元音段及过渡段,在关键音段上选取10个点,前鼻音组全部10个点的第二共振峰值的平均值为F2a1,F2a2,F2a3,…F2a10,后鼻音组全部10个点的第二共振峰值的平均值为F2b1,F2b2,F2b3,…F2b10。对于当前点i,F2ai为该点的第一初始值,F2bi为该点的第一结束值,将F2ai至F2bi的数值包含边界进行9等分,总共8个等分点,将全部10个点对应的第1个等分点、第2个等分点…第8个等分点的数值相连接,分别得到F2-LINE2~F2-LINE9各条曲线,将全部10个点的第一初始值相连接得到曲线F2-LINE1,将全部10个点的第一结束值相连接得到曲线F2-LINE10。步骤S34,针对N个点中的每个点,以所有包含前鼻音音节的语音信号在该点的第三共振峰值的平均值作为第二初始值,以所有包含后鼻音音节的语音信号在该点的第三共振峰值的平均值作为第二结束值,将第二初始值至第二结束值的数值包含第二初始值和第二结束值进行M-1等分;将N个点对应的第k个k=1,2,3…M-2等分点的数值相连接,将N个点的第二初始值相连接,将N个点的第二结束值相连接,共合成M条第三共振峰曲线,这合成的M条第三共振峰曲线即组成了第三共振峰连续统。图5所示为第三共振峰连续统的示意图。在得到图5的例子中,前鼻音音节为an,后鼻音音节为关键音段包括元音段及过渡段,在关键音段上选取10个点,前鼻音组全部10个点的第三共振峰值的平均值为F3a1,F3a2,F3a3,…F3a10,后鼻音组全部10个点的第二共振峰值的平均值为F3b1,F3b2,F3b3,…F3b10。对于当前点i,F3ai为该点的第一初始值,F3bi为该点的第一结束值,将F3ai至F3bi的数值包含边界进行9等分,总共8个等分点,将全部10个点对应的第1个等分点、第2个等分点…第8个等分点的数值相连接,分别得到F3-LINE2~F3-LINE9各条曲线,将全部10个点的第一初始值相连接得到曲线F3-LINE1,将全部10个点的第一结束值相连接得到曲线F3-LINE10。步骤S14,利用第二共振峰连续统、第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统。要合成具有连续变化趋势的关键音段即关键音段连续统,首先要合成其中的每个关键音段。由于关键音段可表征为多种共振峰曲线的组合,因此要合成关键音段,不仅需要第二共振峰曲线、第三共振峰曲线,还需要其他几种共振峰曲线例如第一共振峰曲线。需要说明的是,为了研究第二共振峰和第三共振峰对分辨前后鼻音的影响,在合成关键音段时,应保证所采用的其他共振峰曲线是固定不变的,即只改变第二共振峰和第三共振峰。具体实施时,本步骤可采用图6所示的过程实现:步骤S61,将第二共振峰连续统中的第二共振峰曲线与第三共振峰连续统中的第三共振峰曲线两两组合,得到多个互不相同的曲线组合。承前所述,将第二共振峰连续统中M条第二共振峰曲线与第三共振峰连续统中M条第三共振峰曲线两两组合,可得到M*M个互不相同的曲线组合。步骤S62,将每个曲线组合与第二共振峰和第三共振峰以外的其他共振峰合成关键音段;将合成的关键音段组成所述关键音段连续统。承前所述,M*M个互不相同的曲线组合恰好合成M*M个互不相同的关键音段,这M*M个互不相同的关键音段即组成了关键音段连续统。具体实施时,关键音段连续统可采用矩阵表示,其中的行和列分别表示第二共振峰曲线、第三共振峰曲线,每个元素代表一个合成的关键音段。例如将图4所示第二共振峰连续统中的第二共振峰曲线与图5所示的第三共振峰连续统中的第三共振峰曲线两两组合,再与统一的其他共振峰曲线合成关键音段,得到如图7所示的关键音段连续统,其中坐标为F2-LINE5,F3-LINE5的点对应的关键音段如图8所示,为图4中的F2-LINE5、图5中的F3-LINE5以及合成所用的第一共振峰曲线。步骤S15,将关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音。前面步骤合成了关键音段,为了合成可用于计算机辅助语音测试和学习所用的鼻音,本步骤还需要将这些合成的关键音段与关键音段以外的其他音段进行拼接,得到完整的合成语音。具体实施时,该过程可借助于已有的语音学软件如Praat实现,具体过程为:首先设定辅音声母C和鼻音尾P;其次,如果关键音段仅包含过渡段则还需设定元音段V,将过渡段对应的各个合成的关键音段作为变量输入;如果关键音段包含元音段V和过渡段则将元音段V和过渡段对应的各个合成的关键音段作为变量输入;最后,得到各个变量对应的合成语音。该过程根据关键音段包含的元音段和或过渡段来调整输入的变量。由于这些合成语音是呈现前鼻音韵母至后鼻音韵母的连续变化趋势,因此可将步骤S15得到的全部合成语音形成的集合作为前后鼻音韵母连续统。前后鼻音韵母连续统中的每个合成语音都可以看作是前鼻音韵母到后鼻音韵母或后鼻音韵母到前鼻音韵母渐变的任意一个“中间态”。如图9所示,以前鼻音音节an和后鼻音音节为例合成前后鼻音韵母连续统,设定辅音声母C为“f”,鼻音尾为“n”和“ng”,关键音段包含元音段和过渡段,采用由如图4所示的第二共振峰连续统与图5所示的第三共振峰连续统合成的关键音段连续统图7所示的10*10矩阵作为变量输入,分别得到从阴平音节“fan”渐变到“fang”的各个合成语音,和从阴平音节“fang”渐变到“fan”的各个合成语音,这些合成语音共同组成了对应元音段和过渡段的fan-fang组前后鼻音韵母连续统。在研究本发明的过程中发现,由于关键音段的能量比起其他音段的能量更大一些,因此通过以上语音拼接过程得到的合成语音的整体听感不够自然,为了避免对后续应用造成不良影响,可选地,本发明可在得到合成语音之后,对每个合成语音中的关键音段的能量进行适当调整,使其更接近原始语料的能量曲线,听感也趋近于自然音节。如图10所示,a为通过语音拼接过程得到的合成语音“fan”的能量和波形图示,其中关键音段的能量相较于其他音段来说明显更大,b为对a中合成语音“fan”的关键音段进行适当调整后的能量和波形图示,更接近原始语料的能量曲线。示例性方法二本发明还提供一种前后鼻音韵母的感知范畴测量方法,如图11所示,该方法包括:步骤S111,根据示例性方法一中的前后鼻音韵母的参数合成方法得到前后鼻音韵母连续统,利用前后鼻音韵母连续统中的各个合成语音,对若干被试进行前后鼻音感知测试;步骤S112,基于前后鼻音感知测试的结果,利用logistic回归模型确定回归系数;步骤S113,利用回归系数确定若干被试的前后鼻音感知范畴。以下分别对该方法中的各个步骤进行详细介绍。步骤S111,利用前后鼻音韵母连续统中的各个合成语音,对若干被试进行前后鼻音感知测试。测试过程为让被试听辨前后鼻音韵母连续统中的各个合成语音,记录听辨结果是前鼻音音节还是后鼻音音节。例如,采用图9得到的对应元音段和过渡段的fan-fang组前后鼻音韵母连续统,选择多名普通话水平二级甲等以上、听力正常的汉语母语者作为中国被试。如图12所示为中国被试对特定曲线组合分别由图5中的第三共振峰曲线F3-LINE10和图4中的各条第二共振峰曲线F2-LINE1~F2-LINE10组成所对应的合成语音的听辨结果,其中,横坐标为图4中的各个第二共振峰曲线F2-LINE1~F2-LINE10,纵坐标为听辨结果的比例。图12的听辨结果表明,在第三共振峰曲线F3-LINE10固定的情况下,逐渐移动第二共振峰曲线F2-LINE1~F2-LINE10,感知为“fan”的比例由100%逐渐减小至0.00%,感知为“fang”的比例由0.00%逐渐增大至100%。F2-LINE1~F2-LINE5与F3-LINE10的曲线组合中,绝大多数中国被试听辨结果为“fan”,在F2-LINE8~F2-LINE10与F3-LINE10的曲线组合中,绝大多数中国被试听辨结果为“fang”,在F2-LINE5~F2-LINE8与F3-LINE10的曲线组合中,中国被试的听辨结果特征不明显。步骤S112,基于前后鼻音感知测试的结果,利用logistic回归模型确定回归系数。具体的,利用前后鼻音感知测试的结果绘制感知曲线,该感知曲线的第一坐标轴记录所述前后鼻音韵母连续统中各个合成语音的编号,第二坐标轴记录被试的前后鼻音感知比例。图12所示的曲线即为一条感知曲线其中合成语音的编号采用其对应的第二共振峰曲线的编号表示,实际得到的感知曲线还有很多条类似的曲线。该步骤所采用的logistic回归模型为:其中,x为所述感知曲线上的点在第一坐标轴上的坐标值,L为所述感知曲线上的点在第二坐标轴上的坐标值,PI为前后鼻音的识别率,b1为回归曲线的斜率,b0为回归曲线的截距,所述的回归系数包括PI、b1、b0。利用所述感知曲线上的点即可计算出回归系数PI、b1、b0。步骤S113,利用所述回归系数确定所述若干被试的前后鼻音感知范畴。具体的,当识别率PI为0.5时,相应的x值为范畴边界,这里用xcb表示,范畴边界xcb可通过以下公式得到:范畴边界的宽度被定义为PI分别为0.25和0.75时两点间的线性距离。范畴边界越窄,范畴化倾向更明显。利用图9得到的对应元音段和过渡段的fan-fang组前后鼻音韵母连续统,中国被试的前后鼻音感知范畴如图13所示,其中,横坐标为第三共振峰曲线F3-LINE1~F3-LINE10,纵坐标为第二共振峰曲线F2-LINE1~F2-LINE10。交点为范畴边界PI为0.5,交点相连而成的曲线表示中国被试对相应的合成语音的听辨结果为前后鼻音音节各占50%;范畴下边界前鼻音的PI为0.75以下的区域,75%以上的中国被试听辨为前鼻音音节“fan”;范畴上边界前鼻音的PI为0.25以上区域,75%以上的中国被试听辨为后鼻音音节“fang”,范畴上、下边界之间区域对应的合成语音处于中国被试的感知混淆区间。若利用对应过渡段关键音段仅包括过渡段的fan-fang组前后鼻音韵母连续统,中国被试的前后鼻音感知范畴如图14所示。实施例一被试为22名普通话水平二级甲等以上、听力正常的中国研究生。实验一采用的前后鼻音韵母连续统中前后鼻音音节为an和关键音段包括元音段和过渡段,包括由“fan”渐变到“fang”的各个合成语音;实验二采用的前后鼻音韵母连续统与实验一采用的前后鼻音韵母连续统的区别仅在于关键音段只包括过渡段。实验一和实验二的被试情况和实验过程相同。实验过程为:每个合成语音重复三次,以尽量减少被试误判的可能性及其影响。所有合成语音通过E-prime2.0软件随机呈现,界面有中文指导语。被试逐个在隔音效果良好的语音实验室内使用AKG监听式耳机进行听辨。每两个合成语音之间呈现一张无声图片,以弱化上一个合成语音对其后刺激的前摄影响。全部合成语音随机分为四组,每组之间有休息时间,以减小疲劳效应。整个实验时长约30分钟。实验一得到的前后鼻音感知范畴如图13所示,实验二得到的前后鼻音感知范畴如图14所示。实验一实际是利用合成的元音段和过渡段的连续统进行听辨测试,实验二实际是利用合成的过渡段的连续统进行听辨测试。两因素方差分析结果表明,无论是实验一还是实验二,第二共振峰F2的主效应都非常显著p.001,即中国被试听辨利用不同第二共振峰F2得到的合成语音时,其结果存在显著差异。而第三共振峰F3的主效应则都不显著p过渡段=.98;p元音段+过渡段=1.0,表明第三共振峰F3的变化对中国被试辨别前后鼻音的结果没有重要的影响。发明人利用本发明提供的方法进行了大量的实验研究,这些实验结果表明基于过渡段和元音段的第二共振峰、第三共振峰合成的前后鼻音韵母连续统能够测量出母语者的鼻音感知范畴,元音段及过渡段对汉语母语者判断前后鼻音音节都起了非常重要的作用,其中有统计上显著影响的最关键声学线索是第二共振峰F2,母语者对改变第二共振峰F2和第三共振峰F3合成的前后鼻音韵母连续统具有范畴感知能力。示例性装置一本发明还提供一种前后鼻音韵母的参数合成装置,包括:关键音段确定模块、共振峰提取模块、共振峰连续统合成模块、关键音段连续统合成模块、语音合成模块。关键音段确定模块,用于确定一对前后鼻音音节,获取包含所述前后鼻音音节的若干语音信号,并确定所述每个语音信号的关键音段;共振峰提取模块,用于提取所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线;共振峰连续统合成模块,用于通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统;所述第二共振峰连续统包括多条合成的第二共振峰曲线,所述第三共振峰连续统包括多条合成的第三共振峰曲线;关键音段连续统合成模块,用于利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统;所述关键音段连续统包括多个合成的关键音段;语音合成模块,用于将所述关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音。可选地,共振峰连续统合成模块进一步包括:点选取模块、共振峰平均值计算模块、第二共振峰连续统合成模块、第三共振峰连续统合成模块。点选取模块,用于按照时间顺序在所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线上各选取N个点,并确定每个点的第二共振峰值和第三共振峰值;其中N为自然数;共振峰平均值计算模块,用于针对所述N个点中的每个点,分别计算所述若干语音信号中所有包含前鼻音音节的语音信号在该点的第二共振峰值的平均值和第三共振峰值的平均值,以及分别计算所述若干语音信号中所有包含后鼻音音节的语音信号在该点的第二共振峰值的平均值和第三共振峰值的平均值;第二共振峰连续统合成模块,用于针对所述N个点中的每个点,以所述所有包含前鼻音音节的语音信号在该点的第二共振峰值的平均值作为第一初始值,以所述所有包含后鼻音音节的语音信号在该点的第二共振峰值的平均值作为第一结束值,将所述第一初始值至所述第一结束值的数值进行M-1等分;将所述N个点对应的第k个等分点的数值相连接,将所述N个点的第一初始值相连接,将所述N个点的第一结束值相连接,共合成M条第二共振峰曲线,将合成的所述M条第二共振峰曲线组成所述第二共振峰连续统;其中,M为自然数,k=1,2,3…M-2;第三共振峰连续统合成模块,用于针对所述N个点中的每个点,以所述所有包含前鼻音音节的语音信号在该点的第三共振峰值的平均值作为第二初始值,以所述所有包含后鼻音音节的语音信号在该点的第三共振峰值的平均值作为第二结束值,将所述第二初始值至所述第二结束值的数值进行M-1等分;将所述N个点对应的第k个等分点的数值相连接,将所述N个点的第二初始值相连接,将所述N个点的第二结束值相连接,共合成M条第三共振峰曲线,将合成的所述M条第三共振峰曲线组成所述第三共振峰连续统。可选地,点选取模块,进一步包括:等分模块、端点确定模块。等分模块,用于将所述每个语音信号的关键音段的第二共振峰曲线等分成N-1段,选取等分得到的各段的N个端点;端点确定模块,用于将所述每个语音信号的关键音段的第三共振峰曲线等分成N-1段,选取等分得到的各段的N个端点。可选地,关键音段连续统合成模块,进一步包括:曲线组合模块、关键音段合成模块、关键音段集成模块。曲线组合模块,用于将所述第二共振峰连续统中的第二共振峰曲线与所述第三共振峰连续统中的第三共振峰曲线两两组合成互不相同的曲线组合;关键音段合成模块,用于将每个所述曲线组合与第二共振峰和第三共振峰以外的其他共振峰合成关键音段;关键音段集成模块,用于将所述合成的关键音段组成所述关键音段连续统。可选地,前后鼻音韵母的参数合成装置,还包括:能量调整模块,用于调整所述合成语音中关键音段的能量。可选地,关键音段为元音段和过渡段。这种情况下,语音合成模块具体用于:将所述关键音段连续统中每个合成的关键音段与辅音声母和鼻音尾拼接得到合成语音。可选地,所述关键音段为过渡段。这种情况下,语音合成模块具体用于:将所述关键音段连续统中每个合成的关键音段与辅音声母、元音段和鼻音尾拼接得到合成语音。可选地,该前后鼻音韵母的参数合成装置,还包括:前后鼻音韵母连续统合成模块,用于将得到的全部所述合成语音组成前后鼻音韵母连续统。示例性装置二本发明还提供一种前后鼻音韵母的感知范畴测量装置,包括:示例性装置一中提供的前后鼻音韵母的参数合成装置,以及测试模块、回归模型计算模块、范畴确定模块。测试模块,用于利用所述前后鼻音韵母的参数合成装置合成的前后鼻音韵母连续统中的各个合成语音,对若干被试进行前后鼻音感知测试;回归模型计算模块,用于基于所述前后鼻音感知测试的结果,利用logistic回归模型确定回归系数;范畴确定模块,用于利用所述回归系数确定所述若干被试的前后鼻音感知范畴。可选地,回归模型计算模块,进一步包括:感知曲线绘制模块、坐标选取模块、回归系数计算模块。感知曲线绘制模块,用于利用所述前后鼻音感知测试的结果绘制感知曲线,该感知曲线的第一坐标轴记录所述前后鼻音韵母连续统中各个合成语音的编号,第二坐标轴记录被试的前后鼻音感知比例;坐标选取模块,用于在所述感知曲线上选取多个点,并确定所述选取的点的坐标值;回归系数计算模块,用于将所述选取的点的坐标值代入如下的logistic回归模型中,计算回归系数:其中,x为所述感知曲线上的点在第一坐标轴上的坐标值,L为所述感知曲线上的点在第二坐标轴上的坐标值,PI为回归曲线的识别率,b1为回归曲线的斜率,b0为回归曲线的截距,所述的回归系数包括PI、b1、b0。可选地,范畴确定模块,进一步包括:范畴边界确定模块、范畴上边界确定模块、范畴下边界确定模块。范畴边界确定模块,用于将所述回归曲线的识别率PI为0.5时的x值确定为范畴边界;范畴上边界确定模块,用于将所述回归曲线的识别率PI为0.25时的x值确定为范畴上边界;范畴下边界确定模块,用于将所述回归曲线的识别率PI为0.75时的x值确定为范畴下边界。以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和或将一个步骤分解为多个步骤执行。尽管在上文详细描述中提及了前后鼻音韵母的参数合成装置和前后鼻音韵母的感知范畴测量装置的若干模块,但是这种划分仅仅并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块illustrativelogicalblock,单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性interchangeability,上述的各种说明性部件illustrativecomponents,单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。本发明实施例中所描述的各种说明性的逻辑块,或单元,或装置都可以通过通用处理器,数字信号处理器,专用集成电路ASIC,现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线DSL或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片disk和磁盘disc包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

权利要求:1.一种前后鼻音韵母的参数合成方法,其特征在于,包括:确定一对前后鼻音音节,获取包含所述前后鼻音音节的若干语音信号,并确定每个语音信号的关键音段;提取所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线;通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统;所述第二共振峰连续统包括多条合成的第二共振峰曲线,所述第三共振峰连续统包括多条合成的第三共振峰曲线;利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统;所述关键音段连续统包括多个合成的关键音段;将所述关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音;其中,所述的通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统,包括:按照时间顺序在所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线上各选取N个点,并确定每个点的第二共振峰值和第三共振峰值;其中N为自然数;针对第二共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第二共振峰的平均值;针对第三共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第三共振峰的平均值,其中,i=1,2,3…N;针对第二共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一结束值,将所述第一初始值至所述第一结束值的数值进行M-1等分;将第二共振峰曲线上N个点对应的第k个等分点的数值相连接,将第二共振峰曲线上N个点的第一初始值相连接,将第二共振峰曲线上N个点的第一结束值相连接,共合成M条第二共振峰曲线,将合成的所述M条第二共振峰曲线组成所述第二共振峰连续统;其中,M为自然数,k=1,2,3…M-2;针对第三共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二结束值,将所述第二初始值至所述第二结束值的数值进行M-1等分;将第三共振峰曲线上N个点对应的第k个等分点的数值相连接,将第三共振峰曲线上N个点的第二初始值相连接,将第三共振峰曲线上N个点的第二结束值相连接,共合成M条第三共振峰曲线,将合成的所述M条第三共振峰曲线组成所述第三共振峰连续统;其中,所述的利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统,包括:将所述第二共振峰连续统中的第二共振峰曲线与所述第三共振峰连续统中的第三共振峰曲线两两组合成互不相同的曲线组合;将每个所述曲线组合与第二共振峰和第三共振峰以外的其他共振峰合成关键音段;将所述合成的关键音段组成所述关键音段连续统。2.根据权利要求1所述的前后鼻音韵母的参数合成方法,其特征在于,所述的按照时间顺序在所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线上各选取N个点,包括:将所述每个语音信号的关键音段的第二共振峰曲线等分成N-1段,选取等分得到的各段的N个端点;将所述每个语音信号的关键音段的第三共振峰曲线等分成N-1段,选取等分得到的各段的N个端点。3.根据权利要求1所述的前后鼻音韵母的参数合成方法,其特征在于,还包括:调整所述合成语音中关键音段的能量。4.根据权利要求1~3任一所述的前后鼻音韵母的参数合成方法,其特征在于,所述关键音段为元音段和过渡段。5.根据权利要求4所述的前后鼻音韵母的参数合成方法,其特征在于,所述的将所述关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音,包括:将所述关键音段连续统中每个合成的关键音段与辅音声母和鼻音尾拼接得到合成语音。6.根据权利要求1~3任一所述的前后鼻音韵母的参数合成方法,其特征在于,所述关键音段为过渡段。7.根据权利要求6所述的前后鼻音韵母的参数合成方法,其特征在于,所述的将所述关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音,包括:将所述关键音段连续统中每个合成的关键音段与辅音声母、元音段和鼻音尾拼接得到合成语音。8.根据权利要求1所述的前后鼻音韵母的参数合成方法,其特征在于,还包括:将得到的全部所述合成语音组成前后鼻音韵母连续统。9.一种前后鼻音韵母的感知范畴测量方法,其特征在于,包括:根据权利要求8所述的前后鼻音韵母的参数合成方法得到前后鼻音韵母连续统;利用所述前后鼻音韵母连续统中的各个合成语音,对若干被试进行前后鼻音感知测试;基于所述前后鼻音感知测试的结果,利用logistic回归模型确定回归系数;利用所述回归系数确定所述若干被试的前后鼻音感知范畴;其中,所述的基于所述前后鼻音感知测试的结果,利用logistic回归模型确定回归系数,包括:利用所述前后鼻音感知测试的结果绘制感知曲线,该感知曲线的第一坐标轴记录所述前后鼻音韵母连续统中各个合成语音的编号,第二坐标轴记录被试的前后鼻音感知比例;在所述感知曲线上选取多个点,并确定所述选取的点的坐标值;将所述选取的点的坐标值代入如下的logistic回归模型中,计算回归系数:其中,x为所述感知曲线上的点在第一坐标轴上的坐标值,L为所述感知曲线上的点在第二坐标轴上的坐标值,PI为回归曲线的识别率,b1为回归曲线的斜率,b0为回归曲线的截距,所述的回归系数包括PI、b1、b0。10.根据权利要求9所述的前后鼻音韵母的感知范畴测量方法,其特征在于,所述的利用所述回归系数确定所述若干被试的前后鼻音感知范畴,包括:将所述回归曲线的识别率PI为0.5时的x值确定为范畴边界;将所述回归曲线的识别率PI为0.25时的x值确定为范畴上边界;将所述回归曲线的识别率PI为0.75时的x值确定为范畴下边界。11.一种前后鼻音韵母的参数合成装置,其特征在于,包括:关键音段确定模块,用于确定一对前后鼻音音节,获取包含所述前后鼻音音节的若干语音信号,并确定每个语音信号的关键音段;共振峰提取模块,用于提取所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线;共振峰连续统合成模块,用于通过处理所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线,合成第二共振峰连续统和第三共振峰连续统;所述第二共振峰连续统包括多条合成的第二共振峰曲线,所述第三共振峰连续统包括多条合成的第三共振峰曲线;关键音段连续统合成模块,用于利用所述第二共振峰连续统、所述第三共振峰连续统,以及第二共振峰和第三共振峰以外的其他共振峰,合成关键音段连续统;所述关键音段连续统包括多个合成的关键音段;语音合成模块,用于将所述关键音段连续统中每个合成的关键音段与关键音段以外的其他音段拼接得到合成语音;所述共振峰连续统合成模块进一步包括:点选取模块,用于按照时间顺序在所述每个语音信号的关键音段的第二共振峰曲线和第三共振峰曲线上各选取N个点,并确定每个点的第二共振峰值和第三共振峰值;其中N为自然数;共振峰平均值计算模块,用于针对第二共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第二共振峰的平均值;针对第三共振峰曲线上N个点中的第i个点,计算所述若干语音信号中所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值,以及计算所述若干语音信号中所有包含后鼻音音节的语音信号在第i个点的第三共振峰的平均值,其中,i=1,2,3…N;第二共振峰连续统合成模块,用于针对第二共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第二共振峰值的平均值作为第一结束值,将所述第一初始值至所述第一结束值的数值进行M-1等分;将第二共振峰曲线上N个点对应的第k个等分点的数值相连接,将第二共振峰曲线上N个点的第一初始值相连接,将第二共振峰曲线上N个点的第一结束值相连接,共合成M条第二共振峰曲线,将合成的所述M条第二共振峰曲线组成所述第二共振峰连续统;其中,M为自然数,k=1,2,3…M-2;第三共振峰连续统合成模块,用于针对第三共振峰曲线上N个点中的第i个点,以所述所有包含前鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二初始值,以所述所有包含后鼻音音节的语音信号在第i个点的第三共振峰值的平均值作为第二结束值,将所述第二初始值至所述第二结束值的数值进行M-1等分;将第三共振峰曲线上N个点对应的第k个等分点的数值相连接,将第三共振峰曲线上N个点的第二初始值相连接,将第三共振峰曲线上N个点的第二结束值相连接,共合成M条第三共振峰曲线,将合成的所述M条第三共振峰曲线组成所述第三共振峰连续统;所述关键音段连续统合成模块,进一步包括:曲线组合模块,用于将所述第二共振峰连续统中的第二共振峰曲线与所述第三共振峰连续统中的第三共振峰曲线两两组合成互不相同的曲线组合;关键音段合成模块,用于将每个所述曲线组合与第二共振峰和第三共振峰以外的其他共振峰合成关键音段;关键音段集成模块,用于将所述合成的关键音段组成所述关键音段连续统。12.根据权利要求11所述的前后鼻音韵母的参数合成装置,其特征在于,所述点选取模块,进一步包括:等分模块,用于将所述每个语音信号的关键音段的第二共振峰曲线等分成N-1段,选取等分得到的各段的N个端点;端点确定模块,用于将所述每个语音信号的关键音段的第三共振峰曲线等分成N-1段,选取等分得到的各段的N个端点。13.根据权利要求11所述的前后鼻音韵母的参数合成装置,其特征在于,还包括:能量调整模块,用于调整所述合成语音中关键音段的能量。14.根据权利要求11~13任一所述的前后鼻音韵母的参数合成装置,其特征在于,所述关键音段为元音段和过渡段。15.根据权利要求14所述的前后鼻音韵母的参数合成装置,其特征在于,所述语音合成模块具体用于:将所述关键音段连续统中每个合成的关键音段与辅音声母和鼻音尾拼接得到合成语音。16.根据权利要求11~13任一所述的前后鼻音韵母的参数合成装置,其特征在于,所述关键音段为过渡段。17.根据权利要求16所述的前后鼻音韵母的参数合成装置,其特征在于,所述语音合成模块具体用于:将所述关键音段连续统中每个合成的关键音段与辅音声母、元音段和鼻音尾拼接得到合成语音。18.根据权利要求11所述的前后鼻音韵母的参数合成装置,其特征在于,还包括:前后鼻音韵母连续统合成模块,用于将得到的全部所述合成语音组成前后鼻音韵母连续统。19.一种前后鼻音韵母的感知范畴测量装置,其特征在于,包括:权利要求18所述的前后鼻音韵母的参数合成装置;测试模块,用于利用所述前后鼻音韵母的参数合成装置合成的前后鼻音韵母连续统中的各个合成语音,对若干被试进行前后鼻音感知测试;回归模型计算模块,用于基于所述前后鼻音感知测试的结果,利用logistic回归模型确定回归系数;范畴确定模块,用于利用所述回归系数确定所述若干被试的前后鼻音感知范畴;所述回归模型计算模块,进一步包括:感知曲线绘制模块,用于利用所述前后鼻音感知测试的结果绘制感知曲线,该感知曲线的第一坐标轴记录所述前后鼻音韵母连续统中各个合成语音的编号,第二坐标轴记录被试的前后鼻音感知比例;坐标选取模块,用于在所述感知曲线上选取多个点,并确定所述选取的点的坐标值;回归系数计算模块,用于将所述选取的点的坐标值代入如下的logistic回归模型中,计算回归系数:其中,x为所述感知曲线上的点在第一坐标轴上的坐标值,L为所述感知曲线上的点在第二坐标轴上的坐标值,PI为回归曲线的识别率,b1为回归曲线的斜率,b0为回归曲线的截距,所述的回归系数包括PI、b1、b0。20.根据权利要求19所述的前后鼻音韵母的感知范畴测量装置,其特征在于,所述范畴确定模块,进一步包括:范畴边界确定模块,用于将所述回归曲线的识别率PI为0.5时的x值确定为范畴边界;范畴上边界确定模块,用于将所述回归曲线的识别率PI为0.25时的x值确定为范畴上边界;范畴下边界确定模块,用于将所述回归曲线的识别率PI为0.75时的x值确定为范畴下边界。

百度查询: 北京语言大学 前后鼻音韵母的参数合成方法及感知范畴测量方法、装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术