买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】在风噪声中检测有意义的声学信号_汇顶科技(香港)有限公司_201810585860.4 

申请/专利权人:汇顶科技(香港)有限公司

申请日:2018-06-08

公开(公告)日:2023-08-25

公开(公告)号:CN109036449B

主分类号:G10L21/0208

分类号:G10L21/0208;G10L21/0232

优先权:["20170609 US 15/619,189"]

专利状态码:有效-授权

法律状态:2023.08.25#授权;2020.04.17#实质审查的生效;2018.12.18#公开

摘要:一种区分有意义的信号与低频噪声的方法,所述方法包括:第一步骤,将输入声学信号划分成帧,第二步骤,针对每一帧计算所述输入声学信号的功率谱密度,且找出所述功率谱密度的包络曲线,第三步骤,找出所述包络曲线中的预定义数目个主峰,所述包络曲线是在所述方法的前面第二步骤中找出,第四步骤,将线性回归算法应用于所述主峰以获得每一帧的线性回归线,且求出每一线性回归线的斜率值,第五步骤,将所述声学信号中包括所述有意义的信号的区间识别为对应于所述斜率值中较高值的区间。

主权项:1.一种区分有意义的信号与低频噪声的方法,其特征在于,所述方法包括:第一步骤,将输入声学信号300划分成帧,第二步骤,针对每一帧计算所述输入声学信号300的功率谱密度,且找出所述功率谱密度的包络曲线,第三步骤,找出所述包络曲线中的预定义数目个主峰,所述包络曲线是在所述方法的前面第二步骤中找出,第四步骤,将线性回归算法应用于所述主峰以获得每一帧的线性回归线,且求出每一线性回归线的斜率值400,第五步骤,将所述声学信号300中包括所述有意义的信号的区间识别为对应于所述斜率值400中较高值的区间。

全文数据:在风噪声中检测有意义的声学信号技术领域[0001]本发明涉及一种区分有意义的信号例如话音与风噪声的方法。背景技术[0002]智能装置、可佩戴装置、运动相机和“IoT”(物联网)装置的数量激增,那些装置上的麦克风易于受到风噪声的不利影响。为抑制风噪声,研发出了若干种方法。这些方法面临的主要问题是风噪声减少同时抑制了有意义的信号。在所述情境中,此些方法需要程序有效地区分信号与风噪声,且在尽可能地抑制风噪声的同时保留更多有意义的信号。现有方法的结果是在尤其针对较大风强度减少风之后且在使用单个麦克风的情况下提供不佳的话音质量。[0003]具体地说,先前方案研究出风噪声主要在低频域中具有功率,且在用于风噪声减少的算法内,所述先前方案逐帧地估计此风噪声功率谱,并利用一些额外处理从混合信号话音+风噪声的功率谱中减去此经估计功率谱。[0004]对于存在话音和风噪声两者的信号段,从混合信号中减去经估计风噪声还导致话音被抑制,这是不合乎需要的。在那个意义上,算法需要对此存在话音和风噪声两者的处理应用松弛,以在抑制风噪声的同时保留重要信号。为进行所述操作,算法需要检测具有话音或重要信号的帧且需要对所述帧应用松弛,如上文所描述。[0005]为检测那些段,先前工件尝试了一些特征,例如自相关、互相关等等,但那些特征并未显示出极佳的性能,尤其是在较大风强度和单个麦克风使用范例中。[0006]因此,仍需要提供一种方法,所述方法通过在风噪声中应用新的信号检测而克服上述问题,由此改进风噪声减少的性能。发明内容[0007]可通过根据独立权利要求项的主题来满足此需求。通过附属权利要求项描述本发明的有利实施例。[0008]根据本发明,一种区分有意义的信号与低频噪声的方法包括:[0009]第一步骤,将输入声学信号划分成帧,[0010]第二步骤,针对每一帧计算所述输入声学信号的功率谱密度,且找出所述功率谱密度的包络曲线,[0011]第三步骤,找出所述包络曲线中的预定义数目个主要峰值,所述包络曲线是在所述方法的前面第二步骤中找出,[0012]第四步骤,将线性回归算法应用于所述主要峰值以获得每一帧的线性回归线,且求出每一线性回归线的斜率值,[0013]第五步骤,将所述原始声学信号中包括所述有意义的信号的区间识别为对应于所述斜率值中较高值的区间。[00M]具体地说,根据本发明的可能实施例,所述低频噪声为风噪声,且所述有意义的信号为人类话音。[0015]任选地,在所述第四步骤中,斜率值可跨帧自适应地被平滑,使得斜率值不会波动太多。[0016]“自适应地被平滑”意指基于计算出的低频能量对可能的风噪声帧进行较高平滑且对其它帧进行较低平滑,因为大部分波动发生在所述风噪声帧中且这些波动可能造成话音质量降级。[0017]在所述第一步骤中,将所述输入声学信号划分成5ms到100ms的中贞。[0018]另外任选地,所述方法可包括第六步骤,将抑制算法自适应地应用于在所述第五步骤中识别的所述区间,以抑制低频噪声并保留所述有意义的信号。有利的是,根据本发明,所述抑制算法可仅应用于所述输入声学信号中不包括所述有意义的信号的区间。对具有有意义的信号的帧进行较低信号抑制或不进行信号抑制帮助保留更多有意义的信号,例如话首。[0019]根据本发明的示例性实施例,在所述第五步骤中,针对所述多个斜率值定义一个低斜率阈值和一个高斜率阈值。因此,可将所述原始声学信号中包括所述有意义的信号的区间识别为斜率值超过所述高斜率阈值的那些区间。[0020]根据本发明的可能示例性实施例,在所述方法的所述第五步骤中,将S型函数应用于斜率值和斜率阈值。因此,可自动地将所述原始声学信号中包括所述有意义的信号的区间识别为s型函数的值为‘〇’的区间。[0021]根据本发明的第二方面,一种电子装置包括计算机可读存储媒体,所述计算机可读存储媒体中具有计算机程序指令以用于使计算机处理器能够执行根据本文中所公开的任何方法。所述电子装置可以是包括麦克风的任何电子装置。[0022]根据本发明的示例性实施例,所述电子装置为智能电话,或可佩戴装置,或可听式装置,或运动相机,或任何所谓的“I〇T”(物联网装置。[0023]上文所定义的方面和本发明的其它方面从下文中描述的实施例的例子中显而易见,且参考实施例的例子来解释。本发明将在下文中参考实施例的例子更详细地进行描述,但本发明不限于所述例子。附图说明[0024]图1示出仅风信号和包括风与话音的信号两者的功率谱,[0025]图2示出根据本发明的方法针对包括风和话音的信号计算的斜率特征,[0026]图3示出应用于具有阈值的所计算出的斜率特征的S型函数sigmoidfunction。具体实施方式[0027]图1为示出第一风信号100和包括风与话音的第二信号200的功率谱的曲线图10。在曲线图10中,笛卡尔Cartesian纵坐标轴11和坐标轴12分别表示频率和功率。[0028]典型的风噪声100在初始频率f0与第一阈值频率fl之间具有大于有效预定义功率阈值ro的功率。对于大于fl的频率,风噪声100可被忽略,尤其是相对于包括风和话音的第二信号200来说可被忽略。在频率f0至fl的区间中,风信号100在曲线图10中可由具有负斜率的第一直线101充分表示。L〇〇29」包括风和诂首的苐二佶号200在初始频率fO与大于第一阈值频率fl的第二阈值频率f2之间具有大于有效预定义阈值具体地说,与ro—致的功率阈值的功率。具体地说,频率f0至f2的区间在中频域和高频域中延伸。在频率f〇至f2的区间中,包括风和话音的第二信号200在曲线图10中可由具有负斜率的第二直线201充分表示。第二直线201的斜率通常大于第一直线101的斜率,即,第一直线101具有比第二直线201更陡的斜率。[0030]根据本发明的方法,可如下计算第一直线101的倾斜和第二直线2〇1的倾斜。[0031]在方法的第一步骤中,将声学输入信号划分成帧,例如10ms帧。在检测信号时,可以预先寄存声学信号或可以联机进行分析。具体地说,声学信号可被缓冲以划分成帧,例如10ms巾贞,以供处理。[0032]在方法的第二步骤中,计算每一帧的功率谱密度,并找出功率谱密度的最大包络曲线。[0033]在方法的第三步骤中,找出包络线中的预定义数目个主要峰值,使得包络线的深谷中的(例如风噪声与话音部分之间的较小峰值不会影响方法的后续第四步骤。[0034]在方法的第四步骤中,将线性回归算法应用于在先前第三步骤中获得的主要峰值以获得每一帧的线性回归线,且求出线性回归线的斜率值。所述斜率可对应于较陡线性回归线如图1的第一直线101的斜率,或对应于较不陡线性回归线如图i的第二直线201的斜率。任选地,斜率值可跨帧自适应地被平滑,使得斜率值在无论如何不影响方法的下一步骤的执行的情况下不会波动太多。[0035]在方法的第五最终步骤中,将原始声学信号中对应于仅话音或对应于风噪声与话音的区间识别为对应于在方法的前一步骤中所计算出的斜率值中较高值的区间。[0036]图2中示出上述方法的应用的例子。[0037]在图2中,声学输入信号300包括存在风噪声的第一噪声区间301。声学输入信号300的功率谱在图2中呈现为随时间变化。第一噪声区间301包括第一噪声子区间302和随后的第二噪声子区间3〇3,所述第一噪声子区间302中除风噪声外还存在门噪声,所述第二噪声子区间303中除风噪声外还存在话音。声学信号300包括其中仅存在话音的第二噪声区间304,所述第二噪声区间304与第一噪声区间301间隔开。[0038]本发明可更一般地应用于包括风或其它类似干扰低频噪声和有意义的信号的任何类型的声学输入信号。[0039]通过应用如上文所描述的本发明方法的第一步骤、第二步骤、第三步骤和第四步骤,在声学输入信号300下方计算且呈现出多个斜率值400,声学输入信号300所划分成的每一帧具有一个斜率值。通过应用本发明方法的第五步骤,识别出时间值tl、t2、t3和t4,所述时间值对应于斜率值400的序列中的相应阶跃。在时间区间tl至t2和t3至t4之间的斜率值400高于时域的其余部分中的斜率值。根据本发明,将这些时间区间识别为原始声学输入信号300中对应于仅话音或对应于风噪声与话音的时间区间,即对应于第二噪声子区间303和第二噪声区间302的时间区间。[0040]可如图3中所示出地实施应用本发明方法的第五步骤的自动程序。如图3中所描绘,针对多个斜率值400定义一个低斜率阈值S1和一个高斜率阈值S2。随后将S型函数500应用于具有斜率阈值S1、S2的斜率值400,以产生多个斜率值400的两个标志0至1,所述标志对应于S型函数的相应值。标志‘1’是指风噪声,即斜率值低于低斜率阈值S1,标志‘〇’是指存在话音或有意义的信号,即斜率值超过高斜率阈值S2。[0041]在识别出存在话音的时间区间后,所述时间区间例如图2和3的例子的时间区间tl至t2和t3至t4,通过分析斜率值400和或分析斜率标志,风噪声抑制算法可自适应地应用于这些区间,以在抑制风噪声的同时保留更多话音信号,并改进有风环境中的话音用户接口性能。在方法的此步骤期间可使用任何抑制算法。[0042]本发明可集成在包括麦克风的电子装置中,例如集成在智能电话、可佩戴装置、可听式装置、运动相机中,以及集成在具有麦克风的任何所谓的“I〇T”(物联网装置中。在这些电子装置中,可提供具有计算机程序指令的计算机可读存储媒体,所述计算机程序指令用于使电子装置中的计算机处理器能够执行根据本发明的方法。[0043]元件符号:[0044]10曲线图[0045]11、12纵坐标轴、坐标轴,[0046]100第一风信号,[0047]200第二风和话音信号,[0048]101近似风信号的直线,[0049]201近似风和话音信号的直线,[0050]P〇功率阈值,[0051]f〇,fi,f2频率[0052]300声学输入信号,[0053]301第一噪声区间,[0054]302第一噪声子区间,[0055]303第二噪声子区间,[0056]304第二噪声区间,[0057]400斜率值,[0058]tl、t2、t3、t4时间值[0059]500S型函数[0060]S1、S2斜率阈值

权利要求:1.一种区分有意义的信号与低频噪声的方法,其特征在于,所述方法包括:第一步骤,将输入声学信号300划分成帧,第二步骤,针对每一帧计算所述输入声学信号300的功率谱密度,且找出所述功率谱密度的包络曲线,第三步骤,找出所述包络曲线中的预定义数目个主要峰值,所述包络曲线是在所述方法的前面第二步骤中找出,第四步骤,将线性回归算法应用于所述主要峰值以获得每一帧的线性回归线,且求出每一线性回归线的斜率值400,第五步骤,将所述原始声学信号300中包括所述有意义的信号的区间(^至1:243至t4识别为对应于所述斜率值400中较高值的区间。2.根据权利要求1所述的方法,其特征在于,在所述第四步骤中,斜率值跨帧自适应地被平滑。3.根据权利要求1所述的方法,其特征在于,在所述第五步骤中,针对所述多个斜率值400定义一个低斜率阈值S1和或一个高斜率阈值S2。4.根据权利要求3所述的方法,其特征在于,在所述第五步骤中,将S型函数500应用于所述斜率值400和所述斜率阈值SI、S2。5.根据权利要求1所述的方法,其特征在于,在所述第一步骤中,将所述输入声学信号300划分成5ms到100ms的帧。6.根据权利要求1所述的方法,其特征在于,所述方法进一步包括第六步骤,其将抑制算法自适应地应用于在所述第五步骤中识别的所述区间,以抑制低频噪声并保留所述有意义的信号。7.—种电子装置,其特征在于,所述电子装置包括计算机可读存储媒体,所述计算机可读存储媒体中具有计算机程序指令以使计算机处理器能够执行根据权利要求1所述的方法。8.根据权利要求7所述的电子装置,其特征在于,所述电子装置包括麦克风。

百度查询: 汇顶科技(香港)有限公司 在风噪声中检测有意义的声学信号

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。