买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种语音增强方法、语音识别方法、聚类方法及装置_乐融致新电子科技(天津)有限公司_201510303746.4 

申请/专利权人:乐融致新电子科技(天津)有限公司

申请日:2015-06-03

公开(公告)日:2019-12-03

公开(公告)号:CN105989849B

主分类号:G10L21/0264(20130101)

分类号:G10L21/0264(20130101);G10L15/06(20130101)

优先权:

专利状态码:有效-授权

法律状态:2019.12.03#授权;2016.11.09#实质审查的生效;2016.10.05#公开

摘要:本发明公开一种语音增强方法、语音识别方法、聚类方法及装置。方法包括:选取与测试语音的第一帧语音部分的特征向量最匹配的特征向量聚类中心;针对测试语音包含的其他各帧语音部分的特征向量执行:从与该语音部分的前一帧语音部分的特征向量最匹配的特征向量聚类中心,以及与前一帧语音部分的特征向量最匹配的特征向量聚类中心相邻的特征向量聚类中心中,选取与该语音部分的特征向量最匹配的特征向量聚类中心;根据测试语音包含的各帧语音部分的特征向量、选取的特征向量聚类中心重建测试语音的特征向量。本发明由于在进行语音增强利用了能够表示语音连续性的特征,因此相比于现有技术中的传统的语音增强模型而言,能够达到更好的语音增强效果。

主权项:1.一种语音增强方法,其特征在于,包括:从训练得到的特征向量聚类中心中,选取与测试语音包含的第一帧语音部分的特征向量最匹配的特征向量聚类中心;针对所述测试语音包含的其他各帧语音部分的特征向量执行:从训练得到的、与该语音部分的前一帧语音部分的特征向量最匹配的特征向量聚类中心,以及与所述前一帧语音部分的特征向量最匹配的特征向量聚类中心相邻的特征向量聚类中心中,选取与该语音部分的特征向量最匹配的特征向量聚类中心;其中,训练得到的每个特征向量聚类中心与至少一个与其相邻的特征向量聚类中心构成的集合具有描述语音连续性的能力;根据所述测试语音包含的各帧语音部分的特征向量,以及选取的特征向量聚类中心,重建所述测试语音的特征向量。

全文数据:

权利要求:

百度查询: 乐融致新电子科技(天津)有限公司 一种语音增强方法、语音识别方法、聚类方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。