阿里巴巴集团控股有限公司高志付获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴集团控股有限公司申请的专利语音交互及语音识别方法、装置、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114446280B 。
龙图腾网通过国家知识产权局官网在2025-06-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011112060.4,技术领域涉及:G10L15/02;该发明授权语音交互及语音识别方法、装置、设备和存储介质是由高志付;张仕良设计研发完成,并于2020-10-16向国家知识产权局提交的专利申请。
本语音交互及语音识别方法、装置、设备和存储介质在说明书摘要公布了:本发明实施例提供一种语音交互及语音识别方法、装置、设备和存储介质,该方法包括:通过流式语音识别模型中的第一编码网络对当前产生的语音信号分块的声学特征进行编码,以依次得到多个语音信号分块各自对应的第一语义向量;通过流式语音识别模型中的第一解码网络对当前产生的语音信号分块所对应的第一语义向量进行解码,以依次输出多个语音信号分块对应的第一文字。将多个语音信号分块各自对应的声学特征和第一语义向量的拼接结果输入离线语音识别模型,以通过离线语音识别模型输出与多个语音信号分块对应的第二文字,以该第二文字更新流式语音识别模型输出的与述多个语音信号分块对应的第一文字,以保证流式语音识别的实时性和识别准确率。
本发明授权语音交互及语音识别方法、装置、设备和存储介质在权利要求书中公布了:1.一种语音识别方法,其特征在于,流式语音识别模型包括第一编码网络、预测网络、注意力网络和第一解码网络,所述方法包括:通过所述第一编码网络对当前产生的语音信号分块的声学特征进行编码,以依次得到多个语音信号分块各自对应的第一语义向量,所述多个语音信号分块对应于一段连续语音,每个语音信号分块具有预设时长;通过所述预测网络对当前产生的第一语音信号分块对应的第一语义向量进行预测,以获得所述第一语音信号分块中包含的文字数量,所述文字数量用于约束通过所述注意力网络确定所述第一语音信号分块对应的第一语义向量的权重的计算次数;根据所述第一语音信号分块对应的第一语义向量的权重,通过所述第一解码网络输出与所述第一语音信号分块对应的文字,以得到所述第一解码网络依次输出的所述多个语音信号分块对应的第一文字;将所述多个语音信号分块各自对应的声学特征和第一语义向量的拼接结果输入离线语音识别模型,以通过所述离线语音识别模型输出与所述多个语音信号分块对应的第二文字;根据所述第二文字更新所述流式语音识别模型输出的与所述多个语音信号分块对应的第一文字。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴集团控股有限公司,其通讯地址为:英属开曼群岛大开曼资本大厦一座四层847号邮箱;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。