Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京探境科技有限公司陈运兵获国家专利权

恭喜北京探境科技有限公司陈运兵获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京探境科技有限公司申请的专利两级语音对齐方法、电子设备,及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114882904B

龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210274508.5,技术领域涉及:G10L25/27;该发明授权两级语音对齐方法、电子设备,及存储介质是由陈运兵;张新科;崔潇潇设计研发完成,并于2022-03-18向国家知识产权局提交的专利申请。

两级语音对齐方法、电子设备,及存储介质在说明书摘要公布了:本发明实施例涉及一种两级语音对齐方法、电子设备,及存储介质,包括:获取语音数据,以及字级抄本;将二者输入字级对齐模型,获取初始字级对齐结果;遍历每一帧字级帧数据,对属于同一字的相邻帧进行合并,获取第一合并帧数据,记录其起始时间和结束时间;将第一类占位符与与第一类占位符紧邻的字对应的字级帧数据合并,获取第二合并帧数据;更新其起始时间和结束时间,获取字级对齐抄本;获取第一频谱特征序列和信息向量;将二者和字级对齐抄本输入音素级对齐模型,获取初始音素级对齐结果;遍历每一帧音素级帧数据,将第二类占位符与音素单元对应的音素级帧数据合并,获取音素级对齐抄本。以上,不会在抄本开始位置或结束位置出现错误。

本发明授权两级语音对齐方法、电子设备,及存储介质在权利要求书中公布了:1.一种两级语音对齐方法,其特征在于,所述方法包括:获取语音数据,以及与所述语音数据对应的字级抄本;将所述语音数据和与所述语音数据对应的字级抄本输入到预构建的字级对齐模型中,获取与所述语音数据对应的初始字级对齐结果,其中,所述初始字级对齐结果包括多帧字级帧数据,且每一帧所述字级帧数据对应所述字级抄本中的一个字,或者对应一个第一类占位符,所述字级抄本中的一个字对应至少一帧所述字级帧数据;遍历每一帧所述字级帧数据,对属于同一字的相邻帧进行合并,获取第一合并帧数据,并记录所述第一合并帧数据的起始时间和结束时间;按照第一预设规则,将所述第一类占位符与与所述第一类占位符紧邻的字对应的字级帧数据合并,获取第二合并帧数据;更新所述第二合并帧数据的起始时间和结束时间,最终获取与所述语音数据对应的字级对齐抄本;获取所述语音数据对应的第一频谱特征序列,和与所述语音数据对应的信息向量;将所述字级对齐抄本、所述第一频谱特征序列和所述信息向量,输入到预构建的音素级对齐模型中,获取与所述语音数据对应的初始音素级对齐结果,所述初始音素级对齐结果包括多帧音素级帧数据,每一帧所述音素级帧数据对应一个音素单元,或者对应一个第二类占位符;遍历每一帧所述音素级帧数据,将所述初始音素级对齐结果中与所述音素单元对应的所述音素级帧数据相邻的至少一个第二类占位符,与所述音素单元对应的所述音素级帧数据合并,获取第三合并帧数据;记录所述第三合并帧数据的起始时间和结束时间,作为所述音素单元对应的起始时间和结束时间,最终获取与所述语音数据对应的音素级对齐抄本。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京探境科技有限公司,其通讯地址为:100094 北京市朝阳区望京宏泰西街博泰大厦5层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。