买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】机器翻译模型构建方法、装置以及设备_中国科学技术大学;科大讯飞股份有限公司_202011605010.X 

申请/专利权人:中国科学技术大学;科大讯飞股份有限公司

申请日:2020-12-30

公开(公告)日:2024-04-12

公开(公告)号:CN112733552B

主分类号:G06F40/56

分类号:G06F40/56

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2023.05.30#专利申请权的转移;2021.05.21#实质审查的生效;2021.04.30#公开

摘要:本发明公开了一种机器翻译模型构建方法、装置以及设备,本发明从机器翻译模型训练维度,对目标翻译模型的构建提出改进,具体是通过对多个不同结构参数的待定翻译模型进行训练,并记录当前最优的各待定翻译模型参数,同时结合各待定翻译模型的自身训练,利用当前最优模型对各待定翻译模型进行同步融合训练,经此训练方式便可以使得不同结构参数的待定翻译模型的知识进行交互,由此构建出的目标翻译模型在显著提高翻译质量的同时,更具有较强的鲁棒性。本发明在多个翻译模型的容量、计算效率和翻译效果之间进行均衡,使多个待定翻译模型能够实现在线混合学习,从而可以兼顾机器翻译模型在实际上线时对于翻译效果以及部署操作的双重需求。

主权项:1.一种机器翻译模型构建方法,其特征在于,包括:预先构建多个待定翻译模型,所述待定翻译模型之间具有不同的结构和或不同的参数;利用预设的语料集分别对各所述待定翻译模型进行独立训练;每训练预设的第一步数后,将各所述待定翻译模型的当前最优模型予以保存;每训练预设的第二步数后,对各所述待定翻译模型进行独立训练的同时,结合所述当前最优模型以及预设的多模型混合训练策略,对各所述待定翻译模型进行同步融合训练,其中,所述第一步数小于或等于所述第二步数;在进行若干轮同步融合训练并直至触发预设的训练结束条件时,得到相应于各所述待定翻译模型的最终模型;将至少一个所述最终模型作为目标翻译模型;所述多模型混合训练策略包括:同步利用若干个当前最优模型与对应的实时训练更新的待定翻译模型进行两两交叉训练;或者,每训练预设的第二步数后,将每种待定翻译模型经训练更新后的当前状态作为对应该待定翻译模型的第一模型;从当前最优模型中选择若干个第二模型,所述第二模型包括:除任一所述第一模型对应的当前最优模型以外的其他当前最优模型;利用所述第二模型的输出指导相应的所述第一模型的训练。

全文数据:

权利要求:

百度查询: 中国科学技术大学;科大讯飞股份有限公司 机器翻译模型构建方法、装置以及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。