买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种机器翻译模型训练方法和装置_深圳须弥云图空间科技有限公司_202310872256.0 

申请/专利权人:深圳须弥云图空间科技有限公司

申请日:2023-07-17

公开(公告)日:2024-04-16

公开(公告)号:CN116595999B

主分类号:G06F40/58

分类号:G06F40/58;G06F40/42;G06F40/211;G06F18/214

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2023.09.01#实质审查的生效;2023.08.15#公开

摘要:本申请涉及机器翻译技术领域,提供了一种机器翻译模型训练方法和装置。该方法包括:获取包括多个平行语料的训练集;其中平行语料包括具有对应关系的源语言语句序列和目标语言语句序列;将配置特定标记的多个源语言语句序列输入至机器翻译模型,以便获得对应的目标语言翻译结果;依据第一损失函数迭代更新机器翻译模型的参数,直至达到预设的迭代终止条件,以便获得经训练的机器翻译模型;其中第一损失函数由基于跨语言语句向量差的平行程度的正则项进行确定。本申请在传统损失函数基础上加入语句向量间平行关系并进行正则化处理,提高了模型泛化能力,使模型更好地适用于新语料或复杂语料。

主权项:1.一种机器翻译模型训练方法,其特征在于,包括:获取包括多个平行语料的训练集,其中所述平行语料包括具有对应关系的源语言语句序列和目标语言语句序列;将配置特定标记的多个所述源语言语句序列输入至机器翻译模型,以便获得对应的目标语言翻译结果;依据第一损失函数迭代更新所述机器翻译模型的参数,直至达到预设的迭代终止条件,以便获得经训练的所述机器翻译模型,其中所述第一损失函数由基于跨语言语句向量差的平行程度的正则项进行确定;所述机器翻译模型包括编码器和解码器;和或,将配置特定标记的多个所述源语言语句序列输入至机器翻译模型,以便获得对应的目标语言翻译结果的过程,包括:将配置特定标记的多个所述源语言语句序列输入至所述编码器,分别获得多个对应于所述源语言语句序列的源语言潜向量以及多个对应于所述特定标记的第一标记向量;将多个所述源语言潜向量和多个所述第一标记向量输入至所述解码器,分别获得多个对应的目标语言潜向量以及多个对应于所述目标语言潜向量的第二标记向量;由基于跨语言语句向量差的平行程度的正则项确定所述第一损失函数的过程,包括:依次获得与多个对应于所述平行语料的所述第一标记向量与所述第二标记向量的向量差;确定多个所述向量差的平行程度的正则项;依据所述平行程度的正则项,修正所述机器翻译模型的监督损失函数,以便获得所述第一损失函数:;其中为修正因子;确定多个所述向量差的平行程度的正则项,包括:当有个所述向量差时,至少选择其中1个所述向量差作为参照向量差,与其余所述向量差,共同确定所述平行程度的正则项;所述平行程度的正则项包括所述参照向量差与其余所述向量差之间的夹角余弦值或者所述参照向量差与其余所述向量差之间的内积。

全文数据:

权利要求:

百度查询: 深圳须弥云图空间科技有限公司 一种机器翻译模型训练方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。