买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于回译的翻译模型训练方法及装置_深圳须弥云图空间科技有限公司_202310814082.2 

申请/专利权人:深圳须弥云图空间科技有限公司

申请日:2023-07-05

公开(公告)日:2023-11-10

公开(公告)号:CN116522152B

主分类号:G06F18/214

分类号:G06F18/214;G06F18/21;G06F18/2431;G06F16/35;G06F40/56;G06F40/58;G06N3/0455;G06N3/044;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2023.11.10#授权;2023.08.18#实质审查的生效;2023.08.01#公开

摘要:本申请提供了一种基于回译的翻译模型训练方法及装置。该方法包括:通过正向翻译模型正译得到各条第一语言语料对应的第二语言表征向量组和第二语言语料,并计算各条第一语言语料对应的第一均值向量;通过逆向翻译模型回译得到各条第二语言语料对应的第二语言表征向量组,并计算各条第二语言语料对应的第二均值向量;根据每条第一语言语料对应的第一均值向量和第二均值向量以及与该条第一语言语料语义不同的另一条第一语言语料对应的第二均值向量,利用三元组损失函数计算第一对比损失;根据每条第一语言语料对应的第二语言语料以及标签,利用多分类交叉熵损失函数计算第一分类损失;依据第一对比损失和第一分类损失更新正向翻译模型的模型参数。

主权项:1.一种基于回译的翻译模型训练方法,其特征在于,包括:获取训练数据和待训练的正向翻译模型对应的已经通过训练的逆向翻译模型,所述训练数据包括多条第一语言语料和每条第一语言语料对应的标签,其中,所述正向翻译模型和所述逆向翻译模型分别用于正译和回译,所述正向翻译模型和所述逆向翻译模型提供互逆的操作;将多条第一语言语料输入所述正向翻译模型,正译得到各条第一语言语料对应的第二语言表征向量组和第二语言语料,并计算正译得到的各条第一语言语料对应的第二语言表征向量组中多条向量的第一均值向量;将正译得到的各条第二语言语料输入所述逆向翻译模型,回译得到各条第二语言语料对应的第二语言表征向量组,并计算回译得到的各条第二语言语料对应的第二语言表征向量组中多条向量的第二均值向量;根据每条第一语言语料对应的第一均值向量和第二均值向量以及与该条第一语言语料语义不同的另一条第一语言语料对应的第二均值向量,利用三元组损失函数计算第一对比损失;根据每条第一语言语料对应的第二语言语料以及标签,利用多分类交叉熵损失函数计算第一分类损失;依据所述第一对比损失和所述第一分类损失更新所述正向翻译模型的模型参数,以完成对所述正向翻译模型的训练;其中,每条第一语言语料对应的第一均值向量是通过计算正译得到的该条第一语言语料对应的第二语言表征向量组中多条向量中对应位置的元素的均值得到的,每条第一语言语料对应的第二均值向量是通过计算回译得到的该条第一语言语料对应的第二语言语料对应的第二语言表征向量组中多条向量中对应位置的元素的均值得到的。

全文数据:

权利要求:

百度查询: 深圳须弥云图空间科技有限公司 基于回译的翻译模型训练方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。