买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】翻译模型的训练方法、文本翻译方法、装置、设备及介质_北京小米移动软件有限公司;北京小米松果电子有限公司_202211163580.7 

申请/专利权人:北京小米移动软件有限公司;北京小米松果电子有限公司

申请日:2022-09-23

公开(公告)日:2024-04-02

公开(公告)号:CN117808014A

主分类号:G06F40/58

分类号:G06F40/58;G06F40/284;G06F16/33;G06N20/00

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.19#实质审查的生效;2024.04.02#公开

摘要:本公开是关于一种翻译模型的训练方法、文本翻译方法、装置、设备及介质。该训练方法包括:基于第一类型的训练数据,训练第一翻译模型,得到第二翻译模型,第一类型的训练数据包括属于源语言的第一样本文本,第一翻译模型为未经过训练的初始翻译模型或者基于第二类型的训练数据训练得到的翻译模型;基于第二类型的训练数据,训练第二翻译模型,得到目标翻译模型,第二类型的训练数据包括属于源语言的第二样本文本;其中,第一类型为噪声类型,第二类型为无噪声类型,或者,第一类型为无噪声类型,第二类型为噪声类型。该方法使训练后的翻译模型针对包含噪声信息的文本以及不包含噪声信息的文本均能够具有较好的翻译效果,提高了翻译模型的鲁棒性。

主权项:1.一种翻译模型的训练方法,其特征在于,所述训练方法包括:基于第一类型的训练数据,训练第一翻译模型,得到第二翻译模型;其中,所述第一类型的训练数据包括属于源语言的第一样本文本,所述第一翻译模型为未经过训练的初始翻译模型或者基于第二类型的训练数据训练得到的翻译模型;基于所述第二类型的训练数据,训练所述第二翻译模型,得到目标翻译模型;其中,所述第二类型的训练数据包括属于所述源语言的第二样本文本;其中,所述第一类型为噪声类型,所述第二类型为无噪声类型,或者,所述第一类型为所述无噪声类型,所述第二类型为所述噪声类型;所述噪声类型是指所述噪声类型的训练数据中属于所述源语言的样本文本包含噪声信息,所述无噪声类型是指所述无噪声类型的训练数据中属于所述源语言的样本文本不包含噪声信息。

全文数据:

权利要求:

百度查询: 北京小米移动软件有限公司;北京小米松果电子有限公司 翻译模型的训练方法、文本翻译方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。