【发明公布】基于句子主干的稀缺资源神经机器翻译的数据增强方法_营口理工学院_202311678099.6

导航：龙图腾网> 最新专利技术> 基于句子主干的稀缺资源神经机器翻译的数据增强方法_营口理工学院_202311678099.6

申请/专利权人：营口理工学院

申请日：2023-12-07

公开（公告）日：2024-03-08

公开（公告）号：CN117669604A

主分类号：G06F40/58

分类号：G06F40/58;G06N3/04

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.03.26#实质审查的生效;2024.03.08#公开

摘要：本发明公开了基于句子主干的稀缺资源神经机器翻译的数据增强方法，涉及神经机器翻译技术领域；该数据增强方法包括以下步骤：构造原始双语数据集；构建反向翻译模型，采用原始双语数据集训练反向翻译模型；采用句子主干提取算法将目标语言句子生成为目标语言句子主干；基于反向翻译模型翻译目标语言句子主干得到源语言句子主干；将源语言句子主干和目标语言句子主干组合构造伪双语数据集；将原始双语数据集和伪双语数据集合并，作为神经机器翻译模型的训练集。本发明通过目标语端句子主干和反向翻译模型生成伪平行数据，从而扩充训练数据，通过该方法，可以更加充分地利用现有数据，增加训练样本的多样性，提升模型的翻译质量。

主权项：1.基于句子主干的稀缺资源神经机器翻译的数据增强方法，其特征在于，包括以下步骤：S1、构造原始双语数据集D＝{S,T}，原始双语数据集D包括源语言句子S和目标语言句子T；S2、构建反向翻译模型，采用原始双语数据集D训练反向翻译模型；S3、采用句子主干提取算法将目标语言句子T生成为目标语言句子主干T′；S4、基于反向翻译模型翻译目标语言句子主干T′得到源语言句子主干S′；S5、将源语言句子主干S′和目标语言句子主干T′组合构造伪双语数据集D′＝{S′,T′}；S6、将原始双语数据集D和伪双语数据集D′合并，作为神经机器翻译模型的训练集。

全文数据：

权利要求：

百度查询：营口理工学院基于句子主干的稀缺资源神经机器翻译的数据增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种矮轴gasket结构的机械键盘_渴创技术(深圳)有限公司_202322395230.X

下一篇：一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

相关技术

一种矮轴gasket结构的机械键盘_渴创技术(深圳)有限公司_202322395230.X

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

一种接触器触头机构_杭州玛实迪电器科技有限公司_202322179096.X

一种环形导轨间歇循环通电装置_东莞市臻域自动化设备有限公司_202322566793.0

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

龙图腾网&IPTOP

【发明公布】基于句子主干的稀缺资源神经机器翻译的数据增强方法_营口理工学院_202311678099.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务