【发明公布】一种针对中英神经机器翻译模型的数据投毒样本生成器_东北大学_202410153185.3

导航：龙图腾网> 最新专利技术> 一种针对中英神经机器翻译模型的数据投毒样本生成器_东北大学_202410153185.3

申请/专利权人：东北大学

申请日：2024-02-02

公开（公告）日：2024-05-03

公开（公告）号：CN117973400A

主分类号：G06F40/58

分类号：G06F40/58;G06F16/35;G06F18/214;G06F18/25;G06F40/211;G06F40/284;G06F40/30;G06N3/042;G06N3/045;G06N3/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.21#实质审查的生效;2024.05.03#公开

摘要：本发明提供一种针对中英神经机器翻译模型的数据投毒样本生成器，涉及数据投毒技术领域。本发明包括获取句子序列的依存关系之类的句法信息；将句子序列与处理后输入到BERT模型中获取句子序列的特征向量以及句子序列中每个单词的特征向量；基于依存关系构建图；使用图注意力网络获取上下文语义特征向量；获取单词实体的特征向量；将各个特征向量融合为多特征融合特征向量；多特征融合特征向量送入关系分类器进行关系分类；接入大模型；使用大模型依据得到的关系生成中英双语句对的样本。本发明能够高效高质量的代替人工生成针对中英神经机器翻译模型生成数据投毒样本。

主权项：1.一种针对中英神经机器翻译模型的数据投毒样本生成器，其特征在于：包括词关系分析模块和样本生成模块；所述词关系分析模块基于多特征融合的关系抽取模型提供关系抽取分类的功能；词关系分析模块融合句法信息注意力机制与BERT中间层语义信息提供关系抽取功能；所述样本生成模块，由完成生成式任务的大模型构成，根据词关系分析模块得到的单词之间的关系进行样本的生成。

全文数据：

权利要求：

百度查询：东北大学一种针对中英神经机器翻译模型的数据投毒样本生成器

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种高压气井偏心电缆直读测试装置及其测试方法_中国石油天然气股份有限公司_202211455003.5

下一篇：文本相似性检测方法、装置、计算机设备及存储介质_北京梆梆安全科技有限公司_202211459358.1

相关技术

一种高压气井偏心电缆直读测试装置及其测试方法_中国石油天然气股份有限公司_202211455003.5

文本相似性检测方法、装置、计算机设备及存储介质_北京梆梆安全科技有限公司_202211459358.1

基于变换器的对象检测_脸萌有限公司_202311530645.1

数据识别方法及装置_华为技术有限公司_202211456054.X

干细胞成牙本质向分化方法_中国科学院深圳先进技术研究院_202211452289.1

地面脉冲注水装置及应用装置的脉冲控制系统_中国石油化工股份有限公司_202211455815.X

半导体结构及其形成方法_中芯国际集成电路制造(上海)有限公司_202211457734.3

交互设备的测试方法、装置、设备及可读存储介质_腾讯科技(深圳)有限公司_202211473174.0

一种利用低品位热源的矿井水浓缩淡化产盐的系统及方法_国能神东煤炭集团有限责任公司_202211456879.1

一次进风调节装置_瑞安市阀门一厂_202211443931.X

一种电池制作方法、电池以及车辆_北京车和家汽车科技有限公司_202211456792.4

业务代码的管理方法、装置、服务器及存储介质_哲库科技(上海)有限公司_202211457565.3

龙图腾网&IPTOP

【发明公布】一种针对中英神经机器翻译模型的数据投毒样本生成器_东北大学_202410153185.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务