买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】结构化文本翻译_易享信息技术有限公司_201980091819.4 

申请/专利权人:易享信息技术有限公司

申请日:2019-12-03

公开(公告)日:2023-03-14

公开(公告)号:CN113424192B

主分类号:G06F40/42

分类号:G06F40/42;G06F40/154;G06F40/117

优先权:["20181211 US 62/778,160","20190131 US 16/264,392"]

专利状态码:有效-授权

法律状态:2023.03.14#授权;2021.10.12#实质审查的生效;2021.09.21#公开

摘要:用于翻译结构化文本的方法包括:嵌入模块,用于编码和嵌入第一语言的源文本;编码器,用于对嵌入模块的输出进行编码;解码器,用于基于由先前迭代生成的译后文本中的标记对编码器的输出进行迭代解码;集束模块,用于使用集束搜索针对要包括在当前迭代的译后文本中的可能的嵌入式标签约束解码器的输出,以及用于选择要包括在当前迭代的译后文本中的标记的层。译后文本是不同于第一语言的第二语言。在一些实施方案中,该方法还包括评分和指针模块,用于基于集束模块的输出、从源文本复制的输出,或来自与源文本最匹配的训练对的参考文本来选择标记。

主权项:1.一种用于翻译结构化文本的系统,所述系统包括:嵌入模块,用于编码和嵌入第一语言的结构化源文本;基于多层注意的编码器,用于对所述嵌入模块的输出进行编码;基于多层注意的解码器,用于迭代地:接收所述基于多层注意的编码器的输出和来自先前迭代的结构化译后文本中的标记,所述结构化译后文本是不同于所述第一语言的第二语言;并且基于所述标记,对所述基于多层注意的编码器的输出进行解码;集束模块,用于根据集束搜索,针对可能要包括在当前迭代的所述结构化译后文本中的嵌入式标签,约束所述基于多层注意的解码器的输出;评分模块,用于确定被选择以便包括在所述当前迭代的所述结构化译后文本中的标记是从所述集束模块的输出生成的,还是从所述结构化源文本或结构化参考文本复制的;和指针模块,其包括softmax层,用于基于所述评分模块的确定结果,选择要包括在所述当前迭代的所述结构化译后文本中的来自所述集束模块的输出或从所述结构化源文本或结构化参考文本复制的所述标记。

全文数据:

权利要求:

百度查询: 易享信息技术有限公司 结构化文本翻译

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。