申请/专利权人:厦门大学
申请日:2021-07-14
公开(公告)日:2024-04-02
公开(公告)号:CN113515960B
主分类号:G06F40/58
分类号:G06F40/58;G06F40/211;G06F40/30;G06N3/0464;G06N3/042;G06N3/045;G06N3/084;G06N3/048
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2021.11.05#实质审查的生效;2021.10.19#公开
摘要:一种融合句法信息的翻译质量自动评估方法,涉及翻译技术领域。包括以下步骤:获取输入文本的双语文本表示向;将双语输入的文本分别构建句法依赖树,形成句法图;利用图神经网络编码相关节点关系特征后拼接,上层接一个简单的sigmoid层输出质量分数;模型的输出和数据标签的均方根误差误差作为损失,通过反向传播算法更新质量预测模型参数。利用图神经网络巧妙地解决了在翻译质量自动评估中缺乏句法信息的引入问题,在翻译质量自动评估领域,尚未看到此类方法。在预训练模型的基础上,加入图神经网络编码句法信息,使得模型能够同时表达语义和句法信息,比单独使用预训练模型能够在皮尔逊相关系数上普遍提升约19%的效果。
主权项:1.一种融合句法信息的翻译质量自动评估方法,其特征在于包括以下步骤:1获取输入文本的双语文本表示向;2将双语输入的文本分别构建句法依赖树,形成句法图;所述将双语输入的文本分别构建句法依赖树,形成句法图的具体方法为:利用自建的句法依赖算法或者开源工具包,抽取双语输入的句法依赖关系;句子成分间的依赖关系使用有向图来表示;依赖关系图包含节点和节点之间的关系种类,用三元组表示,如:节点A,关系r,节点B;如此便将整个句子的句法依赖关系编码成三元组列表,[三元组1,三元组2,三元组3,…,三元组n];然后使用邻接矩阵将三元组列表转换为矩阵形式;邻接矩阵是个V*V的二维数组,其中V是图中的节点数量;设adj[][]是邻接矩阵,那么: 其中,vi,vj表示节点i到节点j的边;若vi,vj不存在,则adj[i][j]赋值为0;若vi,vj存在或者i=j,则adj[i][j]赋值为1;3利用图神经网络编码相关节点关系特征后拼接,上层接一个简单的sigmoid层输出质量分数;所述利用图神经网络编码相关节点关系特征是使用图神经网络将深度学习应用到图结构中,句法图的节点关系通过图神经网络进行编码,将双语输入分别编码成隐含向量Hs和Ht;所述图神经网络包括GNN、图卷积神经网络GCN、GAT;4模型的输出和数据标签的均方根误差作为损失,通过反向传播算法更新质量预测模型参数。
全文数据:
权利要求:
百度查询: 厦门大学 一种融合句法信息的翻译质量自动评估方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。