买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于图神经网络的汉越跨语言观点对象识别分析方法_昆明理工大学_202210532418.1 

申请/专利权人:昆明理工大学

申请日:2022-05-12

公开(公告)日:2024-04-23

公开(公告)号:CN114742071B

主分类号:G06F40/30

分类号:G06F40/30;G06F40/284;G06F18/22;G06F18/241;G06N3/042;G06N3/0464;G06N3/045;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.23#授权;2022.08.09#实质审查的生效;2022.07.12#公开

摘要:本发明涉及基于图神经网络的汉越跨语言观点对象识别分析方法,属于自然语言处理领域。本发明包括:构建汉越观点对象数据集;利用异构图对中文和越南语评论之间的信息进行关联关系构建,之后利用图卷积神经网络编码观点对象特征;最后基于中文的观点对象标签作为输入训练分类器,最终完成在越南语数据集上的观点对象识别任务。本发明具体研究跨语言事件评论的关联异构图网络构建方法,研究跨语言评论的观点对象表征方法,研究双语评论关联异构图网络的传递和学习方法,实现跨语言观点对象识别与对齐,为把握越南民众对公共事件等对象的观点看法提供支撑。

主权项:1.基于图神经网络的汉越跨语言观点对象识别分析方法,其特征在于:所述方法的具体步骤如下:Step1、收集某事件中文微博评论和越南语推特评论,通过人工对噪声数据进行筛选和标注得到中越跨语言评论数据集;Step2、利用异构图结构对中文和越南语评论句中的关联信息进行编码,利用图卷积编码器对评论和观点对象进行编码,将得到的观点对象特征向量用于训练模型,用训练好的模型进行观点对象识别;所述步骤Step2的具体步骤如下:Step2.1、通过异构图对评论的语义信息和拓扑信息进行表征学习,异构图表示为G=V1、E、τ、γ,其中τ:V1→N表示节点类型的映射函数,γ:V1→Z表示关系类型的映射函数;其中利用词频关系、词共现关系和语义相似度构建评论节点和词节点之间的边;基于关键词在语料库中出现的次数构建单词与评论句之间的边并将计算的TF-IDF值作为边的权重;Step2.2、基于词共现关系构建节点之间的边,为了更好的利用全局词的共现信息,在单语上对语料库中所有的句子使用一个固定大小的滑动窗口来收集词的共现信息,使用点互信息PMI来计算两个词节点之间的权重;其中#Wi表示指滑动窗口中包含单词i的数量,#Wi,j是指滑动窗口中同时包含单词i和j的数量,#W是指语料库中所有滑动窗口的数量;当PMI值为正时表示两个词之间的语义相关性较高;一个词对i,jPMI值的计算公式为: Step2.3、基于语义相似度找到跨语言词对i,j之间的关联性;利用xlmr模型获取到汉越语料库中单词的嵌入向量A,B,同时利用余弦相似度判断两个嵌入向量之间的相似性,当余弦值越接近1表示两个夹角越接近0度,也就是两个向量越相似;设置超参数k作为阈值,当余弦值大于k则认为词对中的两个单词高度相关,在这样词对之间添加边: Step2.4、利用跨语言语义相关的词搭建两个评论句之间的关联性;判断汉越两条评论句是否相关时,采用匹配算法判断句对i,j连接的词节点是否存在边,当存在相关联的词对时认为这两个评论句具有相关性,通过对相关词的权重进行加权平均数计算出跨语言评论句C,V得到相似度,在这样的句对之间添加边; 所构异构图间的节点之间边的权重定义为: Step2.5、在根据双语对齐关系构建了异构图后,将图嵌入到一个简单的二层GCN中;GCN是一种多层神经网络,它直接在图上运行,并根据节点的领域属性引入节点的嵌入向量;GCN只能通过一层卷积来捕获关于近邻的信息;当多个GCN层被堆叠时,图上更多的信息就会被整合起来;两层GCN允许信息在最多两步长的节点之间传递信息,对于一层GCN,新的k维节点特征矩阵L1∈Rn1×k1为: 其中表示标准化对称邻接矩阵,表示的度矩阵,W0∈Rm×k1表示权重矩阵;ρ是激活函数,使用的是RELU;通过叠加多个GCN层来学习合并更高阶的领域信息,学习更深层的节点特征,表示为: 其中j表示层数,而L0表示原始邻接矩阵;Step2.6、在图神经网络的第二层将评论嵌入维度映射成与类别标签相同的维度大小,然后送入到分类器中: 其中而z=∑iexpxi;Step2.7、最终模型的目标函数使用交叉熵损失进行计算 其中yD是具有标签的评论索引集,F表示输出特征的维度,与类别数量相同,Y是标签矩阵。

全文数据:

权利要求:

百度查询: 昆明理工大学 基于图神经网络的汉越跨语言观点对象识别分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。