【发明授权】基于图神经网络的汉越跨语言观点对象识别分析方法_昆明理工大学_202210532418.1

导航：龙图腾网> 最新专利技术> 基于图神经网络的汉越跨语言观点对象识别分析方法_昆明理工大学_202210532418.1

申请/专利权人：昆明理工大学

申请日：2022-05-12

公开（公告）日：2024-04-23

公开（公告）号：CN114742071B

主分类号：G06F40/30

分类号：G06F40/30;G06F40/284;G06F18/22;G06F18/241;G06N3/042;G06N3/0464;G06N3/045;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.23#授权;2022.08.09#实质审查的生效;2022.07.12#公开

摘要：本发明涉及基于图神经网络的汉越跨语言观点对象识别分析方法，属于自然语言处理领域。本发明包括：构建汉越观点对象数据集；利用异构图对中文和越南语评论之间的信息进行关联关系构建，之后利用图卷积神经网络编码观点对象特征；最后基于中文的观点对象标签作为输入训练分类器，最终完成在越南语数据集上的观点对象识别任务。本发明具体研究跨语言事件评论的关联异构图网络构建方法，研究跨语言评论的观点对象表征方法，研究双语评论关联异构图网络的传递和学习方法，实现跨语言观点对象识别与对齐，为把握越南民众对公共事件等对象的观点看法提供支撑。

主权项：1.基于图神经网络的汉越跨语言观点对象识别分析方法，其特征在于：所述方法的具体步骤如下：Step1、收集某事件中文微博评论和越南语推特评论，通过人工对噪声数据进行筛选和标注得到中越跨语言评论数据集；Step2、利用异构图结构对中文和越南语评论句中的关联信息进行编码，利用图卷积编码器对评论和观点对象进行编码，将得到的观点对象特征向量用于训练模型，用训练好的模型进行观点对象识别；所述步骤Step2的具体步骤如下：Step2.1、通过异构图对评论的语义信息和拓扑信息进行表征学习，异构图表示为G＝V1、E、τ、γ，其中τ：V1→N表示节点类型的映射函数，γ：V1→Z表示关系类型的映射函数；其中利用词频关系、词共现关系和语义相似度构建评论节点和词节点之间的边；基于关键词在语料库中出现的次数构建单词与评论句之间的边并将计算的TF-IDF值作为边的权重；Step2.2、基于词共现关系构建节点之间的边，为了更好的利用全局词的共现信息，在单语上对语料库中所有的句子使用一个固定大小的滑动窗口来收集词的共现信息，使用点互信息PMI来计算两个词节点之间的权重；其中#Wi表示指滑动窗口中包含单词i的数量，#Wi,j是指滑动窗口中同时包含单词i和j的数量，#W是指语料库中所有滑动窗口的数量；当PMI值为正时表示两个词之间的语义相关性较高；一个词对i,jPMI值的计算公式为： Step2.3、基于语义相似度找到跨语言词对i,j之间的关联性；利用xlmr模型获取到汉越语料库中单词的嵌入向量A,B，同时利用余弦相似度判断两个嵌入向量之间的相似性，当余弦值越接近1表示两个夹角越接近0度，也就是两个向量越相似；设置超参数k作为阈值，当余弦值大于k则认为词对中的两个单词高度相关，在这样词对之间添加边： Step2.4、利用跨语言语义相关的词搭建两个评论句之间的关联性；判断汉越两条评论句是否相关时，采用匹配算法判断句对i,j连接的词节点是否存在边，当存在相关联的词对时认为这两个评论句具有相关性，通过对相关词的权重进行加权平均数计算出跨语言评论句C,V得到相似度，在这样的句对之间添加边；所构异构图间的节点之间边的权重定义为： Step2.5、在根据双语对齐关系构建了异构图后，将图嵌入到一个简单的二层GCN中；GCN是一种多层神经网络，它直接在图上运行，并根据节点的领域属性引入节点的嵌入向量；GCN只能通过一层卷积来捕获关于近邻的信息；当多个GCN层被堆叠时，图上更多的信息就会被整合起来；两层GCN允许信息在最多两步长的节点之间传递信息，对于一层GCN，新的k维节点特征矩阵L1∈Rn1×k1为：其中表示标准化对称邻接矩阵，表示的度矩阵，W0∈Rm×k1表示权重矩阵；ρ是激活函数，使用的是RELU；通过叠加多个GCN层来学习合并更高阶的领域信息，学习更深层的节点特征，表示为：其中j表示层数，而L0表示原始邻接矩阵；Step2.6、在图神经网络的第二层将评论嵌入维度映射成与类别标签相同的维度大小，然后送入到分类器中：其中而z＝∑iexpxi；Step2.7、最终模型的目标函数使用交叉熵损失进行计算其中yD是具有标签的评论索引集，F表示输出特征的维度，与类别数量相同，Y是标签矩阵。

全文数据：

权利要求：

百度查询：昆明理工大学基于图神经网络的汉越跨语言观点对象识别分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

下一篇：电子设备_深圳市嘉晋实业有限公司_202322601396.2

相关技术

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种纸箱生产用贴标机_浙江华信科技发展有限公司_202322178698.3

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

观点相关技术

一种社交媒体观点演化仿真方法、装置、设备及存储介质_武汉大学_202311844946.1

一种基于大数据的互联网金融产品评论观点提取方法_金智东博(北京)教育科技股份有限公司_202310631264.6

一种面向热点话题的基于自监督表示学习的观点挖掘方法_南京邮电大学_202410226614.5

评论文本观点预测方法、系统及设备和存储介质_中国传媒大学_202410076556.2

一种基于网信领域短文本的观点挖掘方法_国家计算机网络与信息安全管理中心_202110357064.7

融合主题提取与余弦相似度的观点贡献度评价方法及系统_华中师范大学_202410144330.1

事件观点生成方法、设备及计算机可读介质_上海蜜度蜜巢智能科技有限公司_202311730960.9

一种基于大语言模型和主题模型的网民观点分析方法_广东数源智汇科技有限公司_202311719713.9

一种车主观点提取方法、装置、设备及存储介质_东软睿驰汽车技术(沈阳)有限公司_202311659531.7

利用双曲图网络的时序观点挖掘方法_北京理工大学_202311669996.0

跨相关技术

用于跨载波HARQ管理的方法及用户设备_联发科技股份有限公司_202110760310.3

一种跨时钟域处理电路_华为技术有限公司_201880098603.6

架桥机跨铁路架梁施工方法_中铁六局集团石家庄铁路建设有限公司_202111626767.1

晶圆跨厂流片方法及装置_深圳市昇维旭技术有限公司_202410317611.2

一种基于跨时钟域的异步时钟选择电路及其切换方法_中国电子科技集团公司第四十七研究所_202011515673.2

训练样本处理方法、跨模态匹配方法、装置、设备和介质_北京百度网讯科技有限公司_202211668247.1

一种预应力无缝多跨弯桥临时支撑结构_中铁二局集团有限公司_202322632609.8

深井移动轨道式巡检机器人及其跨绳越障方法_中国矿业大学_202110990495.7

基于Hyperledger Fabric的内部桥接跨链方法、装置、设备和介质_普洛斯科技(重庆)有限公司_202111192928.0

基于图神经网络的汉越跨语言观点对象识别分析方法_昆明理工大学_202210532418.1

语言相关技术

基于Rust语言实现SESC驱动的半导体设备通信方法_无锡芯享信息科技有限公司_202410173945.7

一种基于java语言的通用DLT645协议解析方法及设备_成都汉度科技有限公司_202410162410.X

一种基于预训练语言模型的ICD自动编码方法_中南大学_202410165651.X

结构化查询语言SQL系统的监控方法、装置及电子设备_北京奇艺世纪科技有限公司_202110534846.3

基于自然语言对话的表数据处理方法_无锡容智技术有限公司_202310935795.4

基于图神经网络的汉越跨语言观点对象识别分析方法_昆明理工大学_202210532418.1

一种基于自然语言处理的智能育儿系统和装置_云启智慧科技有限公司_202311245094.4

一种自然语言文本和数学语言文本的混合词嵌入方法_华中师范大学_202210469691.4

对话式大语言模型监督训练评价系统_南京大经中医药信息技术有限公司_202410121885.4

用于语言翻译的方法、装置、设备和可读介质_京东城市(北京)数字科技有限公司_202410059666.8

龙图腾网&IPTOP

【发明授权】基于图神经网络的汉越跨语言观点对象识别分析方法_昆明理工大学_202210532418.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务