【发明授权】一种基于多视图多层注意力的面向学术论文的分类方法_北京工业大学_202110866447.7

导航：龙图腾网> 最新专利技术> 一种基于多视图多层注意力的面向学术论文的分类方法_北京工业大学_202110866447.7

申请/专利权人：北京工业大学

申请日：2021-07-29

公开（公告）日：2024-04-16

公开（公告）号：CN113918711B

主分类号：G06F16/35

分类号：G06F16/35;G06N3/042

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2022.01.28#实质审查的生效;2022.01.11#公开

摘要：一种基于多视图多层注意力的面向学术论文的分类方法涉及深度学习领域、图神经网络领域。在当今信息化高速发展的时代，传统的论文匹配方法仅仅使用单一的关系图，导致匹配效果不佳。本发明首先将论文之间的多种关系图输入图卷积神经网络，做到了更准确地捕捉真实论文数据的复杂关系。然后在捕捉到多种关系的基础上，使用多层注意力机制，学习到了每一篇论文的最优表示。最后引入自动编码器模块，缓解了图卷积网络在学习多视图信息时产生的过平滑问题。结果表明，通过将多层注意力与多视图输入结合，并将自动编码器与图神经网络相结合，提高了对学术论文分类的精度，从而实现了数字图书馆中对论文与论文作者的高效匹配。

主权项：1.一种基于多视图多层注意力的面向学术论文的分类方法，其特征在于包括以下步骤：步骤1：设计能够学到更准确的节点表示的多视图输入模块1构建特征矩阵X：从论文数据集中提取出论文名、论文关键词以及论文发表年份和发表期刊作为节点特征；然后，利用节点特征构建节点特征矩阵X，因为数据集中存在4000个节点，则X为4000*4000维由0或1构成的矩阵，矩阵内容先由程序随机输出0或1，然后通过模型训练算法学习最佳节点特征，学习最佳节点特征的方法为通过最小化步骤4中损失函数来实现；xi∈X代表在特征矩阵X中第i个节点的特征向量；2构建节点特征矩阵Ak，具体为：①利用节点特征矩阵X来计算节点i和节点j的相似矩阵Sij；其中，xi和xj是节点i和节点j的特征向量；|xi|与|xj|为这两个向量的模，即仅代表此向量的长度，不包括方向和位置信息；②根据节点之间的相似矩阵Sij来计算节点之间是否存在联系，从而构建出基于节点特征的k近邻图作为特征矩阵Ak，计算方法为在数据集中找出与节点i最相近的k个节点，作为与节点i有联系的节点；3构建节点关系矩阵：多视图的关系矩阵表示为Am；A为由0和1组成的矩阵，代表数据集中每个节点之间的关系，视图中节点i与节点j存在联系，则在此视图的矩阵中，第i行第j列的数值为1；视图中节点i与节点j不存在联系，则在此视图的矩阵中，第i行第j列的数值为0；m为视图的个数，在论文数据集中，节点为论文，节点之间存在的3种关系分别为：两篇论文共同参会，用A1表示；两篇论文使用同一关键词，用A2表示；两篇论文存在共同作者，用A3表示，A1，A2，A3分别为独立的矩阵；4单视图卷积：在卷积模块中，输入分别由特征矩阵X、节点特征矩阵Ak、节点关系矩阵Am组成；第1个输入为节点特征图Gk＝Ak，X，第2个以后的输入为节点关系图Gm＝Am，X，每一个输入都配备一个专属的卷积模块，单视图卷积模块的输出分别为Zk和Zm；在论文数据集中，节点为论文，节点之间存在的3种关系分别用A1，A2，A3表示，则Gm分别为G1，G2，G3，Zm分别为Z1，Z2，Z3；卷积的第l层的输出可以表示为：其中，Wl为GCN第l层的权重矩阵，权重矩阵为独立的矩阵，先由程序随机给出权重矩阵中的数值，然后通过模型训练算法学习最佳的权重值，学习最佳权重值的方法通过最小化步骤4中损失函数来实现，初始的Z即Z0＝X，I为单位矩阵为的对角矩阵，为的对角矩阵，ReLU为本公式使用到的激活函数，ReLU＝max0，x；5多视图卷积：多视图卷积模块的输出为Zc，其中第l层的卷积输出为：其中，Wl为第l层GCN的权重矩阵，权重矩阵为独立的矩阵，先由程序随机给出权重矩阵中的数值，然后通过模型训练算法学习最佳的权重值，学习最佳权重值的方法通过最小化步骤4中损失函数来实现，初始的Z即Z0＝X，A为将Ak与Am拼接之后得到的向量，是的对角矩阵，ReLU为本公式使用到的激活函数，ReLU＝max0，x；步骤2：设计能够减缓过平滑问题的自动编码器模块1使用自动编码器提取节点表示，在自动编码器中第l层学到的表示为其中，为自动编码器中第l层的权重矩阵，为自动编码器中第l层的偏差，权重矩阵和偏差为独立的矩阵，先由程序随机给出数值，然后通过模型训练算法学习最佳的权重值与偏差值，学习最佳权重值与偏差值的方法通过最小化步骤4中损失函数来实现，为特征矩阵X，ReLU为本公式使用到的激活函数，ReLU＝max0，x；2使用自动解码器还原节点表示，在自动解码器中第l层学到的表示为其中，为自动编码器中第l层的权重矩阵，为自动编码器中第l层的偏差，权重矩阵和偏差为独立的矩阵，先由程序随机给出数值，然后通过模型训练算法学习最佳的权重值与偏差值，学习最佳权重值与偏差值的方法通过最小化步骤4中损失函数来实现，为ReLU为本公式使用到的激活函数，ReLU＝max0，x；3将节点表示传入GCN模块，因为自动编码器学习到的表示可以重构数据本身，并且包含不同的有价值的信息；所以将两种表示结合起来，用表示：其中，为特征矩阵X在GCN中第l层的表示，为在自动编码器中第l层学到的表示；通过这种方式，将自动编码器和GCN逐层连接起来；步骤3：设计能够融合多视图信息的多层注意力模块1构建单视图内的注意力层，具体为：①利用自注意力机制来学习各个节点之间的权重；在同一视图中，给定一对节点i，j，可以计算出节点j对于节点i的重要程度系数；并得到同视图内中心节点与邻居节点间的重要性：公式中，αij为节点j对于节点i的重要程度系数；xi，xj，xk分别为节点i，j，k的节点特征；k∈N为与节点i相连的N个邻居节点中，逐一将所有邻居节点的影响相加；||表示连接操作，及将两个特征向量拼接到一起，向量维数会随之增加；aT为神经网络链接层与层之间的权重矩阵的转置矩阵，先由程序随机给出数值，然后通过模型训练算法学习最佳的权重矩阵，学习最佳权重矩阵通过最小化步骤4中损失函数来实现；LeakyReLU为本公式使用到的激活函数，LeakyReLU＝max0.2x，x；②重复以上单视图注意力层K次，将学习到的嵌入连接为特定视图的嵌入；并将学到的节点嵌入与节点特征矩阵进行拼接；公式中，zi为学习到的节点i的嵌入；αij为节点j对于节点i的重要程度系数；xj为节点j的节点特征；为多头注意力当中的机制，即设置K个函数，每个函数都能计算出不同的注意力系数，并计算出一组加权求和用的系数，最后将多个结果连接在一起，得到卷积的结果；Sigmoid为本公式使用到的激活函数，数学形式为2构建多视图之间的注意力层，具体为：①将上一步GCN的输出作为此步输入，即输入为单视图图卷积Zk，Zm和多视图卷积Zc，不同权重为互相独立的数字；对于节点i，在同一视图内，对节点嵌入进行非线性变换，然后使用如下公式来计算注意力权重；公式中，分别为不同视图下的注意力权重；Wk，Wm，Wc为不同视图的相互独立的权重矩阵，先由程序随机给出权重矩阵中的数值，然后通过模型训练算法学习最佳的权重值，学习最佳权重值的方法通过最小化步骤4中损失函数来实现；b是偏差向量；q为注意力向量，用来测量节点嵌入的重要性；为在卷积输出矩阵Zk，Zm和Zc中，第i行向量，代表第i个节点的节点特征；上角标T为对矩阵进行转置运算；②对进行归一化，得到节点i的最终权重；公式中，分别为节点i在不同视图中的最终注意力权重；分别为节点i在不同视图下的注意力权重；③将三种嵌入相结合，得到最终的嵌入；其中越大代表此视图越重要；Z＝αk·Zk+αm·Zm+αc·Zc公式中，Zk，Zm，Zc为卷积层的输出；αk，αm，αc为每种视图中的注意力权重；Z为最终输出的节点嵌入；步骤4：设计损失函数1尽可能使卷积学习到不同的节点表示，即增加Zk，Zm，Zc之间的不同；公式为：HSICZk，Zm＝n-1-2trRKkRKmHSICZk，Zc＝n-1-2trRKkRKcHSICZc，Zm＝n-1-2trRKcRKm公式中，HSIC为希尔伯特施密特独立性准则，主要目的是衡量两个变量之间的差异；Kk，Km，Kc是格拉姆矩阵，此处的格拉姆矩阵是由两个向量经过内积运算所组成的矩阵，体现了两个向量的关系，需经过内积运算的向量分别为n为步骤1中构建节点特征矩阵时节点邻居节点的数量，I是单位矩阵且e是全为1的列向量；最终单视图的损失函数为Ls：Ls＝HSICZk，Zm+HSICZk，Zc+HSICZc，Zm2因为模型希望两个相似性矩阵尽可能相似，多视图损失函数为Lm：Lm＝||Sk-Sm||2+||Sk-Sc||2+||Sc-Sm||2公式中，S为节点之间的相似度，计算方法为：其中Znor为卷积输出Z经过L2归一化之后的矩阵；||Sk-Sm||2目的为最小化两个矩阵之间的差异；3考虑到解码器的输出是对原始数据进行重构，故重构损失函数为Lres：公式中，X为原始的特征矩阵；为经过自动解码器还原的特征矩阵即步骤2中的的目的为最小化经过还原的矩阵与原始输入的矩阵之间的差异；4对未知节点属于哪一类进行预测，预测结果为公式中，softmax为分类函数，用于多分类过程中，它将多个神经元的输出，映射到0，1区间内，从而来进行多分类是所有类的规范化；W为步骤1中计算出的权重矩阵；b为步骤1中计算出的偏差向量；Z为步骤3计算出的节点最终嵌入矩阵；接下来，预测损失为：公式中，节点真实标签是Y；预测标签是为对数据集中每一个视图，以及每个视图中每个节点都分类别进行标签的预测，最终使预测误差尽可能小；5最终损失函数为L：L＝Lt+0.01Lm+0.001Ls+0.001Lres公式中，Lt为预测损失；Lm为多视图损失；Ls为单视图损失；Lres为重构损失。

全文数据：

权利要求：

百度查询：北京工业大学一种基于多视图多层注意力的面向学术论文的分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种异性粘结磁粉制备用原料筛选设备_天长市中德电子有限公司_202410411084.1

下一篇：一种探测烟雾粒度及浓度的方法_烟台创为新能源科技股份有限公司_202410159903.8

相关技术

一种异性粘结磁粉制备用原料筛选设备_天长市中德电子有限公司_202410411084.1

一种探测烟雾粒度及浓度的方法_烟台创为新能源科技股份有限公司_202410159903.8

一种预制叠合板浇筑模具的组合防松动装置_江西中煤建设集团有限公司_202410324859.1

一种双频段相控阵雷达智能抗干扰方法_成都金武科技有限公司_202410410853.6

一种燃气-蒸汽联合循环发电供热系统_西安热工研究院有限公司_202410130737.9

一种非均匀大气波导修正折射率的测算方法及系统_南京信息工程大学_202410123152.4

全氟异丁腈的合成方法_天津市长芦化工新材料有限公司_202410424719.1

一种中心静脉压手动测量装置_中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)_202410152192.1

一种转向管柱固定工装_芜湖普威技研有限公司_202311573386.0

热解油提质为BTEX的两级催化方法_沙特阿拉伯石油公司_202280065181.9

一种汽车配件的外圆磨削装置_江苏坦途专用汽车制造有限公司_202410150674.3

一种基于视觉和图像处理的叉车AGV控制系统_中建材智能自动化研究院有限公司_202410146298.0

学术相关技术

基于链接相似度的学术文献检索方法及系统_南京理工大学_202410185073.6

基于引入语义信息的神经网络的学术关系预测方法和装置_清华大学_202011052521.3

一种两阶段的学术视频关键帧提取方法_石家庄铁道大学_202310626014.3

一种基于多尺度特征的学术论文子图检测方法_北京航空航天大学_202410133507.8

基于日志反馈的中文医学术语自适应对齐方法_广州中康数字科技有限公司_202310647595.9

一种基于多视图多层注意力的面向学术论文的分类方法_北京工业大学_202110866447.7

学术大模型的语料数据集构建方法、装置、设备及介质_同方知网数字出版技术股份有限公司_202311738155.0

一种学术提示语生成方法、装置以及电子设备_同方知网数字出版技术股份有限公司_202311753823.7

一种结合学术文本结构的文本检测方法_湖南工商大学_202410019405.3

基于知识图谱与提示学习的跨网络学术社区资源推荐方法_江苏科技大学_202311538150.3

面向相关技术

一种面向林业的温差发电装置_东北林业大学_202322604029.8

面向软件抽象的控制流实现系统_清华大学_202410245386.6

面向高位宽航天侦察影像情报分析的数据智能重量化方法_北京理工大学_202410411803.X

面向大规模MIMO的模型驱动S-CSI估计方法、设备及基站_华中科技大学_202410148587.4

一种面向流控机制的无死锁可扩展互连裸芯架构_中国电子科技集团公司第五十八研究所_202210300619.9

面向三电平容错的电压纹波抑制电路、控制装置及其方法_湖南大学_202410422426.X

一种面向工厂化的预制叠合板尺寸质量智能检测方法_成都建工第一建筑工程有限公司_202111269803.3

基于改进的Ring All Reduce算法的面向深度学习的GPU并行方法_上海海洋大学_202111073054.7

一种面向高分系列光学卫星的随机森林积雪覆盖判识方法_国家卫星气象中心(国家空间天气监测预警中心)_202311759477.3

面向分布式储能集群控制的频率控制方法、装置及设备_国网重庆市电力公司电力科学研究院_202410197747.4

论文相关技术

基于多元数据融合的论文分类方法、装置、设备及介质_苏州元脑智能科技有限公司_202410219059.3

一种基于多尺度特征的学术论文子图检测方法_北京航空航天大学_202410133507.8

耦合公园社交媒体评论文本与图像的双模态评分方法及系统_华南理工大学_202410016760.5

基于深度学习的评论文本方面级情感分类方法及系统_上海哈蜂信息科技有限公司_202010776165.3

学位论文审稿人遴选方法、装置、设备及介质_南京理工大学_202410027292.1

一种专利和论文的联结方法及系统、存储介质_数据空间研究院_202311869343.7

一种基于多视图多层注意力的面向学术论文的分类方法_北京工业大学_202110866447.7

一种基于提示学习的评论文本情感挖掘方法_数据空间研究院_202311241154.5

基于词法词缀的论文冗余数据清洗方法、装置及存储介质_南阳理工学院_202211586218.0

一种论文主题无关引用检查方法及装置_北京邮电大学_202410240393.7

龙图腾网&IPTOP

【发明授权】一种基于多视图多层注意力的面向学术论文的分类方法_北京工业大学_202110866447.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务