买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置_扬州大学_202110909147.2 

申请/专利权人:扬州大学

申请日:2021-08-09

公开(公告)日:2023-05-26

公开(公告)号:CN113742733B

主分类号:G06F21/57

分类号:G06F21/57;G06F18/214;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2023.05.26#授权;2021.12.21#实质审查的生效;2021.12.03#公开

摘要:本发明公开了一种阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置,所述方法包括:漏洞数据采集;漏洞描述语句表示学习;利用图卷积网络GCN构造漏洞描述文本的句法依存关系,提取漏洞特征;基于BERT微调模型中的问答任务,实现漏洞事件触发词识别及分类。本发明可以更好地利用漏洞描述中的语法和语义信息,充分挖掘漏洞描述中的上下文信息,达到对漏洞事件触发词的识别和分类,可以一定程度上解决漏洞分类不准确的问题,相较于目前流行的事件触发词抽取方法,能够捕获不同事件间的依存关系,并且与已有漏洞分类方法相比,可以输出漏洞事件的触发词,辅助开发人员分析漏洞。

主权项:1.一种阅读理解漏洞事件触发词抽取和漏洞类型识别方法,其特征在于,包括以下步骤:1采集漏洞数据,获取漏洞条目的CVE-ID、每个ID对应的漏洞描述及漏洞类型,并为漏洞事件设计提问问题Q;2基于BERT预训练模型,进行漏洞描述语句表示学习,作为GCN输入的初始节点特征;3使用图卷积网络GCN,提取漏洞信息的节点特征;4基于BERT微调模型中的问答任务,实现漏洞事件触发词识别及分类;所述步骤2包括以下步骤:21将设计的提问问题Q与漏洞条目的描述Text转换成BERT预训练模型的输入序列;即采用特殊标记[CLS]放在开头,用来融合描述中每个单词的语义信息,问题和漏洞描述使用[SEP]分隔;将每个单词转换成Token嵌入、Segment嵌入和Position嵌入,并对这些嵌入表示求和得到表示向量;22将表示向量传递给BERT的编码器层,利用Transformer结合掩码语言模型、预测下一句任务实现双向语言模型任务,进行表示学习,得到嵌入向量X,作为GCN输入的初始节点特征;所述步骤3包括以下步骤:31基于得到漏洞条目的文本描述,利用斯坦福句法分析工具获取漏洞描述文本的句法依存关系;32根据句法依存关系构建漏洞描述的句法信息图G=V,E;其中V是漏洞节点v1,v2,...,vi...,vn的集合,vi表示漏洞描述中的第i个单词,n是漏洞描述中的单词数量,E是节点vi到节点vj有向边vi,vj的集合;同时为每条有向边增加一条反向边vj,vi,每个节点vi添加一个自循环边vi,vi,并为每一条边添加关系类型标签Kvi,vj;基于句法信息图G获得邻接矩阵A,即若节点vi和节点vj相连,邻接矩阵A中第i行第j列的元素aij=1,否则aij=0;是邻接矩阵A的规范化矩阵,由如下变换得到: 式中,A′=A+I,其中I是单位矩阵;是A′的度矩阵;34对漏洞节点信息进行梯度下降训练,提取漏洞节点特征,变换如下: 式中,是图卷积神经网络第l层输入的漏洞节点信息;利用规范化矩阵以及每层特定类型标签Kvi,vj的权重矩阵做线性变换,之后再经过非线性激活函数σ得到下一层输入的漏洞节点信息经过多次卷积训练,从而获取漏洞节点的特征向量;35针对漏洞事件触发词提问的问题也做如上操作,构造其句法依存关系,获取问题语句的特征向量;所述步骤4包括以下步骤:41将问题描述特征向量A及漏洞描述特征向量B,接入BERT问答任务中的全连接层和softmax层;42为BERT问答任务引入一个起始向量S和一个结束向量E,计算漏洞描述中第i个单词作为答案跨度开始的概率Pi,概率最高单词的作为答案跨度的开始,由如下变换得到: 其中,Ti是单词i的特征向量;同理利用公式计算答案跨度的结束;将候选答案从位置i到位置j的得分定义为Si,j=S·Ti+E·Tj,以j≥i时的最大得分跨度作为预测结果;同时进行无答案预测,将没有答案的问题视为以[CLS]标记开始和结束的答案跨度,计算无答案的得分Snull=S·C+E·C,其中,C是特殊标记[CLS]的向量;将无答案跨度Snull的得分与最佳非空跨度的得分Si,j进行比较;当Si,jSnull+τ时,τ是自定义的阈值,预测一个非空答案,该答案即为漏洞事件触发词;43基于漏洞事件触发词,将其中的每个单词的特征向量作为逻辑回归模型的输入,并计算漏洞事件触发词属于不同漏洞类型的概率以预测漏洞事件的类别。

全文数据:

权利要求:

百度查询: 扬州大学 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。