买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于深度学习的网络威胁情报关系三元组联合提取方法_广州大学_202311494302.4 

申请/专利权人:广州大学

申请日:2023-11-09

公开(公告)日:2024-03-29

公开(公告)号:CN117787403A

主分类号:G06N5/025

分类号:G06N5/025;G06N5/02;G06N3/0455;G06N3/0442;G06F16/36;G06F40/211;G06F40/284;G06F40/30;H04L9/40

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明提供了一种基于深度学习的网络威胁情报关系三元组联合提取方法,基于深度神经网络构建一种网络威胁情报关系三元组联合提取模型,采用如下技术方案:a使用联合提取的方法来同时提取实体和关系,解决了实体和关系提取任务之间交互缺失的问题;b使用基于跨度的方法,解决了重叠实体的问题;c使用BERT大规模预训练模型对文本进行向量表示。由于预训练模型包含了从大规模语料库中学习到的上下文信息,可以极大丰富模型对威胁情报文本的语义表达;d融合多种模态信息,如时序、依赖关系、跨度、标签等,增强多模态信息之间的交互,缓解了文本跨度长、实体语义相似度高、实体之间相关性弱的问题。

主权项:1.基于深度学习的网络威胁情报关系三元组联合提取方法,其特征在于,包括以下步骤:步骤S1:将输入文本信息转换为向量表示并获取语义信息:对实体和关系类型词进行编码获取标签词,将网络威胁情报句子序列进行编码得到句子序列S;步骤S2:获取句子表示序列S每个分词在句中的时序信息和长期依赖关系,得到句子表示序列T;步骤S3:获取输入序列T每个分词之间的句法依赖关系及其标签,获取分词的句法依赖信息嵌入句子表示序列T,结合依赖类型注意分数和标准GCN公式计算得到句子表示序列H;步骤S4:提取实体跨度:枚举出所有可能的跨度,将句子表示序列H以跨度为中心分成三部分,并将这三部分分别进行最大池化整合跨度特征,获取跨度时序信息、跨度和实体标签的交互信息,过滤冗余跨度,得到实体跨度集合L;步骤S5:提取关系三元组:根据实体跨度集合L枚举出所有可能的实体对,将句子表示序列L以实体跨度对为中心分成五部分,并将实体跨度对以外的这三部分分别进行最大池化整合跨度特征,获取实体跨度对时序信息、实体跨度对和关系标签的交互信息,将实体跨度对序列输入共预测器得到关系三元组集合Ts;步骤S6:将网络威胁情报进行迭代训练得到网络威胁情报关系三元组联合提取模型;步骤S7:将海量网络威胁情报输入网络威胁情报关系三元组联合提取模型得到关系三元组。

全文数据:

权利要求:

百度查询: 广州大学 基于深度学习的网络威胁情报关系三元组联合提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。