买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于级联抽取和图对比模型的混沌工程摘要生成方法_南京争锋信息科技有限公司_202410116568.3 

申请/专利权人:南京争锋信息科技有限公司

申请日:2024-01-29

公开(公告)日:2024-04-09

公开(公告)号:CN117668213B

主分类号:G06F16/34

分类号:G06F16/34;G06F40/211;G06F40/30;G06F40/284;G06N3/045;G06N3/0442;G06N3/08;G06N7/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2024.03.26#实质审查的生效;2024.03.08#公开

摘要:本发明公开了一种基于级联抽取和图对比模型的混沌工程摘要生成方法。首先,采用抽取式摘要生成技术,标注混沌工程演练报告中的重要部分,抽取出关键信息作为黄金摘要;然后,使用基于黄金摘要和全局文档上下文语义信息的图对比主题模型GCTM,捕捉更好的全局语义信息,通过建立文本的图模型,将混沌工程演练报告中的词与词之间的关系表示为边,进而提取出主题信息;此外,该模型还能够利用全局文档上下文信息来进一步提高对主题的识别能力,生成更加准确的混沌工程演练报告摘要;最后,融入多任务学习机制,对生成摘要中的句子进行计算打分,共享参数并进行融合,以保留关键信息和全局语义信息的同时,又能生成自然流畅的混沌工程演练报告摘要。

主权项:1.一种基于级联抽取和图对比模型的混沌工程摘要生成方法,其特征在于,包括以下步骤:步骤1、采用抽取式摘要生成方法,标注混沌工程演练报告中的重要部分,抽取出混沌工程演练报告中所有重要的句子,将其组合起来作为后续步骤中的黄金摘要,方法如下:步骤1.1、以混沌工程演练报告为原始文档,顺序访问每个句子,就其是否应当被包括在摘要中做出二元判定;步骤1.2、使用基于GRU的循环神经网络作为序列分类器的基本构建块;步骤1.3、构建深度的学习循环神经网络,表示为RNN,将混沌工程演练报告的表示,建模为双向句子级RNN中级联隐藏状态的平均池化的非线性变换,如下式: ;式中,下标i表示第i个句子,分别是与前向和后向句子级RNN的第i个句子相对应的隐藏状态,d表示向量,Nd是文档中句子的数量,wd是用于线性变换的权重矩阵,函数[.]表示向量拼接,b是偏置项,函数tanh为双曲正切函数;步骤1.4、进行二元决策:每个句子在第二次遍历中逐个被重新审查,通过一个逻辑层对该句子进行二元决策,判断该句子是否属于摘要,公式如下: 其中,yi是二元变量,表示第i个句子是否为摘要的一部分,句子的表示hi通过对双向句子级RNN在第i个句子的拼接隐藏状态进行非线性变换得到,si是在第i个句子位置处的摘要的动态表示,wc、ws、wr、wap、wrp分别表示不同的权重矩阵;wchi表示第i个句子的信息内容,上标T表示转置,表示句子相对于混沌工程演练报告的重要性,捕捉句子相对于当前摘要状态的冗余度;模拟了句子相对于混沌工程演练报告的绝对位置和相对位置的重要性;pa和pr分别为绝对位置嵌入和相对位置嵌入的模型参数,结果表示第i个句子是否属于黄金摘要;步骤2、使用结合黄金摘要和全局文档上下文语义信息的图对比主题模型,捕捉全局语义信息,建立文本的图模型:将混沌工程演练报告中词与词之间的关系表示为边,提取出主题信息;利用图模型与来自黄金摘要的监督信息进行对比学习,生成混沌工程演练报告主题分布;使用概率解码器生成观察到的单词,预测每个混沌工程演练报告中句子的标签,推送与黄金摘要具有高度语义相似性的文档和句子的紧密主题表示,得到的句子成为新的摘要;步骤3、融入多任务学习机制,对步骤1生成的黄金摘要和步骤2生成的新的摘要中的句子进行打分计算,共享参数并进行融合,保留关键信息和全局语义信息,生成混沌工程演练报告摘要。

全文数据:

权利要求:

百度查询: 南京争锋信息科技有限公司 一种基于级联抽取和图对比模型的混沌工程摘要生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。