买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于主题-述题理论的分层规划论文摘要生成方法_人民网股份有限公司;天津大学_202211101635.1 

申请/专利权人:人民网股份有限公司;天津大学

申请日:2022-09-09

公开(公告)日:2022-12-30

公开(公告)号:CN115545037A

主分类号:G06F40/30

分类号:G06F40/30;G06F40/216;G06N3/04;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.01.20#实质审查的生效;2022.12.30#公开

摘要:本发明公开一种基于主题‑述题理论的分层规划论文摘要生成方法,1对论文标题及知识图谱分别使用Transformer编码器和GraphTransformer编码器进行编码,获得论文标题及知识图谱的表示;2主题词规划;3述题子图规划:4依据主题词和述题子图进行各个句子的生成:5重复3‑4流程,直至全部的主题词遍历结束,将所有语句拼接在一起得到对应的论文摘要。

主权项:1.一种基于主题-述题理论的分层规划论文摘要生成方法,其特征在于,包括以下步骤:1对论文标题及知识图谱分别使用Transformer编码器和GraphTransformer编码器进行编码,获得论文标题及知识图谱的表示;所述知识图谱为论文摘要对应的知识图谱;2主题词规划:将论文标题及知识图谱中节点的表示拼接起来并学习其中的潜在语义信息,记得到的隐变量为ztopic,ztopic中包含论文标题和知识图谱的潜在语义信息;ztopic用于初始化主题词解码器;主题词解码器被训练用于生成主题词序列T,主题词序列T中包含若干个主题词:T={topick|1≤k≤|Y|},|Y|表示论文摘要中共包含|Y|个句子;主题词序列中的第一个主题词topic1是论文摘要中第一个句子的主题词,topic2是论文摘要中第二个句子的主题词,以此类推,topick是论文摘要中第k个句子的主题词,k=1,2,…|Y|;主题词解码器在生成的每一步都将从知识图谱中选择一个节点作为主题词;3述题子图规划:对于主题词序列T中的每个主题词都有对应的述题子图,定义述题子图的集合为g={gk|1≤k≤|Y|};以构造第k个主题词对应的述题子图为例:以主题词topick为基础,对知识图谱中的每个节点进行打分,打分结果在[0,1]之间,并认为得分大于0.4的节点是相关的节点,分数小于0.4的节点是不相关的节点;最终仅保留得分大于0.4的节点,舍弃不相关的节点;以此得到知识图谱的子图即为述题子图,记为gk;4依据主题词topick和述题子图gk进行第k个句子的生成:由于论文摘要中各个句子间存在互相影响,因此设置隐变量表示当前句子的语义状态,结合k-1个句子状态以及主题词和述题子图来学习第k个句子应有的语义状态;用于初始化句子解码器的初始状态;使用一个有监督的信号量来监督句子解码器在生成每个单词时拷贝述题子图的节点的概率,以此避免反复从述题子图拷贝节点。5重复3-4流程,直至全部的主题词遍历结束,将所有语句拼接在一起得到对应的论文摘要。

全文数据:

权利要求:

百度查询: 人民网股份有限公司;天津大学 基于主题-述题理论的分层规划论文摘要生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。