买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于改进神经网络的生成式摘要生成方法和系统_重庆安石泽太科技有限公司_202011208470.9 

申请/专利权人:重庆安石泽太科技有限公司

申请日:2020-11-03

公开(公告)日:2024-04-09

公开(公告)号:CN112560456B

主分类号:G06F40/258

分类号:G06F40/258;G06N3/0455

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2021.04.13#实质审查的生效;2021.03.26#公开

摘要:本发明涉及自然语言处理技术领域,具体涉及一种基于改进神经网络的生成式摘要生成方法和系统,包括:将文本分词化、分区处理并转换成独热编码向量;对独热编码向量进行词编码处理,得到训练参数矩阵和具有高表征的词编码;引入上下文矩阵与词编码做softmax操作,得到词注意力矩阵,将词注意力矩阵和隐藏层的结果做点积并加权,得到句向量;对句向量进行句编码处理,得到具有高表征的句编码;引入随机的句注意力矩阵与句编码做softmax操作,生成文档向量;将文本向量作为解码器的初始化参数输入解码器进行解码操作,生成文本摘要。本发明提高了模型的关注颗粒度,能够更为精准的捕获到文章中的关键信息,提高了生成摘要的精确性。

主权项:1.一种基于改进神经网络的生成式摘要生成方法,其特征在于,包括以下步骤:S1、将文本分词化,并做分区处理,得到多个处理单元,将每个处理单元中的每个词语转换成独热编码one-hot向量的嵌入式表示,记为wij,并将独热编码one-hot向量wij输入到词编码层,其中i表示第i句话,j表示第i句话中的第j个词语;S2、词编码层将每一个句子作为一个处理单元,利用双向长短记忆型神经网络及其变种对独热编码one-hot向量wij进行词编码操作,得到训练参数矩阵和具有高表征的词编码;其中训练参数矩阵是神经网络模型训练过程中附带的产物,用于自适应的调整模型误差;S3、引入一个随机的上下文矩阵uw,将uw与词编码做softmax操作,得到词注意力矩阵,将词注意力矩阵和隐藏层的结果做点积并加权,得到一个具有高表征特性的句向量SL,L表示第L个分区,将句向量SL输入到句编码层;S4、句编码层利用双向长短记忆型神经网络及其变种对句向量SL进行句编码处理,得到具有高表征的句编码;S5、引入随机的句注意力矩阵,将句注意力矩阵与得到的句编码做softmax操作,生成具有高表征特性的文档向量T;S6、将文本向量T作为解码器的初始化参数输入解码器进行解码操作,生成文本摘要。

全文数据:

权利要求:

百度查询: 重庆安石泽太科技有限公司 一种基于改进神经网络的生成式摘要生成方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。