Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京理工大学史树敏获国家专利权

恭喜北京理工大学史树敏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京理工大学申请的专利一种基于高斯核函数的长文本检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114328863B

龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111512377.1,技术领域涉及:G06F16/3329;该发明授权一种基于高斯核函数的长文本检索方法及系统是由史树敏;朱乐;黄河燕设计研发完成,并于2021-12-08向国家知识产权局提交的专利申请。

一种基于高斯核函数的长文本检索方法及系统在说明书摘要公布了:本发明涉及一种基于高斯核函数的长文本检索方法及系统,属于信息检索技术领域。本方法利用预训练语言模型的语义建模能力计算长文本各段落与用户检索内容的语义相似度,作为用户点击相关性的伪标签,有效缓解了缺乏段落级别标注数据的问题。通过不同的高斯核函数,将伪标签映射为不同维度的相关性得分。利用线性层聚合长文本各段落得分来输出用户检索内容对于长文本整体的相关性得分,能够让不同语义相似度等级的段落为用户点击相关与否做出贡献,增强了语义相似度与用户点击相关性的关联程度,提升了长文本检索模型的准确率。

本发明授权一种基于高斯核函数的长文本检索方法及系统在权利要求书中公布了:1.一种基于高斯核函数的长文本检索系统,其特征在于,包括伪标签计算模块、高斯核映射模块和输出模块;其中,伪标签计算模块负责对长文档进行分段,并将得到的各个文本段落与用户检索内容级联后输入预训练语言模型中,得到文本特征交互向量;同时,将文本特征交互向量作为线性层的输入,将输出的用户检索内容与长文本各段落相关性作为伪标签;高斯核映射模块负责将伪标签通过不同高斯核函数,由标量映射为得分向量;输出模块用于将属于同一长文本的不同段落得分向量级联为得分矩阵,将得分矩阵平均池化后放入线性层,判断并整合用户检索内容在不同高斯核函数下与长文本的相关性;上述模块之间的连接关系为:伪标签计算模块的输出端与高斯核映射模块的输入端相连;高斯核映射模块的输出端与输出模块的输入端相连;首先,在伪标签计算模块中对长文本进行分段;先对分段截止点按优先度分级,其中,标点符号优先级高于指定最大段落长度,然后,将分段所得段落分别与用户检索内容级联,并输入至预训练语言模型中,得到文本特征交互向量,最后,将所述文本特征交互向量放入线性层中,输出用户检索内容与长文本各段落的相关性,作为伪标签;在伪标签计算模块中,预训练语言模型得到文本特征交互向量Vi,如式1所示:Vi=BERTq,pj1其中,i的取值范围为1、2、3、…、n,n指长文本可划分段落数目的最大值;q为用户检索内容,pj为长文本的第j个段落;所述线性层指全连接神经网络,将文本特征交互向量映射为相关性,如式2所示:R=W*Vi+b2其中,R表示模型输出的相关性得分,W、b为模型参数,能够在模型训练过程中通过反向传播求解;Vi代表第i个段落与用户检索内容的文本特征交互向量;在高斯核映射模块中,首先初始化不同高斯核的均值和方差,其中,各个高斯核均值不同但方差系统;然后,将伪标签计算模块输出的伪标签放入不同高斯核进行映射,将所得结果级联在一起,构成得分向量;所述高斯核函数映射如式3所示:KRi=exp-Ri-μk2σk23其中,KRi表示,Ri为用户检索内容q与第i个段落的伪标签,μk、σk分别表示第k个高斯核的均值和方差,exp为指数函数;在输出模块中,首先将长文本不同段落对应得分向量级联在一起,得到得分矩阵;将得分矩阵平均池化后,输入至线性层,输出最终的用户检索内容与长文本相关性打分;最后,利用MLP判断在不同等级下长文本各段落对于最终用户点击相关性的贡献。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。