买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于深度学习的融合个性化和多样化的搜索方法_中国人民大学_202111391539.0 

申请/专利权人:中国人民大学

申请日:2021-11-23

公开(公告)日:2024-04-09

公开(公告)号:CN114048386B

主分类号:G06F16/9535

分类号:G06F16/9535;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2022.03.04#实质审查的生效;2022.02.15#公开

摘要:本发明通过智能搜索领域的方法,实现了一种基于深度学习的融合个性化和多样化的搜索方法。方法主要通过计算一般多样性和个性化多样性的权重、多样性的动态建模、聚合各个得分结果三个步骤,基于深度学习的融合个性化和多样化的搜索模型DFSPD模型作为方法的核心,将多样性分为个性化的多样性和一般的多样性来同时考虑个性化和多样化对结果的影响,以根据不同情况提供更令用户满意的结果。本申请方案灵活性非常高,用户描述画像生成器,单词嵌入矩阵和个性化加权过程都可替换,在准确度上有很大的提升。

主权项:1.一种基于深度学习的融合个性化和多样化的搜索方法,其特征在于:输入用户的历史查询数据、当前查询和候选文档集,通过三个步骤实现:步骤一:并基于HRNN模型根据用户的长期历史Hl,短期历史Hs学习其初始的长期和短期的描述画像L0和S0,其中Hl={{q1,D1},…,{qn,Dn}},n代表之前会话中包含的总的查询数量Hs={{qn+1,Dn+1},…,{qn+m,Dn+m}},m是当前会话中已经搜索过的查询数量,qn代表用户提出的第n个查询,Dn为查询qn时ad-hoc搜索引擎返回的初始的候选文档集,进而利用查询向量和用户描述画像的匹配度,并以divd|qv表示文档d的一般多样性,divd|S,divd|L表示文档的个性化多样性,使用rS,rL作为个性化多样性的权重来动态控制个性化多样性对得分的影响程度;步骤二:构建RRNN模型,对剩余候选文档集中的候选文档根据当前综合得分scored利用贪心算法选择每一步的局部最优文档d*,之后根据所述文档的虚拟子话题表征来学习该文档对用户长短期描述画像和查询的子话题表征的影响,使用重置门结构来对这种影响建模,更新St-1,Lt-1为St,Lt,其中,St,Lt分别表示遗忘掉t个已选文档覆盖的子话题后,查询语句、用户短期画像和长期画像的向量表征,用于下一步文档选择的得分计算,L0,S0表示查询和用户画像向量表征的初始性;最终实现建模文档多样性的动态建模;步骤三,聚合各个得分结果,该得分即为重排序候选文档的依据,从而输出重排序后的搜索结果。

全文数据:

权利要求:

百度查询: 中国人民大学 一种基于深度学习的融合个性化和多样化的搜索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。