买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】面向隐式反馈推荐系统的负样本采样及训练方法_中国科学技术大学_202210056103.4 

申请/专利权人:中国科学技术大学

申请日:2022-01-18

公开(公告)日:2024-04-19

公开(公告)号:CN114492836B

主分类号:G06N20/00

分类号:G06N20/00;G06F16/953

优先权:

专利状态码:有效-授权

法律状态:2024.04.19#授权;2022.05.31#实质审查的生效;2022.05.13#公开

摘要:本发明公开了面向隐式反馈推荐系统的负样本采样及训练方法,该方法从未交互的物品集合中采样作为负样本,并基于采样的中间结果,估计正样本在模型中的排序,设计全新的损失函数,加快模型的收敛,提升模型的效果。

主权项:1.一种面向隐式反馈推荐系统的负样本采样及训练方法,其特征在于,所述方法包括:设用户集合物品集合用户与物品的交互数据集合用表示,数据集中每一条数据都是一条正样本,由一个二元组c,i组成,其中对于一个用户c和一个物品i,一个具有参数θ的推荐模型对他们的打分用rci表示;步骤1、针对用户c,首先从一个静态分布Q·中采样一部分物品,组成一个物品池并为物品池中的每一个物品计算重要性重采样的权重: 其中,Qi和Qj分别表示物品i和物品j被采样的概率;其次,根据该权重组成的分布从物品池中进行有放回的重采样得到一个新的物品池且新物品池的大小与原物品池的大小一致,即最后,通过两次采样后,物品池中的物品被采样的概率近似为: 当物品池中物品的数量趋于无穷时,即采样的概率等于步骤2、在模型训练的过程中,设上一轮采样得到的物品池为当前轮采样得到的物品池为将它们合并,并从中根据均匀分布采样得到当前轮的物品池对于数据集中的正样本c,i,从中根据均匀分布采样最终得到负样本集合并设计如下损失函数: 其中,表示由当前模型得到的打分;||θ||2是L2正则化项,用于防止模型过拟合;λ是一个超参数,用于设置正则化项的权重;步骤3、基于步骤1中采样得到的物品池当静态分布Q为均匀分布时,进一步估计正样本c,i在当前模型的打分中,物品i在所有物品集合中的排序;其中,排序越靠后,则该样本在损失函数中的权重越大;排序的估计公式如下: 其中,表示一个指示函数,当且仅当括号内的条件为真,其值就等于1,否则等于0;表示下取整;基于估计的排序结果,将步骤2中的损失函数进一步扩展成: 其中,并且,通过梯度下降法最小化上述损失函数即可优化模型中的参数。

全文数据:

权利要求:

百度查询: 中国科学技术大学 面向隐式反馈推荐系统的负样本采样及训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。