买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于图对比学习的序列推荐数据增强方法_中国科学技术大学_202211604474.8 

申请/专利权人:中国科学技术大学

申请日:2022-12-13

公开(公告)日:2023-03-14

公开(公告)号:CN115795334A

主分类号:G06F18/23213

分类号:G06F18/23213;G06F18/25;G06N3/048;G06N3/084

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.03.31#实质审查的生效;2023.03.14#公开

摘要:本发明公开了一种基于图对比学习的序列推荐数据增强方法。该方法包括以下四个模块:一、全局图的建立;二、数据增强;三、用户兴趣挖掘;四、多任务学习。通过引入图对比学习,在构建的全局物品关系图中捕捉用户行为序列之间的深层连接关系,可以有效地加强物品嵌入表示,缓解真实推荐场景中数据稀疏和噪声问题,提升推荐效果。

主权项:1.一种基于图对比学习的序列推荐数据增强方法,其特征在于,所述方法包括:步骤1、获取真实应用场景中用户的历史行为序列,并对原始数据预处理;步骤2、根据预处理后得到的用户行为序列,统计各个物品对之间的多阶连接信息;再根据统计信息计算全局图中各物品之间边的权重并进行归一化,并设定阈值过滤噪声信息;最终,构建出全局图G;步骤3、对于每一个物品vi,通过邻域采样获取其子图对vi进行增强表示,包括根据步骤2构造的全局图G,以概率pij对vi在G中的邻居vj进行采样;其中,pij是vi和vj在全局图G中权重和采样深度D的比率;对于每个物品vi,通过上述两个取样过程得到两个增强的视图和步骤4、对于一个特定的物品vi,经过步骤3获得了两个增强子图和之后,采用LightGCN作为编码器,在不同的视图中使用共享参数,得到vi在的嵌入表示为ei,得到vi在另一个视图中的嵌入表示为e′i;步骤5、使用分桶聚类的方法进行负采样,缓解物品表征的分布并不均匀的负面影响,包括根据数据集中提供的物品的粗粒度属性和当前物品的嵌入表示将物品划分到不同的桶中,并根据K-means算法迭代更新物品的位置信息和桶的信息;步骤6、利用胶囊网络CapsNet进行兴趣提取,包括:设置R个兴趣胶囊,进行若干次迭代,得出用户的兴趣表示为给定一个嵌入表示为ev的目标物品,利用目标注意力机制得到用户的融合偏好;步骤7、对预测任务和对比学习任务进行联合优化。

全文数据:

权利要求:

百度查询: 中国科学技术大学 基于图对比学习的序列推荐数据增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。