买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种提升用户视频网站留存时间的推荐方法_北京工业大学_202110026449.5 

申请/专利权人:北京工业大学

申请日:2021-01-08

公开(公告)日:2024-02-02

公开(公告)号:CN112699271B

主分类号:G06F16/735

分类号:G06F16/735;G06F18/23213;G06F18/2433;G06N3/045;G06N3/084;G06N3/0985

优先权:

专利状态码:有效-授权

法律状态:2024.02.02#授权;2021.05.11#实质审查的生效;2021.04.23#公开

摘要:本发明公开了一种提升用户视频网站留存时间的推荐方法,包括以下步骤:数据预处理、深度兴趣交叉网络模型构建、模型训练及结果生成。本发明中的深度兴趣交叉网络模型整体上被划分为数据转换模块、低阶特征提取模块、交叉网络特征提取模块、深度兴趣特征提取模块。将三个特征提取模块以并行的方式进行训练,同时三个特征共享同一个数据层以加快模型的收敛速度。通过该机制我们可以深入挖掘用户的历史兴趣偏好,从中筛选出能够代表用户兴趣的内容,进而增强该内容的权重提升推荐系统的准确性。本发明除了能够提升视频网站推荐系统的准确性外,还可以将本发明的模型应用到电商、音乐等网站中,具有较好的移植性。

主权项:1.一种提升用户视频网站留存时间的推荐方法,其特征在于,包括以下步骤:步骤一、获取视频网站用户的数据集,并进行数据预处理;步骤二、在进行数据预处理后,使用Pytorch深度学习框架,搭建深度兴趣交叉网络模型;步骤三、定义损失函数;步骤四、通过损失函数对深度兴趣交叉网络模型进行训练;步骤五、使用步骤四训练好的深度兴趣交叉网络模型对测试数据进行测试,得到结果后与原始数据集中的结果进行比较,从而计算出模型推荐的准确率;在步骤二中,按照以下三个特征提取模块并行训练作为设计架构,通过自底向上逐步建立各个处理模块的方式搭建深度兴趣交叉网络模型,具体包括以下步骤:步骤21、建立数据转换模块,将预处理后的数据映射到低维的稠密向量空间,转换后的数据直接被输送到深度兴趣交叉网络模型进行训练;同时,预处理后的数据经过数据转换模块加工后,数据被映射成低维的向量;步骤22、构建低阶特征提取模块,低阶特征模块构建以因子分解机为核心;将因子分解机引入到该模块中进行自动化地进行特征组合,学习一阶特征和二阶特征;步骤23、构建交叉网络特征提取模块,交叉网络特征模块弥补深度神经网络的不足;交叉网络特征模块对高阶特征进行学习;步骤24、构建深度兴趣特征提取模块,深度兴趣特征提取模块由深度神经网络与Attention机制串行组成;深度神经网络端到端隐式地学习高阶特征;在步骤三中,深度兴趣交叉网络模型损失函数定义如下:最终输出的损失函数定义为: 其中,losso表示二元交叉熵损失,y为每个样本的标签值;为模型预测样本值为1或0时的概率值;在步骤四中,使用预处理的数据集对神经网络模型进行训练,直至其收敛,使用的两个评价指标为AUC和Logloss,公式如下: 其中,AUC为受试者工作特征曲线下的面积,M为正类样本的数目,N为负类样本的数目;insi为样本的下标,代表预测概率超过的该样本的数目;Logloss表示二元交叉熵损失,y为每个样本的标签值,取值为0或1;为模型预测样本值为1或0时的概率值。

全文数据:

权利要求:

百度查询: 北京工业大学 一种提升用户视频网站留存时间的推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。