首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于离散因子分解机的物品推荐方法_华南理工大学_202111185507.5 

申请/专利权人:华南理工大学

申请日:2021-10-12

公开(公告)日:2024-04-30

公开(公告)号:CN114049166B

主分类号:G06Q30/0601

分类号:G06Q30/0601;G06Q30/0202;G06F17/16

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2022.03.04#实质审查的生效;2022.02.15#公开

摘要:本发明公开了一种基于离散因子分解机的物品推荐方法,包括下述步骤:获取用户、物品以及评分的关系数据;基于偏好数据构建因子分解机模型,所述因子分解机模型的输入为所述关系数据,输出为预测评分;对所述因子分解机模型的参数进行初始化,所述初始化包括实数参数的初始化与离散参数的初始化;根据所述偏好数据更新因子分解机离散参数和实数参数;根据更新后的参数,计算每个用户对于每个物品的预测得分,并对得分由高到低进行排序,为每个用户生成推荐物品清单。本方法采用二元二次规划对参数进行优化,因子分解机的训练过程中,使用混合整数问题求解,对离散参数逐个参数更新,具有收敛性好、扩展性强及准确度高的优点。

主权项:1.基于离散因子分解机的物品推荐方法,其特征在于,包括下述步骤:S1、获取用户、物品以及评分的关系数据,所述关系数据为“用户-物品-评分”形式,将所述关系数据处理为“用户-物品I-物品J-物品I与J间的偏好关系”形式的偏好数据;S2、基于偏好数据构建因子分解机模型,所述因子分解机模型的输入为同一偏好数据中包含的两个关系数据,输出为两个关系数据的预测评分,将两个预测评分差值转化为预测概率,所述因子分解机模型的目标是最小化所有物品间的预测概率与实际取值之间的差距,即最小化所有物品间的交叉熵;S3、对所述因子分解机模型的参数进行初始化,所述初始化包括实数参数的初始化与离散参数的初始化;更新离散因子分解机离散参数和实数参数;S4、根据更新后的离散参数和实数参数,计算每个用户对于每个物品的预测得分,并对预测得分由高到低进行排序,为每个用户生成推荐物品清单;步骤S2中,所述基于偏好数据构建因子分解机模型,具体为:将偏好数据中包含的两个关系数据,即“用户与物品I”和“用户与物品J”相关的数据作为因子分解机模型的两个m维输入向量xi和xj,根据预测公式分别计算两个m维输入向量xi和xj的预测得分和其中,w0为实数参数,ws为m维实数参数向量w的第s个值,bs,bt分别为k×m大小的离散矩阵B的第s和t列的列向量,k为离散特征的维度数;通过公式将两预测得分的差值转换为介于0到1之间的概率,其中exp为指数函数;若Pij≥0.5,则视为用户喜欢物品I,否则喜欢物品J;最小化物品间的预测概率与实际取值之间的差距,即最小化两者之间的交叉熵:∑i,j∈Ω-yijlogPij-1-yijlog1-Pij,其中i,j代表同一偏好数据下用户对两不同物品的交互数据,Ω为由所述偏好数据组成的数据集,yij为所述偏好数据中“物品I与J间的偏好关系”;步骤S3中,所述实数参数的初始化是通过标准高斯分布随机生成,或者通过预训练过程进行初始化,所述预训练是将离散参数还原为实数参数,并采用实数优化方法进行训练,最后再将训练得到的实数参数通过哈希函数离散化得到离散参数;所述离散参数初始化是先通过进行实数参数初始化过程,再利用哈希函数方法将实数离散化;步骤S3中,更新离散参数,具体为:将原始问题建模为同构二元二次规划问题,所述原始问题是指因子分解机模型对离散参数矩阵进行更新的一般形式,包括一个二次项和一次项,所述同构二元二次规划问题是指针对原始问题中的二次项进行的离散求解方法;通过半正定松弛算法求解;通过高斯随机过程生成原始问题的近似解;所述将原始问题建模为同构二元二次规划问题,具体为:将原始问题建模为同构二元二次规划问题的数学表达形式其中k为离散特征的维度数,r∈{1,...,m}为1到m范围内的整数,代表某列待更新的离散向量,dr为一次项的系数向量,Cr为二次项的半正定系数矩阵,br为离散参数矩阵B中第r列离散向量,系数矩阵v为自由变量,取值为±1,原始问题中的半正定矩阵Cr以及向量dr通过数学建模得到的交叉熵对离散矩阵B的每一列离散向量br进行的公式推导得到,具体为:将所述建模得到的交叉熵公式∑i,j∈Ω-yijlogPij-1-yijlog1-Pij化简为∑i,j∈Ω-yijSij+log1+expSij,其中为同一偏好数据中两物品的预测评分差;利用Jaakkola-Jordan边界对log1+expSij,通过引入辅助参数对目标函数最后一项log1+expSij进行松弛,具体为:其中由此得到作为实际辅助目标函数;更新离散矩阵B具体为:对矩阵的每列向量br分别进行更新,其他列向量不变,将实际辅助目标函数进一步化简为仅保留与向量br有关的相关项利用Sij与br的关系,推出原始问题中半正定矩阵Cr以及向量dr,公式为: 其中,为输入向量xi,xj的第r个元素的值,O为除去r以外的1到m范围内的整数,为除去第r个元素后的输入向量;通过半正定松弛求解具体为:通过建模为同构二元二次规划问题得到的优化目标利用xTHx=trxTHx=trHxxT=trHX的关系,将建模的同构二元二次规划公式转换为其等价形式其中X为向量xxT外积形成的半正定对称矩阵,tr是矩阵的迹,代表k+1维的半正定对称矩阵,且所形成的外积矩阵的秩rankX=1;所述通过高斯随机过程生成原始问题的近似解,具体为:将半正定对阵矩阵X作为高斯分布的协方差矩阵,随机采样n次及以上,采样结果为其中ξl为均值为0,协方差为半正定对阵矩阵X的高斯分布随机生成,l为随机采样次数;通过符号函数对每个采样结果进行离散化从中选择与目标最接近的采样作为同构二元二次规划问题的解通过去掉同构二元二次规划的解x的最后一个自由变量v,取前k个值,从而得到原始问题的解br;步骤S3中,更新实数参数,具体为:更新Jaakkola-Jordan边界引入辅助参数由得到最优解;更新实数参数w0,w,将两实数参数视为一个整体令实际辅助目标函数对的导数为0,从而得到方程并转化为一般的方程组求解形式其中矩阵A的每一行均为所述偏好关系组成的数据集Ω下的两个交互数据的输入向量之差向量分别为向量xi的第s和t个值,m为输入向量维度,参数的闭式解由得到并转换为优化问题,即最小化所述优化问题可通过共轭梯度法进行高效迭代求解,从而得到更新后的参数w0,w。

全文数据:

权利要求:

百度查询: 华南理工大学 基于离散因子分解机的物品推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。