买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种推荐方法及系统_陕西师范大学_202010577298.8 

申请/专利权人:陕西师范大学

申请日:2020-06-22

公开(公告)日:2024-04-02

公开(公告)号:CN111737578B

主分类号:G06F16/9535

分类号:G06F16/9535;G06F16/958;G06N3/048;G06N3/08;G06Q30/0202;G06Q30/0251

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2020.10.30#实质审查的生效;2020.10.02#公开

摘要:一种推荐方法及系统,该方法包括如下步骤:S100:将原始数据转化为数值数据,将大规模稀疏特征转化为低维密集特征;S200:获得用户的兴趣表示;S300:分别提取用户和项目的高阶特征交互和低阶特征交互,基于线性的全局注意力机制监视高阶特征交互和低阶特征交互对于点击率预测的不同贡献;S400:预测用户是否点击候选项,最终完成向用户推荐项目。该方法及系统的有效性和性能明显优于现有方法,并提供了良好的解释性。

主权项:1.一种推荐方法,包括如下步骤:S100:将原始数据转化为数值数据,将大规模稀疏特征转化为低维密集特征;S200:获得用户的兴趣表示;S300:分别提取用户和项目的高阶特征交互和低阶特征交互,基于线性的全局注意力机制监视高阶特征交互和低阶特征交互对于点击率预测的不同贡献;S400:预测用户是否点击候选项,最终完成向用户推荐项目;步骤S100进一步包括,S101:采用独热编码对原始数据进行向量化;S201:通过建立一个映射函数,将高维稀疏向量映射成低维稠密向量;其中,该方法使用了四类特征:用户特征,用户行为,广告和上下文,用户特征的字段有性别、年龄;用户行为字段是用户访问的商品id列表;广告的字段是广告的id,商店id;上下文的字段是类型id、时间;每个字段的特征编码成一个独热向量,从用户特征、用户行为、广告和上下文四个方面的独热向量分别表示为ZF,ZH,ZI,ZC;其中,用户历史记录行为共有S个独热向量,S为用户可以点击的广告总数;假如在第N次行为中点击了第i个商品,那么HN表示成: ,其中表示嵌入向量,然后,建立一个映射函数,将高维稀疏向量降维为低维密集表示,特征向量化层的映射关系表示为: ,其中是特征向量化层中HN对应的权重矩阵,d是嵌入向量的特征维数,是用户第N次历史行为中点击第i个商品映射后的值,用户的历史行为;用户特征,广告,上下文也都转换成独热向量ZF、ZI、ZC,ZF、ZI、ZC经过特征向量化层映射成低维稠密向量;通过以上处理,得到了用户特征、用户行为、广告和上下文的特征向量;根据上述定义,将问题形式化为: ,目标是找到一个模型,输入特征组合x,x={ZF,ZH,ZI,ZC},在约束条件下,输出点击率,根据真实标签y的值使得模型损失最小化,f为预测函数;步骤S200进一步包括,采用局部注意力机制来学习用户的兴趣表示;其中,在给定候选广告I的情况下,自适应地计算出用户的兴趣表示,表示为: ,其中g是注意力机制函数,代表用户U的历史行为的嵌入向量列表,长度为N;是广告I的词嵌入向量,为对用户每个历史行为的权重;是一个含有一层隐含层的MLP,输出权值,表示为: ,其中和是激活函数, 表示激活函数的权重矩阵,表示激活函数sigmoid,为激活函数中隐含层的神经单元数,d为嵌入向量的特征维数;这样,不同的历史行为是根据候选广告加权,然后得到用户的兴趣表示;步骤S300进一步包括:S301:利用三层感知器来捕获用户和项目的高阶特征交互;S302:利用因子分解机组件来捕获用户和项目的低阶特征交互;S303:利用基于线性的全局注意力机制使所述用户和项目的高阶特征交互和低阶特征交互发挥不同的作用;该方法不仅捕获特征之间的线性特征交互,而且将特征交互成对地建模为各自特征潜在向量的内积,在模型中,引入因子分解机来学习低阶特征交互,与多层感知器共享相同的输入,因子分解机的输出表示为: ,其中,表示第i个特征的权重, 表示交叉特征的权重,, 表示特征i的嵌入向量,d表示特征嵌入向量的维度,通过多层感知器和因子分解机组件学习了高阶和低阶特征交互,考虑到高阶和低阶特征交互在点击率预测中的作用不同,从全局的角度,提出基于线性的全局注意力机制监测,基于线性的全局注意力机制是一个简单的线性模块,节省计算时间,同时,也取得了良好的效果,基于线性的全局注意力机制的输出表示为: ,其中是低阶特征交互的权重,是高阶特征交互的权重。

全文数据:

权利要求:

百度查询: 陕西师范大学 一种推荐方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。