买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于Time-Trust相似度的电影推荐方法_四川大学_201710106152.3 

申请/专利权人:四川大学

申请日:2017-02-27

公开(公告)日:2021-06-25

公开(公告)号:CN106951462B

主分类号:G06F16/9536(20190101)

分类号:G06F16/9536(20190101);G06K9/62(20060101)

优先权:

专利状态码:失效-未缴年费专利权终止

法律状态:2023.02.28#未缴年费专利权终止;2017.08.08#实质审查的生效;2017.07.14#公开

摘要:本发明提供了一种基于Time‑Trust相似度的电影推荐方法,本发明利用了电影的评分信息,综合遗忘规律、电影间的分值、用户对电影兴趣倾向等特征,计算出电影之间的相似程度,从而进行电影的评分预测并进行电影推荐。本发明可以实现对电影评价的精确预测,可以依据用户兴趣为其推荐电影。

主权项:1.一种基于Time-Trust相似度的电影推荐方法,其特征在于,所述方法包括如下步骤:1获取电影数据;所述电影数据为电影i和电影j的评价时间差△t、单个用户对电影i和电影j各自的评分ri和rj、所有用户对电影i和电影j的平均评分和电影i和电影j两部电影中的最高评分max、电影i和电影j两部电影中的最小评分min、电影i和电影j各自的评分用户集合Ii和Ij及两个电影之间的共同用户并集Ii∪Ij;所述电影i为任意一部电影,所述电影j为任意一部不同于电影i的电影;2按照如下公式计算相似度: 其中, 其中,rememory=0.01*31.8×△t-0.125;sim1i,j为结合电影评价时间差的相似度;sim2i,j为电影之间的分值相似性度;sim3i,j为电影之间的倾向相似性度;sim4i,j为电影之间的共同用户集合权重因子;sim5i,j为考虑了共同用户集合的相似度;3将步骤2所得结果数据进行储存;4获取用户历史的电影,输出与其喜好的电影相似度最高的电影,并推荐给用户。

全文数据:一种基于Time-Trust相似度的电影推荐方法技术领域[0001]本发明涉及一种电影推荐方法,具体涉及一种基于Time-Trust相似度的电影推荐方法。背景技术[0002]现在基于电影的相似性度量方法主要余弦相似法、Jaccard相似法等。传统相似性度量方法存在一些缺陷。余弦相似法未考虑电影共同评分的用户的数量。度量相似性的标准总体上是两个电影对同一个用户的评分越接近,共同评分的数目越多,相似度则越高。但如果当电影间只存在极少的甚至只有1个共同评分用户时,使用余弦相似所得的相似度相当高,往往得出违反常理的结果。Jaccard相似度考虑了共同评分的用户的个数的问题,然而仅仅是简单地以两个对象的交集并集比值来度量相似度,未能考虑实际的评分值,缺陷依然明显。发明内容[0003]针对现有技术的缺点,本发明的目的在于提供一种基于Time-Trust相似度的电影推荐方法,其特征在于,所述方法包括如下步骤:[0004]1获取电影数据;所述电影数据为电影i和电影j的评价时间差At、单个用户对电影i和电影j各自的评分rdPn、所有用户对电影i和电影j的平均评分,电影i和电影j两部电影中的最高评分max、电影i和电影j两部电影中的最小评分min、电影i和电影j各自的评分用户集合UPIj及两个电影之间的共同用户并集I1UIj;[0005]所述电影i为任意一部电影,所述电影j为任意一部不同于电影i的电影;[0006]2按照如下公式计算相似度:[0008]其中,[0014]其中,[0016]3将步骤⑵所得结果数据进行储存;[0017]4获取用户历史的电影,输出与其喜好的电影相似度最高的电影,并推荐给用户。[0018]利用本发明方法得到的相似性结果具有高度的精确性,可以为用户进行高质量的电影推荐。如本发明的实施例所示,在进行基于相似度的推荐过程中,本发明相对于现有技术的其它方法而言,具有更好的精确度。[0019]为了进一步说明本发明的步骤及原理,现对本发明上述步骤进行详细说明:[0020]A.利用艾宾浩斯遗忘规律原理,将电影间的评价时间差At作为相似度的衡量指标之一,计算出经过Δt之后的记忆剩余量rememory〇[0022]B.结合电影评价时间差的相似度设定为simli,j,使用步骤A的方法得到的记忆剩余量rememory,结合sigmod函数曲线,可得出simli,j对应的计算表达式为:[0024]C.利用用户对两个电影的评分,提出分值相似度。设某用户对电影i的评分为Γι,对电影j的评分为rj,电影的最高评分为max,最小评分为min,结合sigmod函数导数衰减函数曲线,可得电影之间的分值相似性度sim2i,j,公式为:[0026]D.利用用户对两个电影的评分,提出电影倾向相似度。设用户对电影i的评分为η,所有用户对电影i评分的平均值为。对电影j的评分为所有用户对电影j评分的平均值为可得电影之间的倾向相似性度sim3i,j,公式为:[0028]E.利用用户对两个电影的评分,提出共同用户集合权重因子。设电影i的评分用户集合为I1,对电影j的评分用户集合为Ih可得两个电影之间的共同用户并集I1UI」,其共同用户集合权重因子Sim4i,j,将Jaccard相似度作为信任因子,公式为:[0030]F.利用电影i和电影j的共同用户集合Iinj,将共同用户集合考虑进新的相似度的计算中,得出公式:[0032]G.综合A、B、C、D、E、F的公式,总体的基于电影的相似性度量公式为:[0034]本发明的有益效果:[0035]本发明可以实现对电影评价的精确预测,可以依据用户兴趣为其推荐电影。附图说明[0036]图1基于电影的推荐算法模型图;图中用户与电影间的箭头连线表示用户对电影的关联关系,箭头连线的值表示用户对电影的兴趣度;电影与电影间的箭头连线表示电影间的关联关系,箭头连线的值表示两部电影间的相似度;根据用户对已评分电影的兴趣度和电影间的相似度,计算出用户对未评分电影的兴趣度,按兴趣度值大小进行降序排序,产生推荐列表;[0037]图2电影推荐准确率对比图;[0038]图3电影推荐召回率对比图。具体实施方式[0039]下面通过实施例对本发明进行具体描述,有必要在此指出的是以下实施例只是用于对本发明进行进一步的说明,不能理解为对本发明保护范围的限制,该领域的技术熟练人员根据上述发明内容所做出的一些非本质的改进和调整,仍属于本发明的保护范围。[0040]实施例I[0041]本实施例中,所选电影为《霍比特人》、《风语者》、《珍珠港》、《诸神之怒》、《宙斯之子》、《魔戒》和《战马》。下述步骤中电影i和电影j独立的选自上述几部电影。上述电影的评分获取于豆瓣网。[0042]1获取电影数据;所述电影数据为电影i和电影j的评价时间差At、单个用户对电影i和电影j各自的评分^和^、所有用户对电影i和电影j的平均评分,电影i和电影j两部电影中的最高评分max、电影i和电影j两部电影中的最小评分min、电影i和电影j各自的评分用户集合UPIj及两个电影之间的共同用户并集I1UIj;[0043]所述电影i为任意一部电影,所述电影j为任意一部不同于电影i的电影;[0044]2按照如下公式计算相似度:[0046]其中,[0052]其中,[0054]3将步骤⑵所得结果数据进行储存;[0055]4获取用户历史的电影,输出与其喜好的电影相似度最高的电影,并推荐给用户。[0056]将所得相似度定义为Wlj,计算准确率和召回率。公式如下:[0059]I指的是系统的电影集合,是电影之间的相似度。R⑴是根据电影在训练集上行为而产生的推荐列表,T⑴是电影在测试集上的行为列表。[0060]从图1中可知,用户对《霍比特人》兴趣度最高,将其推荐给用户将取得较好的推荐效果。对《宙斯之子》兴趣度则最低。[0061]利用传统的余弦相似度方法和Jaccard方法作为对照,进行同样的精确率和召回率的计算,结果如图2和图3所示。

权利要求:1.一种基于Time-Trust相似度的电影推荐方法,其特征在于,所述方法包括如下步骤:1获取电影数据;所述电影数据为电影i和电影j的评价时间差At、单个用户对电影i和电影j各自的评分rdPn、所有用户对电影i和电影j的平均评分,电影i和电影j两部电影中的最高评分max、电影i和电影j两部电影中的最小评分min、电影i和电影j各自的评分用户集合UPIj及两个电影之间的共同用户并集I1UIj;所述电影i为任意一部电影,所述电影j为任意一部不同于电影i的电影;⑵按照如下公式计算相似度:其中,⑶将步骤⑵所得结果数据进行储存;⑷获取用户历史的电影,输出与其喜好的电影相似度最高的电影,并推荐给用户。2.根据权利要求1所述的电影推荐方法,其特征在于,所述电影数据获取于电影网站。3.根据权利要求1所述的电影推荐方法,其特征在于,所述用户喜好的电影为该用户评分高的电影。

百度查询: 四川大学 一种基于Time-Trust相似度的电影推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。