买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于代价敏感分类算法的缓存方法及系统_华中科技大学;深圳市腾讯计算机系统有限公司_202110566053.X 

申请/专利权人:华中科技大学;深圳市腾讯计算机系统有限公司

申请日:2021-05-24

公开(公告)日:2024-04-30

公开(公告)号:CN113268458B

主分类号:G06F16/172

分类号:G06F16/172;G06F18/214;G06F18/241

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2021.09.03#实质审查的生效;2021.08.17#公开

摘要:本发明公开了一种基于代价敏感分类算法的缓存方法,具体提出了一种大小感知代价敏感的AdaBoostSAdaCost算法来预测对象是否会被再次访问,为了尽可能地提高预测性能,SAdaCost引入了两个代价参数,同时考虑了误分类会被再次访问的对象,以及误分类不会被再次访问的较大对象而造成的缓存开销;随后,本发明将SAdaCost与传统缓存置换策略S3LRU相结合,根据分类结果将对象放入S3LRU三段缓存的不同位置,提出了一种基于分类预测的高效缓存方法,在不改变缓存算法复杂度的同时提升缓存命中率;同时,本发明将机器学习的思想引入缓存也给缓存算法研究提供了一种新的研究思路。

主权项:1.一种基于代价敏感分类算法的缓存方法,其特征在于,包括以下步骤:1接收来自用户的访问请求,并根据该访问请求判断对应的对象是否在缓存中,如果是则转入步骤2,否则转入步骤5;其中缓存包括三段S1、S2和S3;2判断对象是否位于缓存的第一段S1中,如果是则将该对象移动到该第一段S1的头部,过程结束,否则转入步骤3;3判断对象是否位于缓存的第二段S2或者第三段S3中,如果是则将该对象移动到该段前一段的头部,过程结束,否则转入步骤4;4从后台数据库中读取该对象,并确定缓存中是否还有足够的空间存储该对象,如果是则转至步骤6,否则进入步骤5;5判断第一段S1或第二段S2的缓存大小是否超过预设长度阈值,如果是则将第一段S1或第二段S2尾部的对象移动到下一段的头部,并进入步骤6,否则进入步骤6;6判断第三段S3的缓存大小是否超过预设长度阈值,如果是则将第三段S3尾部的对象从缓存中删除,然后转入步骤7,否则转入步骤7;7将步骤1得到的访问请求对应的对象输入训练好的SAdaCost分类模型,以得到预测值,并判断预测值是否大于0,如果是则将该对象移动到第二段S2的头部,过程结束,否则将该对象移动到第三段S3的头部,过程结束;步骤7中使用的SAdaCost分类模型是通过以下步骤训练得到的:3-1获取训练数据集S={x1,y1,x2,y2,…,xn,yn},其中xi是第i个对象的特征,而yi是第i个对象的类标号,如果第i个对象实际会被再次访问,则yi=1,否则yi=-1,其中i∈[1,n],n为训练数据集中对象的总数;3-2将训练数据集S中的每个对象的权重D1i初始化为1;3-3设置计数器t=1;3-4判断t是否大于预设的迭代阈值T,如果是则进入步骤3-10,否则进入步骤3-5;3-5将训练数据集S中每个对象的权重D1i和特征xi输入SAdaCost分类模型,以得到每个特征xi对应的弱分类结果ftxi,所有特征对应的弱分类结果构成弱分类结果集合ftx;3-6根据步骤3-5得到的弱分类结果集合ftx计算其误差估值值εt:3-7根据步骤3-6得到的误差估值值εt获取权重更新参数αt:3-8根据步骤3-6得到的误差估值值εt和步骤3-7得到的权重更新参数αt获取第t+1次迭代过程中每个对象的权重Dt+1l:3-9设置t=t+1,并返回步骤3-4;3-10根据得到的T个弱分类结果集合生成最终的强分类结果Fx,将其作为训练好的SAdaCost分类模型。

全文数据:

权利要求:

百度查询: 华中科技大学;深圳市腾讯计算机系统有限公司 一种基于代价敏感分类算法的缓存方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。