买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于磁带的海量小文件的快速归档恢复系统_北京天华星航科技有限公司_202311062506.0 

申请/专利权人:北京天华星航科技有限公司

申请日:2023-08-22

公开(公告)日:2024-03-01

公开(公告)号:CN117076387B

主分类号:G06F16/11

分类号:G06F16/11;G06F16/13;G06F18/2321;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.03.01#授权;2023.12.05#实质审查的生效;2023.11.17#公开

摘要:本发明提供了一种基于磁带的海量小文件的快速归档恢复系统,包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:根据目标文件分别和每一历史文件之间的相似度,确定出与目标文件最相似的历史文件作为参考文件,根据参考文件对应的访问频率,确定出至少一个目标文件子集合,将每一目标文件子集合内的所有目标文件合并,得到存储文件,将所有存储文件存储至待存储的磁带中,能够根据文件的相似性确定目标文件的参考文件,进而确定目标文件的参考访问频率,聚类能够使相近访问频率的目标文件合并,降低并行访问目标文件时读取存储文件的次数,并且降低磁带存储时磁带碎片的产生,从而提高文件存储和访问的效率。

主权项:1.一种基于磁带的海量小文件的快速归档恢复系统,其特征在于,所述系统包括:目标文件集合、历史文件集合、待存储的磁带,处理器和存储有计算机程序的存储器,其中,所述目标文件集合包括至少一个目标文件,所述历史文件集合包括至少一个历史文件及其对应的访问频率,当所述计算机程序被处理器执行时,实现以下步骤:S10,针对任一目标文件,根据所述目标文件分别和每一历史文件之间的相似度,确定出与所述目标文件之间的相似度最大的历史文件,作为所述目标文件对应的参考文件,其中,在S10步骤中还包括如下步骤:S101,获取每一历史文件的历史文件描述信息;S102,根据历史文件描述信息之间的差异,对所有历史文件进行聚类,得到至少一个历史文件聚类集合;S103,确定每一历史文件聚类集合的聚类中心为第一文件;S104,针对任一目标文件,根据所述目标文件分别和每一第一文件之间的相似度,确定出与所述目标文件最相似的第一文件,作为所述目标文件对应的参考文件;S20,将所述参考文件对应的访问频率作为所述目标文件对应的参考访问频率;S30,根据所有目标文件对应的参考访问频率,确定出至少一个目标文件子集合,所述目标文件子集合中的所有目标文件对应的参考访问频率中最大值和最小值的差值小于预设的阈值,其中,在S30步骤中还包括如下步骤:S301,将所述阈值和预设的第一权重相乘,确定相乘结果为聚类半径;S302,根据所述聚类半径和所有目标文件对应的参考访问频率,对所有目标文件进行聚类处理,得到至少一个文件集合;S303,若存在一目标文件未分最终文配至任一文件集合中,则调整所述阈值,返回执行所述将所述阈值和预设的第一权重相乘,确定相乘结果为聚类半径的步骤,直至任一目标文件均有所属的文件集合,得到至少一个最终文件集合,确定每一件集合为所述目标文件子集合;S40,针对任一目标文件子集合,将所述目标文件子集合内的所有目标文件合并,得到所述目标文件子集合对应的存储文件;S50,将所有存储文件存储至所述待存储的磁带中。

全文数据:

权利要求:

百度查询: 北京天华星航科技有限公司 基于磁带的海量小文件的快速归档恢复系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。