买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种HDFS小文件优化及分析处理的方法及装置_上海浦东发展银行股份有限公司_202311260573.3 

申请/专利权人:上海浦东发展银行股份有限公司

申请日:2023-09-26

公开(公告)日:2024-02-06

公开(公告)号:CN117520270A

主分类号:G06F16/16

分类号:G06F16/16;G06F16/182

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.02.27#实质审查的生效;2024.02.06#公开

摘要:本说明书涉及计算机技术领域,尤其涉及一种HDFS小文件优化及分析处理的方法及装置。包括从Hadoop文件系统中获取Fsimage元数据文件并解析得到文件信息;按照业务处理逻辑中各处理步骤对应的处理文件位置对文件信息进行归类,得到多个文件区;在执行业务处理逻辑中的处理步骤后,针对执行的处理步骤对应的文件区,根据文件大小以及预定阈值确定文件区中的小文件信息,对小文件信息对应的文件进行合并,在执行下一个处理步骤时,对合并小文件后的文件进行处理。通过本说明书的方法,在业务处理逻辑的每个步骤执行后对该步骤对应处理文件位置处的小文件进行合并,提高下一个处理步骤的处理效率,从而提高系统整体的处理效率。

主权项:1.一种HDFS小文件优化及分析处理的方法,其特征在于,所述方法包括:从目标Hadoop文件系统中获取Fsimage元数据文件,并解析所述Fsimage元数据文件,得到所述目标Hadoop文件系统中文件的存储位置信息以及文件大小,并将所述存储位置信息以及大小作为文件信息;按照所述目标Hadoop文件系统中业务处理逻辑中各处理步骤对应的处理文件位置对所述文件信息进行归类,得到所述业务处理逻辑中多个处理步骤对应的文件区;在执行所述业务处理逻辑中的处理步骤后,针对执行的所述处理步骤对应的文件区,根据所述文件大小以及所述文件区对应的预定阈值确定所述文件区中的小文件信息,并对所述小文件信息对应的所述目标Hadoop文件系统中的文件进行合并,以便于在执行该处理步骤的下一个处理步骤时,对合并小文件后的文件进行处理。

全文数据:

权利要求:

百度查询: 上海浦东发展银行股份有限公司 一种HDFS小文件优化及分析处理的方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。