买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于供应链的采购业务数据自动汇总方法_申合信科技集团有限公司_202311856793.2 

申请/专利权人:申合信科技集团有限公司

申请日:2023-12-29

公开(公告)日:2024-04-09

公开(公告)号:CN117851429A

主分类号:G06F16/23

分类号:G06F16/23;G06F16/215;G06F16/2453;G06F16/2457

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明公开了一种基于供应链的采购业务数据自动汇总方法,涉及供应链数据汇总技术领域,现如今供应链数据汇总中,供应链是一个动态的系统,业务数据随时可能发生变化,当对原始数据进行汇总期间,新的数据再次插入,当数据得到更新后,数据的汇总需要重新的进行汇总处理,这将导致数据汇总的响应速度慢,且需要耗费较多的时间,本发明通过并行处理和增量处理方式,能够高效地处理大规模的数据集和快速更新统计数据。这样可以减少整体处理时间和计算资源的消耗,其次通过增量处理和更新统计数据的方式,可以实时地将新数据的信息合并到统计数据中,使得统计结果及时准确,保持与最新数据的同步。

主权项:1.一种基于供应链的采购业务数据自动汇总方法,其特征在于:包括以下步骤:S1,数据收集,对采购数据进行收集,其中包括采购订单、采购合同、采购发票和物流单据进行调取,确立收集获取来源,内部系统记录数据;S2,数据清洗,对获取的采购数据进行清洗和预处理,去除重复记录,并从中处理缺失值,最后对数据进行格式的统一化;S3,数据分区,将原始数据根据数据属性,键值范围划分成多个数据分区,基于可用的计算资源和性能需求,结合数据规模,决定合适的分区数量;并行数据处理引擎,选择并行计算框架ApacheSpark进行处理,配置并行处理引擎,确保分区数据可以被并行处理,并充分利用计算资源;并行数据处理,在每个分区内,使用归并排序对分区内的数据进行排序。这一步骤在每个并行计算节点上独立进行,将局部排序后的分区进行合并。这可以通过使用归并操作,将不同分区的数据逐个比较,然后按照排序顺序合并为一个有序数据集,对合并后的有序分区进行最终的合并操作,以获得完全有序的数据集;并行归并排序的算法公式:输入:待排序的数据集D,并行计算资源P;将数据集D划分为P个分区:D1,D2,...,DP;在每个分区Di上独立应用串行排序算法对其进行排序:Di'=SortDi;使用并行计算资源将排序后的分区进行合并:每个并行计算节点i负责合并相邻的两个分区Di'和Di+1',并生成新的有序分区Di”;Di是原始分区数据,Di'是排序后的分区数据;重复上述步骤,直到只有一个有序分区剩下,将最终的有序分区输出为排序结果;S4,关联判断和处理,在并行处理的同时,对新插入的数据进行关联判断,并确定与原始数据之间的关联关系;存在关联,将新数据纳入原有的数据处理流程中进行增量处理;不存在关联,则将原始数据锁定,并忽略新数据的插入;S5,并行结果合并,并行处理完成后,各个数据分区的处理结果进行合并;对于需要汇总的指标或数据,使用合适的聚合函数将结果合并为一个整体结果;S6,可视化报告生成,基于最终的数据结果,生成可视化报告,用于展示数据分析和结论;报告中包含相关的图表、图形和文字,以清晰地传达数据分析的结果和洞察。

全文数据:

权利要求:

百度查询: 申合信科技集团有限公司 一种基于供应链的采购业务数据自动汇总方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。