买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】数据可视化时考虑异常值的企业数据集处理方法及系统_广州数说故事信息科技有限公司_202110616591.5 

申请/专利权人:广州数说故事信息科技有限公司

申请日:2021-06-02

公开(公告)日:2024-03-19

公开(公告)号:CN113486003B

主分类号:G06F16/22

分类号:G06F16/22;G06F16/26;G06Q10/0637

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2021.10.26#实质审查的生效;2021.10.08#公开

摘要:本发明提出一种数据可视化时考虑异常值的企业数据集处理方法及系统,解决了在企业数据可视化时,考虑到异常值,传统处理企业数据集的方法容易造成数据失真,无法兼顾数据可读性与数据保真度的问题,本发明首先对企业待渲染数据集中的数据处理,构建出有序数组,然后对其进行预处理操作得到新的数组,对新数组中的数据进行编号,形成编号对应的数组,编号对应的数组符合理想的均匀分布,能保证最平均的可视化效果,初步对可能存在的异常值进行处理,然后对该数组进行一系列计算,构建最终用于数据可视化的企业渲染数据集数组,失真度小,提高了数据可视化图表的可读性,也进一步提高企业的风险规避能力,有利于企业做出正确的决策。

主权项:1.一种数据可视化时考虑异常值的企业数据集处理方法,其特征在于,至少包括:S1.采集待渲染企业数据,确定企业待渲染数据集,将企业待渲染数据集中的数据在数轴上按从大到小顺序排列,构建出有序数组a;S2.对有序数组a进行预处理操作,得到新的数组a1;所述有序数组a中的元素为企业数据集中的待渲染企业数据,步骤S2中对有序数组a进行预处理操作的过程为:设有序数组a中元素的表示为[a1,a2,…,ai,…,an],其中,n表示元素的个数,也指企业数据集中待渲染企业数据的个数,设有序数组a中元素的最小值为amin,将有序数组a中的每一个元素值均减去有序数组a中元素的最小值amin,得到新的数组a1,表示为[a1-amin,a2-amin,…,ai-amin,…,an-amin];S3.对数组a1中的数据进行编号:确定编号步长,对数组a1中的数据按从大到小进行编号;对应的编号形成数组b;当数组a1中的相邻数据相同时,相邻数据对应的编号相同,但后续的编号仍继续保持增长,最终对应的编号形成数组b;S4.对数组b进行线性计算,构建与数组a1区间长度匹配的数组c;设数组b表示为[b1,b2,…,bi,…,bn],步骤S4中所述的对数组b进行线性计算是对数组b中每一个元素进行线性计算,对数组b中的第i个元素bi进行线性计算的表达式为:ci=bi*a1max-a1mina1length其中,ci表示对数组b中的第i个元素bi进行线性计算得到对应的数组c中的第i个元素,数组c表示为[c1,c2,…,ci,…,cn];a1max表示数组a1中元素的最大值;a1min表示数组a1中元素的最小值,a1length表示数组a1中元素的个数;S5.利用数组c中的数据与数组a1中的数据进行计算,构建最终用于数据可视化的企业渲染数据集数组d;设数组c中的第i个元素表示为ci,数组a1中的第i个元素表示为ai-amin,利用数组c中的第i个元素与数组a1中的第i个元素进行计算的公式为: 其中,di表示用于数据可视化的企业渲染数据集数组d中的第i个元素数据值。

全文数据:

权利要求:

百度查询: 广州数说故事信息科技有限公司 数据可视化时考虑异常值的企业数据集处理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。