买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于蜂群优化和孤立森林的电力数据清洗方法_福建省亿力信息技术有限公司_202311663233.5 

申请/专利权人:福建省亿力信息技术有限公司

申请日:2023-12-06

公开(公告)日:2024-03-19

公开(公告)号:CN117725050A

主分类号:G06F16/215

分类号:G06F16/215;G06F16/2458;G06F18/243;G06F18/2433;G06F18/26;G06N3/006;G06N20/20;G06Q50/06;G06F16/22;G06F18/10

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.05#实质审查的生效;2024.03.19#公开

摘要:本发明涉及数据处理领域,公开了一种基于蜂群优化和孤立森林的电力数据清洗方法,该方法包括:通过人工或流程自动化手段采集数据集;使用孤立森林算法计算样本异常分数,异常数据检测结果;以孤立森林的子采样数、特征数和最大树深度作为蜂群算法初始蜜源的位置向量,以K折交叉验证计算蜂群算法的目标函数;根据蜂群算法迭代更新孤立森林三种参数;重新构建孤立森林,计算得到检测精度分数,迭代蜜源位置;达到迭代终止条件后,获得最优的孤立森林模型,清洗异常数据。本发明针对电力数据中的异常数据清洗问题,使用基于蜂群算法优化和孤立森林的电力数据清洗方法,能够准确识别电力数据中的异常数据,对电力企业运营具有重要的意义。

主权项:1.一种基于蜂群优化和孤立森林的电力数据清洗方法,其特征在于,该方法包括以下步骤:步骤S1:通过人工或流程自动化手段采集和生成原始数据集;步骤S2:使用孤立森林算法生成孤立树集合构成的孤立森林,计算异常分数,获得异常数据检测初步结果;步骤S3:初始化蜂群参数,以孤立森林参数的子采样数、特征数和最大树深度作为蜂群算法可行解-蜜源的初始参数;步骤S4:根据k折交叉验证计算孤立森林的检测精度分数,根据所述检测精度分数计算蜂群算法适应度函数;步骤S5:根据蜂群算法迭代可行解-蜜源位置向量;根据可行解-蜜源位置更新孤立森林的子采样数、特征数和最大树深度;步骤S6:根据蜂群算法重新构建孤立森林,重复步骤S2-S4,计算样本异常分数,得到检测精度分数,迭代可行解-蜜源位置;步骤S7:达到蜂群算法迭代终止条件后,获得最优的孤立森林参数,根据最优孤立森林模型对异常数据进行清洗;所述步骤S6具体包括以下步骤:步骤S61:根据S5得到的孤立森林参数重新构建孤立森林,计算蜂群算法中的适应度函数;步骤S62:根据新的适应度函数,重复步骤S5,执行S5中蜂群算法的三个模块;步骤S63:判断是否满足蜂群算法的迭代终止条件,若满足跳转到步骤S7,否则重复步骤S61-S62;所述步骤S7的迭代终止条件为迭代次数,数据清洗方式为移除异常值,并加入异常标记。

全文数据:

权利要求:

百度查询: 福建省亿力信息技术有限公司 一种基于蜂群优化和孤立森林的电力数据清洗方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。