【发明公布】一种基于Spark和CS-FPtree的电网数据频繁模式挖掘方法_国网山西省电力公司大同供电公司_202311603744.8

申请/专利权人：国网山西省电力公司大同供电公司

申请日：2023-11-28

公开（公告）日：2024-03-12

公开（公告）号：CN117688056A

主分类号：G06F16/2458

分类号：G06F16/2458;G06Q50/06

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.03.29#实质审查的生效;2024.03.12#公开

摘要：本发明提供一种基于Spark和CS‑FPtree的电网数据频繁模式挖掘方法，属于电网数据频繁模式挖掘技术领域；所要解决的技术问题为：提供一种基于Spark和CS‑FPtree的电网数据频繁模式挖掘方法的改进；解决该技术问题采用的技术方案为：构建SparkSession对象和SprakConf对象，配置资源需求参数，从HDFS中加载电网用户数据集，创建DataFrame的实例数据；创建处理器对实例数据进行特征编码和数据分箱处理，生成二值化全域事务项集；定义二值过滤器，对值为1的项填充名称，设定最小支持度筛选项集，生成事务项频繁基和局域事务项集；定义CS‑FPtree生成器，生成有效事务项集的前缀模式树，根据频繁基生成前缀路径表；本发明应用于电网数据挖掘。

主权项：1.一种基于Spark和CS-FPtree的电网数据频繁模式挖掘方法，其特征在于：包括如下的数据挖掘步骤：步骤1：构建SparkSession对象和SprakConf对象，配置资源需求参数，从HDFS中加载电网用户数据集，创建DataFrame的实例df数据；步骤2：创建处理器对实例df数据进行特征编码和数据分箱处理，生成二值化全域事务项集；步骤3：创建SparkContext对象sc，调用parallelize并行化方法生成事务项，定义二值过滤器，对值为1的项填充名称，设定最小支持度筛选项集，生成事务项频繁基和局域事务项集；步骤4：定义CS-FPtree生成器，生成有效事务项集的前缀模式树，根据频繁基生成前缀路径表；步骤5：定义子集生成器，生成前缀路径表中各条路径的子集，聚合路径权值，去除不满足最小支持度的子集，得到频繁模式集，对电网数据进行挖掘。

全文数据：

权利要求：

百度查询：国网山西省电力公司大同供电公司一种基于Spark和CS-FPtree的电网数据频繁模式挖掘方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

下一篇：一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

相关技术

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

一种耐泥沙高密封性水泵控制阀_国电龙达电力设备(天津)有限责任公司_202322437322.X

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

龙图腾网&IPTOP

【发明公布】一种基于Spark和CS-FPtree的电网数据频繁模式挖掘方法_国网山西省电力公司大同供电公司_202311603744.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务