首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于AutoML的电网大数据分析方法及自动化建模系统_国网山东省电力公司电力科学研究院_202410195354.X 

申请/专利权人:国网山东省电力公司电力科学研究院

申请日:2024-02-22

公开(公告)日:2024-05-17

公开(公告)号:CN117767579B

主分类号:H02J13/00

分类号:H02J13/00;G06F18/213;G06Q50/06;H02J3/00

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.04.12#实质审查的生效;2024.03.26#公开

摘要:基于AutoML的电网大数据分析方法及自动化建模系统,属于大数据领域,包括电网数据采集模块、数据预处理模块、特征工程模块、自动化建模与评估模块、自动化部署与实时监测模块、用户界面模块,电网数据采集模块用于采集电网数据,数据预处理模块用于电网数据的预处理,特征工程模块用于电网数据的特征提取变换,自动化建模与评估模块用于电网大数据的自动化建模,自动化部署与实时检测模块用于自动部署并实时检测建立的模型,用户界面模块用于提供用户与系统的交互界面。本发明提出改进自然梯度非循环特征提取算法对电网数据进行特征提取,提出改进多算子超参数正则化AutoML算法对电网大数据进行自动化建模,为基于AutoML的电网大数据分析方法及自动化建模系统提供更优的方案。

主权项:1.基于AutoML的电网大数据分析及自动化建模系统,包括电网数据采集模块、数据预处理模块、特征工程模块、自动化建模与评估模块、自动化部署与实时监测模块和用户界面模块,电网数据采集模块用于采集电网系统中的数据,数据预处理模块用于对采集的电网数据进行预处理,特征工程模块包括特征提取单元和特征变换单元,特征提取单元提出改进自然梯度非循环特征提取算法对电网数据进行特征提取,特征变换单元用于对电网数据特征进行变换,自动化建模与评估模块包括AutoML建模单元和模型评估与验证单元,AutoML建模单元提出改进多算子超参数正则化AutoML算法对电网大数据进行自动化机器学习建模,模型评估与验证单元用于对训练后的模型进行评估与验证,自动化部署与实时监测模块包括自动化部署与集成单元和实时监测与反馈单元,自动化部署与集成单元用于将训练好的模型自动部署到电网系统中,实时监测与反馈单元用于对部署的模型进行实时监测并提供反馈机制,用户界面模块用于提供用户与系统的交互界面;特征提取单元提出改进自然梯度非循环特征提取算法对电网数据进行特征提取,从原始数据中抽取有价值的信息,转化为可供机器学习模型学习的特征;改进自然梯度非循环特征提取算法具体如下:定义电网数据集为D,D由输入特征与输出结果组成,输入矩阵为其中,I为电网数据集的所有输入特征,m为电网数据集中的样本数量,n为每个样本的特征数量,I11为电网数据中第1个样本的第1个特征,I12为电网数据中第1个样本的第2个特征,I1n为电网数据中第1个样本的第n个特征,I21为电网数据中第2个样本的第1个特征,I22为电网数据中第2个样本的第2个特征,I2n为电网数据中第2个样本的第n个特征,Im1为电网数据中第m个样本的第1个特征,Im2为电网数据中第m个样本的第2个特征,Imn为电网数据中第m个样本的第n个特征,输出结果为其中,O为输出结果向量,O1为第1个输出结果向量,O2为第2个输出结果向量,Om为第m个输出结果向量,因此电网数据集为为了追踪到电网数据的特定特征,同时使电网数据集的特征和输出结果之间的关系更加清晰,提出有向无环图将电网数据集为D改进为D',即其中,D'为改进后的电网数据集,提出非循坏约束和拉普拉斯矩阵对电网数据特征提取目标公式进行转换,即其中,Q为特征提取目标公式,n为每个样本的特征数量,SD;I为损失函数,即模型对数据集D进行拟合的程度,ρ为模型的正则化参数,hD为电网数据集D平滑函数,tr·为拉普拉斯矩阵的迹,hDT为hD的转置,M为拉普拉斯矩阵,然后提出拉格朗日乘数法对目标公式Q进行问题转化,即其中,LD,λ为拉格朗日形式的目标函数,λ为拉格朗日乘子,然后通过梯度更新对LD,λ进行求解,提出引入Fisher信息矩阵的自然梯度法对LD,λ进行求解,自然梯度法更新规则为其中,Dk为第k次迭代后的电网数据集D的更新值,Dk+1为第k+1次迭代后的电网数据集D的更新值,α为学习率,为电网数据集D的Fisher信息矩阵的估计,为拉格朗日形式的目标函数LD,λ关于Dk的梯度,λk为第k次迭代后的拉格朗日乘子λ的更新值,λk+1为第k+1次迭代后的拉格朗日乘子λ的更新值,为拉格朗日乘子λ的Fisher信息矩阵的估计,为拉格朗日形式的目标函数LD,λ关于λk的梯度,提出点互信息来计算特征间因果强度,电网数据中有两个特征,分别为X和Y,则特征间因果强度其中,CX,Y为特征X对于特征Y的因果强度,即点互信息,PX,Y为特征X与特征Y同时发生的概率,m为电网数据集中的样本数量,PX为特征X发生的概率,PY为特征Y发生的概率,log·为对数运算;AutoML建模单元提出改进多算子超参数正则化AutoML算法通过自动化流程对电网大数据进行建模;改进多算子超参数正则化AutoML算法具体如下:电网数据集为D,算子序列为OS=OS1,OS2,…,OSz,其中,OS为算子序列,OS1为算子序列OS中的第1个算子,OS2为算子序列OS中的第2个算子,OSz为算子序列OS中的第z个算子,算子序列OS中的每个算子OSi都有一组可用的AutoML算法,即其中,OSi为算子序列OS中的第i个算子,为没有特定算法,为算子OSi的第1个可用AutoML算法,为算子OSi的第2个可用AutoML算法,为算子OSi的第n个可用AutoML算法,ni为第i个算子可用AutoML算法的数量,所有算子的所有可用AutoML算法的超参数空间集合为其中,为第1个算子的第1个可用AutoML算法,为第1个算子的第2个可用AutoML算法,为第1个算子的第n个可用AutoML算法,为第2个算子的第1个可用AutoML算法,为第2个算子的第2个可用AutoML算法,为第2个算子的第n个可用AutoML算法,为第z个算子的第1个可用AutoML算法,为第z个算子的第2个可用AutoML算法,为第z个算子的第n个可用AutoML算法,然后通过最大化所选的准确度度量F来确定最佳的机器学习管道配置,为避免过度拟合训练数据,并提高算法的泛化能力,提出正则化项对最佳的机器学习管道配置函数进行改进,即其中,为改进后的最佳机器学习管道配置函数,γ为超参数,A1,λ为第1个算子的超参数配置,Az,λ为第z个算子的超参数配置,A1,λ,...,Az,γ*为最佳机器学习管道配置,N为机器学习管道配置的个数,为第N个机器学习管道配置,为正则化项,D为电网数据集,为提升算法在搜索空间中的优化能力,提出引入权重函数对最大化期望值进行改进,则下一步的机器学习设置为其中,BP'为下一步的机器学习设置,BP为当前的机器学习设置,space为算法的搜素空间,wΔ为引入的权重函数,Pp为性能提升的概率分布,UPp为实际提升和已找到的最佳提升之间的期望差距,dPp积分的微元。

全文数据:

权利要求:

百度查询: 国网山东省电力公司电力科学研究院 基于AutoML的电网大数据分析方法及自动化建模系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。