买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于环境不平衡数据的水质预测方法_暨南大学_202110992226.4 

申请/专利权人:暨南大学

申请日:2021-08-27

公开(公告)日:2024-04-23

公开(公告)号:CN113744083B

主分类号:G06Q50/06

分类号:G06Q50/06;G06Q10/04;G06N20/20

优先权:

专利状态码:有效-授权

法律状态:2024.04.23#授权;2021.12.21#实质审查的生效;2021.12.03#公开

摘要:本发明公开了一种基于环境不平衡数据的水质预测方法,该方法包括:特征预处理步骤:对环境原始不平衡数据集进行去除标签信息缺失的样本数据,对环境原始不平衡数据的特征进行标准化得到多组原始训练集;特征扩增步骤:对每组原始训练集中的原始特征进行深度特征提取和标准化得到多组扩增训练集;模型筛选步骤:利用贪心算法筛选监督集成学习训练模型;待测预处理步骤:根据最佳特征组合进行采集数据得到待测原始数据;对待测原始数据进行特征扩增和标准化得到待测输入数据;水质预测步骤:利用水质预测模型进行判断水质是否合格。该方法通过特征扩增和特征选择来提升监督集成模型对环境不平衡数据的预测能力,对环境质量预测具有参考价值。

主权项:1.一种基于环境不平衡数据的水质预测方法,其特征在于,包括以下步骤:特征预处理步骤:对环境原始不平衡数据集进行去除标签信息缺失的样本数据,对环境原始不平衡数据的特征进行标准化,得到多组原始训练集;特征扩增步骤:对每组原始训练集中的原始特征进行深度特征提取和标准化得到多组扩增训练集;所述深度特征提取和标准化通过特征扩增模型实现,特征扩增模型为非监督模型;模型筛选步骤:利用贪心算法筛选监督集成学习训练模型,通过贪心算法比较不同特征组合预测结果,选择预测准确度最高的监督集成学习训练模型作为水质预测模型;所述通过贪心算法比较不同特征组合预测结果,具体包括:初始化步骤:输入样本矩阵X,设置循环轮次数值t为0,初始化第0轮的已选择特征集设置第0轮的未选择特征集S0={X1,X2,...,Xp},其中特征采样矩阵X=X1,X2,…,Xp,第i个特征Xi=xi1,xi2,…,xinT,i=1,2,…,p,其中,p为初始特征维度,n为样本个数;循环步骤:设置监督集成学习训练模型最佳预测能力比较参数Δ=0,Δ用于表示模型最佳预测能力之差;计算第t-1轮时最佳特征Xi∈St-1,其中Q*为模型预测能力值,*用于表示输入参数;设置第t轮时最佳特征集合At=At-1∪{Xbest};设置第t轮时除去最佳特征集合以外的剩余特征St=St-1{Xbest};计算第t轮与第t-1轮的模型最佳预测能力比较参数Δ=QAt-QAt-1,QAt为第t轮模型预测能力值,QAt-1为第t-1轮模型预测能力值;当Δ≤0时,退出循环步骤,输出Q值最高的已选择特征集作为特征组合;待测预处理步骤:根据最佳特征组合进行采集输入特征所需的水质数据、大气数据,从而得到待测原始数据,所述最佳特征组合为水质预测模型所对应的特征组合;对待测原始数据进行特征扩增和标准化得到待测输入数据;水质预测步骤:将待测输入数据输入至水质预测模型进行判断水质是否合格。

全文数据:

权利要求:

百度查询: 暨南大学 一种基于环境不平衡数据的水质预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。