买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于代价敏感深度级联森林的饮用水质预测方法及系统_暨南大学_202110992331.8 

申请/专利权人:暨南大学

申请日:2021-08-27

公开(公告)日:2024-04-16

公开(公告)号:CN113723679B

主分类号:G06Q10/04

分类号:G06Q10/04;G06N20/00;G06F18/241;G06F18/214

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.12.17#实质审查的生效;2021.11.30#公开

摘要:本发明公开了一种基于代价敏感深度级联森林的饮用水质预测方法及系统,该方法包括以下步骤:数据采集步骤:采集饮用水质原始数据,饮用水质原始数据包括水质参数;数据预处理步骤:对饮用水质原始数据进行数据清洗、标准化数据,得到水质预处理数据;预测步骤:将水质预处理数据输入到水质预测模型进行预测水质是否合格;水质预测模型为使用多组数据通过机器学习训练得出,多组数据中的每组数据包括饮用水质训练数据和标识该水质训练数据是否合格的标签信息;本发明通过设置不平衡代价矩阵以引入代价敏感因子进而提升模型预测不平衡数据能力,对水质预测具有较高的准确性。

主权项:1.一种基于代价敏感深度级联森林的饮用水质预测方法,其特征在于,包括以下步骤:数据采集步骤:采集饮用水质原始数据,饮用水质原始数据包括水质参数,所述水质参数包括pH、温度、浊度、电导率、重金属、氯化物、硫酸盐、溶解性氧;数据预处理步骤:对饮用水质原始数据进行数据清洗、标准化数据,得到水质预处理数据;预测步骤:将水质预处理数据输入到水质预测模型进行预测水质是否合格;所述水质预测模型为使用多组数据通过机器学习训练得出,多组数据中的每组数据包括饮用水质训练数据和标识该水质训练数据是否合格的标签信息;所述水质预测模型为使用多组数据通过机器学习训练得出,具体包括以下步骤:步骤S100、构建代价敏感基分类器:引入代价敏感因子进行构建代价敏感基分类器,具体通过直接引入代价矩阵的形式来表示代价敏感基分类器的代价敏感;所述代价矩阵为不平衡代价矩阵,用于把少数类样本分类错误的代价设置远高于多数类样本错分代价;步骤S200、构建代价敏感深度级联森林:代价敏感深度级联森林为多层结构,每一层设有多个估计器,其中每一层估计器的类型和数目都相同,所述估计器包括多个代价敏感基分类器;步骤S300、饮用水质数据前处理:对饮用水质原始数据进行清洗并标准化数据;步骤S400、代价敏感深度级联森林训练:对前处理后的水质数据进行K折划分训练集和验证集,设置预测目标函数,基于训练集进行训练,优化预测目标函数并固定超参,其中将k-1折数据作为训练集并用来训练模型,将剩余的1折数据作为验证集并用于验证模型;在步骤S400中,所述预测目标函数表示为: 式y为用于表示水质是否合格的标签信息,其中表示对第j类标签信息的预测准确概率,i表示第i个数据,j表示第j类标签信息,n表示数据总数,Cij表示i个数据和j类标签信息的代价矩阵;步骤S500、代价敏感深度级联森林的验证:使用验证集的水质数据来验证模型,比较不同代价矩阵下代价敏感深度级联森林的预测能力,筛选最优代价矩阵,进而得到水质预测模型;所述水质预测模型通过设置不平衡代价矩阵以引入代价敏感因子。

全文数据:

权利要求:

百度查询: 暨南大学 基于代价敏感深度级联森林的饮用水质预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。