申请/专利权人:中国矿业大学
申请日:2024-01-12
公开(公告)日:2024-04-16
公开(公告)号:CN117892233A
主分类号:G06F18/2431
分类号:G06F18/2431;G06F18/2415;G06N3/047;G06N3/0895
优先权:
专利状态码:在审-公开
法律状态:2024.04.16#公开
摘要:本发明公开了一种基于多类别指数损失函数的不平衡数据软分类方法,步骤如下:加载不平衡数据类,并划分为训练集和测试集;根据样本权重Dm训练第m个弱学习器BLm;通过监督指标为BLm添加节点并计算当前样本权重下BLm的分类误差率errorm;若小于errorm‑1,则停止添加节点并计算BLm权重vm;更新样本权重Dm+1,开始BLm+1建模,若大于则继续添加节点,直到满足预设误差,建模过程结束。本发明采用上述的一种基于多类别指数损失函数的不平衡数据软分类方法,基于信息熵更新和Softmax的增量式软分类网络作为基分类器,引入不平衡样本权重并基于多类别指数损失函数自适应添加基分类器,得到可输出概率分布的强分类网络。
主权项:1.一种基于多类别指数损失函数的不平衡数据软分类方法,其特征在于,步骤如下:S1、加载不平衡数据类,样本数量为N,类别为M,识别数据集标签列,将其转化为0-1标签矩阵T,并将不平衡数据类划分为训练集和测试集;S2、根据样本权重Dm训练第m个弱学习器BLm;S3、由约束公式计算监督指标并添加最佳节点;S4、计算输出权重β*得到网络输出;S5、更新网络残差,评估当前建模情况;S6、更新目标函数,计算并判断模型的loss是否小于给定的容差ε,若小于给定的容差ε,则整体建模过程结束并更新样本权重,否则进入步骤S7;S7、计算当前样本权重的计算分类误差率。
全文数据:
权利要求:
百度查询: 中国矿业大学 一种基于多类别指数损失函数的不平衡数据软分类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。