【发明授权】一种基于贝叶斯神经网络权重约束的图像分类方法_电子科技大学_202110560871.9 

申请/专利权人:电子科技大学

申请日:2021-05-19

公开(公告)日:2022-08-12

公开(公告)号:CN113240025B

主分类号:G06V10/764

分类号:G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06N5/04;G06N7/00

优先权:

专利状态码:有效-授权

法律状态:2022.08.12#授权;2021.08.27#实质审查的生效;2021.08.10#公开

摘要:本发明公开了一种基于贝叶斯神经网络权重约束的图像分类方法,包括以下步骤:S1:采集待处理图像数据集,将待处理图像数据集划分为训练集和测试集;S2:搭建贝叶斯神经网络;S3:训练贝叶斯神经网络,对贝叶斯神经网络的权重参数进行衰减;S4:提取贝叶斯神经网络各层的权重参数,若贝叶斯神经网络的分类性能达到设定阈值且各层的权重参数分布位于设定期望阈值内,则完成对贝叶斯神经网络的权重约束;否则返回步骤S3,继续训练贝叶斯神经网络;S5:对待处理图像数据集进行分类。本发明在贝叶斯神经网络的训练阶段使用L2正则化,以改变网络权重参数的分布,将其约束至较小的范围。

主权项:1.一种基于贝叶斯神经网络权重约束的图像分类方法,其特征在于,包括以下步骤:S1:采集待处理图像数据集,将待处理图像数据集划分为训练集和测试集,并对其进行数据增强的预处理操作;S2:根据预处理后的待处理图像数据集,搭建用于图像分类任务的贝叶斯神经网络;S3:基于变分推理方法,利用训练集训练贝叶斯神经网络,使用L2正则化对贝叶斯神经网络的权重参数进行衰减,实现对贝叶斯神经网络的初步权重约束,并评估初步权重约束后的贝叶斯神经网络的分类性能;S4:基于测试集,提取初步权重约束后的贝叶斯神经网络各层的权重参数,若初步权重约束后的贝叶斯神经网络的分类性能达到设定阈值且各层的权重参数分布位于设定期望阈值内,则完成对贝叶斯神经网络的权重约束;否则返回步骤S3,继续训练贝叶斯神经网络并进行权重约束;S5:利用权重约束后的贝叶斯神经网络对待处理图像数据集进行分类;所述步骤S3包括以下子步骤:S31:假设变分后验分布为高斯分布,变分参数为θ=μ,ρ,其中,μ表示均值参数,ρ表示标准差参数;S32:从高斯分布μ,ρ中采样得到贝叶斯神经网络权重参数w的样本;S33:基于变分推理方法,寻找使后验分布和可变分布qw|θ之间的KL散度最小的新变分参数θ*,表示训练集数据;S34:利用蒙特卡罗法,将求解新变分参数θ*的过程转化为目标函数的形式,并记为贝叶斯神经网络的初始损失函数J0;S35:将L2范数作为约束条件,在初始损失函数J0中添加约束项Ωθ,得到损失函数S36:利用梯度下降法,训练贝叶斯神经网络,迭代更新变分参数θ,直至贝叶斯神经网络的整体误差小于阈值或达到预定的迭代次数,取得新变分参数θ*的集合;S37:基于训练获得的新变分参数θ*,获得基于L2正则化训练后贝叶斯神经网络的权重参数w*,实现对贝叶斯神经网络的初步权重约束;所述步骤S32中,贝叶斯神经网络权重参数w的样本通过采样单位高斯分布ε~N0,1,按均值参数μ进行平移,并按非负标准差参数σ进行缩放获得,其计算公式为: 其中,表示逐点乘法,σ=log1+expρ,log·表示对数运算,exp·表示指数运算;所述步骤S33中,新变分参数θ*的计算公式为: 其中,argminθ表示变分参数θ取最小值运算,DKL表示KL散度,表示后验分布,qw|θ表示可变分布;所述步骤S34中,贝叶斯神经网络的初始损失函数J0的计算公式为: 其中,fw,θ表示目标函数的表达形式,log·表示对数运算,表示训练集数据,Pw表示权重参数w的先验分布,表示给定权重参数w后训练数据的似然分布;所述步骤S35中,约束项Ωθ的表达式为: 其中,θi为变分参数θ的各个分量;损失函数的表达式为: 其中,λ表示正则化系数。

全文数据:

权利要求:

百度查询: 电子科技大学 一种基于贝叶斯神经网络权重约束的图像分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。