买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于具有万有逼近性质的神经网络架构的图像分类方法_北京大学_202410015446.5 

申请/专利权人:北京大学

申请日:2024-01-05

公开(公告)日:2024-04-16

公开(公告)号:CN117893804A

主分类号:G06V10/764

分类号:G06V10/764;G06V10/82;G06N3/045;G06N3/084

优先权:

专利状态码:在审-公开

法律状态:2024.04.16#公开

摘要:本发明公布了一种基于具有万有逼近性质的神经网络架构的图像分类方法,将图像分类任务进行优化建模,采用基于梯度的一阶优化算法进行模型求解;其中的梯度项采用神经网络中的可学习模块T表示,得到图像分类神经网络;训练模型;将待分类的图像输入到训练好的图像分类深度神经网络模型,即可输出图像的类别标签,实现图像分类,图像分类精度更高。采用本发明的技术方案,可高效、节能地设计有性能保障的神经网络架构,并运用于图像分类、信号处理、神经网络学习优化等应用领域。

主权项:1.一种基于具有万有逼近性质的神经网络架构的图像分类方法,其特征是,包括如下步骤:1进行图像预处理,分别得到训练图像数据和待分类图像数据并进行数据增强;2构建图像分类深度神经网络模型,模型的输入为单张或批量彩色图像,输出为图像的类别标签;包括如下过程:21将图像分类任务进行优化建模,采用基于梯度的一阶优化算法进行模型求解;首先将基于梯度的一阶优化算法转换为标准的串行更新格式,从而得到图像分类模型的一般结构;再将一阶优化算法中的梯度项采用神经网络的可学习模块表示,从而设计具有万有逼近性质的神经网络架构,使得利用一阶优化算法结构扩展可设计的神经网络架构种类;具体对于一个图像分类任务,其能量函数表示为其中是输入图片,x是图片所属的类别;算法优化目标为每张图片所属的类别x使得能量函数的值最小;记为fx,即f是输入图片为的能量函数;确定图片即求解优化目标:选用基于梯度的一阶优化算法求解表示为: 其中,t表示优化算法更新的轮次总数,t=0,1,2,…;xl表示第l轮更新的图片所属类别,x0即表示初值;表示f的梯度,均是优化算法中定义的步长参数;选用基于邻近算子的算法求解近邻算子表示为: 其中,Prox是邻近算子;f是给定输入图片的能量函数;λ是可变的系数,即邻近算子的步长系数;||·||2表示二范数;argmin表示取得最小值的数值点;进一步转换表示形式为: 其中,表示等价;t表示优化算法更新的轮次;xt、xt+1分别表示第t轮和第t+1轮更新得到的图片类别;表示f的梯度;上述过程将图像分类模型表示成式1的结构;22将基于梯度的一阶优化算法的梯度项采用神经网络中的可学习模块T表示,即进行参数化得到图像分类神经网络,表示为: zL+1=WL+1zL+bL+1其中,i表示第i层神经元,zk表示第k层神经元的净活性值,L+1为神经网络的总层数,为步长参数;表示对于更新第k+1层神经元净活性值zk+1的和第i层神经元相关的可学习模块;23根据图像分类任务改进可学习模块T,使得设计的图像分类神经网络具有万有逼近性质并提高神经网络的图像分类性能;具体设置可学习模块其中表示和相关权重参数,表示和相关的偏置参数,σ表示非线性激活函数;3利用训练图像数据对构建的图像分类神经网络模型进行训练,得到训练好的图像分类深度神经网络模型;4将待分类的包含预定义类别的彩色图像输入到训练好的图像分类深度神经网络模型,即可输出图像的类别标签,实现图像分类。

全文数据:

权利要求:

百度查询: 北京大学 基于具有万有逼近性质的神经网络架构的图像分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。