买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于核心样本自适应扩充的小样本高光谱图像分类方法_西安邮电大学;陕西山河明泽生态环境技术咨询有限公司_202110244446.9 

申请/专利权人:西安邮电大学;陕西山河明泽生态环境技术咨询有限公司

申请日:2021-03-05

公开(公告)日:2024-03-29

公开(公告)号:CN112966740B

主分类号:G06V10/764

分类号:G06V10/764;G06V10/762;G06V10/774;G06V10/82;G06N3/0499;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.03.29#授权;2021.07.02#实质审查的生效;2021.06.15#公开

摘要:本发明涉及一种基于核心样本自适应扩充的小样本高光谱图像分类方法,首先对高光谱图像进行数据预处理,得到训练样本和测试样本;采用MCFSFDP聚类方法自适应确定测试样本中的核心样本;将核心样本加入至训练样本中,扩充得到训练样本集;将训练样本集代入至生成对抗网络中进行训练,生成与训练样本集数量一致的生成样本,并将生成样本加入至训练样本集中,扩充得到训练样本数据集;将训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型;将测试样本代入至最终的BP神经网络模型中,正向计算得到小样本高光谱图像的分类结果,通过对训练样本进行两次自适应样本扩充,有效提高了神经网络的泛化能力和小样本高光谱图像分类精度。

主权项:1.一种基于核心样本自适应扩充的小样本高光谱图像分类方法,其特征在于,包括:对高光谱图像进行数据预处理,得到训练样本和测试样本;采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本;将所述核心样本加入至所述训练样本中,扩充得到训练样本集;将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集;将所述训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型;将所述测试样本代入至所述最终的BP神经网络模型中,正向计算得到小样本高光谱图像的分类结果;所述将所述核心样本加入至所述训练样本中,扩充得到训练样本集,具体包括:将所述核心样本的数量定义为T;将所述核心样本加入到所述训练样本中进行扩充,得到训练样本集;由于所述训练样本的数量为M,所述核心样本的数量为T,则扩充后得到的训练样本集中训练样本的数量为M+T,将所述训练样本集记为所述将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集,具体包括:将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本;由于所述训练样本集中训练样本的数量为M+T,所述生成样本的数量也为M+T;将数量为M+T的所述生成样本加入至样本数量同为M+T的所述训练样本集中进行扩充,得到训练样本数量为2*M+T的训练样本数据集,将所述训练样本数据集记为所述方法在确定核心样本后,将核心样本加入至训练样本中,实现对训练样本的第一次扩充,得到训练样本集,然后又将训练样本集代入至生成对抗网络中训练,生成与训练样本集中样本数量相同的生成样本,再将生成样本加入至训练样本中,实现对训练样本的第二次扩充,通过基于核心样本对训练样本进行两次自适应样本扩充,实现对训练样本的质量和数量的同步提升;所述对高光谱图像进行数据预处理,得到训练样本和测试样本,具体包括:随机从高光谱图像R的每一个类别中选取5%的光谱像素点作为训练样本所述训练样本的数量表示为M,所述训练样本的尺寸为h×1,h为光谱数;将剩余95%的光谱像素点作为测试样本所述测试样本的数量表示为N;所述生成对抗网络包括生成器G和判别器D,所述生成器G用于捕捉潜在分布的真实数据并生成新的数据,所述判别器D是一个二值分类器,用于判断输入的训练样本的真实性;将所述训练样本集代入至生成对抗网络中进行训练,具体包括:假设真实数据x具备数据分布px且输入噪声变量具有一个先验pz,所述生成器接收一个输入噪声,并产生一个到虚假数据Gz空间的映射;Dx估计来自训练样本的真实数据x的概率;在生成对抗网络训练的优化过程中,所述判别器被训练为最大化logDx,被训练为最大化logDx的所述判别器为正确源分配正确标签的概率,此时所述生成器被训练为最小化log1-DGz,将生成对抗网络的优化问题作为一个求解极大极小的问题,则所述生成对抗网络的目标函数为: 其中,VD,G表示目标函数,E为期望运算符,G表示生成器,D表示判别器,z表示输入噪声,x表示真实数据,px表示数据分布,Gz表示虚假数据,Dx表示估算的来自训练样本的真实数据x的概率,logDx表示所述判别器被训练最大化,log1-DGz表示所述生成器被训练最小化;则计算所述生成器G的损失函数收敛值为: 其中,FD,G表示损失函数收敛值,fD,G表示优化后的损失函数收敛值,VD,G表示目标函数,E为期望运算符,G表示生成器,D表示判别器,z表示输入噪声,x表示真实数据,px表示数据分布,Gz表示虚假数据,Dx表示估算的来自训练样本的真实数据x的概率,logDx表示所述判别器被训练最大化,log1-DGz表示所述生成器被训练最小化;对所述训练样本集中的训练样本进行一次生成对抗网络训练,得到损失函数收敛值FD,G,若所述损失函数收敛值FD,G为r,则再次进行生成对抗网络训练,直到得到的损失函数收敛值FD,G>r时,即当FD,G=r+At时,At表示收敛增值,停止训练。

全文数据:

权利要求:

百度查询: 西安邮电大学;陕西山河明泽生态环境技术咨询有限公司 基于核心样本自适应扩充的小样本高光谱图像分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。