【发明授权】一种基于递归解码器的显著性检测方法_中南大学_202210620648.3

导航：龙图腾网> 最新专利技术> 一种基于递归解码器的显著性检测方法_中南大学_202210620648.3

申请/专利权人：中南大学

申请日：2022-06-02

公开（公告）日：2024-04-26

公开（公告）号：CN114937154B

主分类号：G06V10/46

分类号：G06V10/46;G06V10/44;G06V10/20;G06V10/80;G06V10/82;G06N3/045;G06N3/044;G06N3/0464;G06N3/084;G06N3/0985

优先权：

专利状态码：有效-授权

法律状态：2024.04.26#授权;2022.09.09#实质审查的生效;2022.08.23#公开

摘要：本发明公开了一种基于递归解码器的显著性检测方法，主要解决现有技术显著性检测结果准确率低，显著性主体判断错误与边缘模糊的问题。其实施方案为：1获取数据集与检测标签；2构建检测模型；3构建损失函数；4训练检测模型；5推理并获得检测结果。本发明构建的显著性检测模型，通过多次全尺度特征融合与边缘强化，实现了多尺度特征的充分利用与解码结果的细节补充，有效提升了显著性检测结果的准确率，避免了检测结果中显著性主体判断错误的发生，解决了解码结果存在边缘模糊的问题。

主权项：1.一种基于递归解码器的显著性检测方法，其特征在于包括以下步骤：1获取数据集与检测标签：获取显著性检测公开数据集及对应的检测标签；2构建检测模型，该模型由特征提取器、递归解码器RD-1和RD-2、边缘强化模块ER-1和ER-2、整体注意力模块HA构成，具体构建过程包括以下步骤：2-a构建特征提取器，以ResNet-50作为特征提取器的基础网络；所构建的特征提取器共分五层：第一层，即Res1，由单层卷积模块构成；第二层，即Res2，由一个池化层和三层残差模块构成；第三层，即Res3，由四层残差模块构成；第四层包括Res4-1和Res4-2，二者拥有相同的结构，都由六层残差模块构成，第五层包括Res5-1和Res5-2，二者也拥有相同的结构，都由三层残差模块构成；第四层和第五层为双分支结构，其中第四层的Res4-1和第五层的Res5-1串联构成第一个分支，第四层的Res4-2和第五层的Res5-2串联构成第二个分支；输入图像经过Res1处理，获得三维特征图f1_1、f1_2和f1_3，且f1_1＝f1_2＝f1_3；f1_3输入Res2获得三维特征图f2_1、f2_2和f2_3，且f2_1＝f2_2＝f2_3；f2_3输入Res3获得三维特征图f3_1、f3_2和f3_3，且f3_1＝f3_2＝f3_3；f3_3依次经过第一个分支的Res4-1和Res5-1处理后分别获得三维特征图f4_1和f5_1；f3_3与整体注意力模块HA的输出结果通过逐像素相乘实现加权，加权结果依次经过第二个分支的Res4-2和Res5-2处理后分别获得三维特征图f4_2和f5_2；HA由单层卷积构成，它以递归解码器RD-1的输出结果作为输入；2-b构建递归解码器RD-n，该解码器由长依赖模块LRDM、感受野模块RFB、子解码器1、子解码器2、子解码器3和卷积模块Conv2构成；将步骤2-a获取的特征图f2_n、f3_n、f4_n和f5_n分别作为递归解码器RD-n的输入1、输入2、输入3和输入4，n＝1,2；fi_n依次经过LRDM与RFB处理后得到其中i＝2,3,4,5；将和作为子解码器1的输入，得到输出结果mask1_n，将mask1_n和作为子解码器2的输入，得到输出结果mask2_n，将mask2_n和作为子解码器3的输入，得到输出结果mask3_n，将mask3_n作为卷积模块Conv2的输入，得到粗特征图mapn，即为递归解码器RD-n的输出结果；该步骤中的长依赖模块LRDM和子解码器分别构建如下：2-b-1构建长依赖模块LRDM；以步骤2-a获得的特征图fi_n作为输入，经该模块的通道维度自适应均值池化层处理并进行特征展开后，获得一维特征，将一维特征输入全连接层后，经过激活函数与特征逆展开处理，再与特征图fi_n进行逐像素相乘操作，得到LRDM的输出；其中i＝2,3,4,5，n＝1,2；2-b-2构建子解码器，三个子解码器都具有相同的结构，由递归池化模块RP、递归上采样模块RU、上采样模块Up、通道注意力模块CA、卷积模块Conv1和拼接层构成；其中递归池化模块RP由池化层、卷积层和激活层构成，递归上采样模块RU由上采样层、卷积层和激活层构成；在子解码器1、2、3中，分别以直接输入到拼接层的特征为基准特征，RP和RU分别对来自RFB的输入特征进行以基准特征尺寸为参考的尺度归一化；归一化后的特征与基准特征拼接后，再与上采样模块Up的输出结果通过逐像素相乘运算实现加权，加权结果依次输入CA和Conv1后，得到子解码器的输出；子解码器1中RP的输入为与RU和Up的输入都为子解码器2中RP的输入为RU的输入为与Up的输入为子解码器1的输出；子解码器3中RP的输入为零，RU的输入为与Up的输入为子解码器2的输出；2-c构建边缘强化模块ER-n，该模块由卷积块1和卷积块2构成，其中卷积块1由三层残差模块构成，卷积块2由五层卷积构成；将步骤2-a得到的特征图f1_n经卷积块1处理后，与步骤2-b得到的粗特征图mapn进行逐像素相加，再经卷积块2处理后，得到显著性检测图，其中n＝1,2；3构建损失函数：构建如下混合损失函数Lmix：Lmix＝LBCE+LMSSIM+LDice其中LBCE为二元交叉熵损失，LMSSIM为平均结构相似性损失，LDice为Dice损失，分别定义如下：其中P表示预测图，Gt表示标签图，二者尺寸相同，H表示图的高，W表示图的宽，Pi，j和Gti,j分别表示P和Gt中i，j点的像素值，且Pi，j∈0，1，Gti,j为整数且Gti,j∈[0，1]，log表示求自然对数，表示逐像素相加操作，表示逐像素相乘操作，C1与C2为实数常量，且C1、C2∈0，0.1；M表示将标签图Gt以及对应的预测图P划分成子图对的个数，为预测图P第k个子图的均值，为标签图Gt第k个子图的均值，为预测图P第k个子图的方差，为标签图Gt第k个子图的方差，为预测图P的第k个子图和标签图Gt的第k个子图之间的协方差；|·|表示求取图像中所有像素的和；对模型的两个分支的显著性检测图分别计算混合损失函数，以这两个混合损失函数之和作为模型的总损失函数，定义如下：Ltotal＝Lmix-1+Lmix-2其中，Lmix-1和Lmix-2分别表示第一和第二分支的显著性检测图与标签之间的混合损失，Ltotal表示模型的总损失函数；4训练检测模型：利用步骤1得到的数据集训练步骤2构建的检测模型，模型中的特征提取器使用预训练模型进行参数初始化；使用混合损失函数Lmix-1和Lmix-2分别衡量第一和第二分支的显著性检测图与标签之间的相似性；训练过程中使用Adam算法更新模型参数，并通过L-2正则化作为约束，直到损失值不再下降，得到训练好的显著性检测模型；5推理并获得检测结果：将测试图像经过归一化处理之后，输入至训练好的显著性检测模型，该模型第二分支得到的显著性检测图即为最终的显著性检测结果。

全文数据：

权利要求：

百度查询：中南大学一种基于递归解码器的显著性检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种电能表故障数据监测系统及数据存储介质_中电装备山东电子有限公司_202410411878.8

下一篇：用于超声速进发直连风洞试验的发动机台架及设计方法_中国空气动力研究与发展中心高速空气动力研究所_202410420425.1

相关技术

一种电能表故障数据监测系统及数据存储介质_中电装备山东电子有限公司_202410411878.8

用于超声速进发直连风洞试验的发动机台架及设计方法_中国空气动力研究与发展中心高速空气动力研究所_202410420425.1

一种物品投递方法、装置、设备及介质和物品投递系统_何永安_202410173109.9

一种中心静脉压手动测量装置_中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)_202410152192.1

一种差分解耦双螺线气敏间隙传感元件及其制备方法_中南大学_202410106028.7

一种助力外骨骼辅助运动装置_中国人民解放军总医院第四医学中心_202311762144.6

网站类别的识别方法及装置、设备、存储介质_中国移动通信集团有限公司_202311640121.8

一种探测烟雾粒度及浓度的方法_烟台创为新能源科技股份有限公司_202410159903.8

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

全氟异丁腈的合成方法_天津市长芦化工新材料有限公司_202410424719.1

一种数控龙门铣床_河北大恒重型机械有限公司_202410333473.7

一种靶向性介孔聚多巴胺纳米颗粒及其制备方法和应用_中国药科大学_202410163612.6

递归相关技术

一种基于叶端定时的叶片振动位移递归计算方法及系统_西安交通大学_202311843600.X

基于Lp/q-混合范数的联合递归加权空间滤波方法_东南大学_202010862276.6

一种大规模探测支持DoH的IPv6隐私保护递归服务器的方法、装置、终端设备以及存储介质_暨南大学_202410080237.9

一种基于可解释图递归神经网络的故障诊断方法_西安交通大学_202410161695.5

一种用于肋骨骨折时间预测的多任务递归卷积网络_太原科技大学_202410144698.8

一种基于递归区块链的人力资源数据处理方法和系统_北京中科航天人才服务有限公司_202410119032.7

一种基于递归解码器的显著性检测方法_中南大学_202210620648.3

一种使用词条内容递归爬取词条数据的方法_中国舰船研究设计中心_202310975209.9

基于幂级数系数双向传递的递归型电-气-热多能流方法_福州大学_202410127176.7

一种基于多周期递归网络的非平稳多采样工业过程软测量方法_中国计量大学_202410074598.2

检测相关技术

检测装置及检测系统_浙江省建设工程质量检验站有限公司_202322052960.X

检测系统及检测方法_深圳大学_202410175086.5

钻孔检测方法、钻孔检测系统与检测装置_得力富企业股份有限公司_202110962130.3

倾斜检测装置、倾斜检测系统、倾斜检测方法及倾斜检测程序_株式会社电装_202280064735.3

检测电路和电弧检测装置_湖南华菱涟源钢铁有限公司_202322497410.9

检测方法、检测装置及涂布系统_三一技术装备有限公司_202311853563.0

健康检测设备及健康检测方法_歌尔科技有限公司_202410170462.1

检测装置_富联裕展科技(深圳)有限公司_202322610699.0

检测装置_株式会社日本显示器_202311461688.9

检测装置_株式会社电装_202280065132.5

方法相关技术

制造方法_意法半导体(克洛尔2)公司_202311475458.8

增殖方法_花王株式会社_202080014224.1

训练数据生成方法、图像检测方法、图像分类方法及装置_第四范式(北京)技术有限公司_202211345497.1

图像特征处理方法、图像对比方法、模型训练方法及装置_浙江深象智能科技有限公司_202410418358.X

编码方法、解码方法和处理比特流的方法_松下电器(美国)知识产权公司_202410304249.5

控制棒组件的安装方法、取出方法以及更换方法_中国原子能科学研究院_202111129136.9

排烟机拖车及其掉头方法、自行行走方法_苏州瑞奇安机电科技有限公司_202410210474.2

视频处理方法、影视视频处理方法及装置_阿里巴巴集团控股有限公司_202010147566.2

半导体结构及其制备方法、晶圆切割方法_北京弘图半导体有限公司_202410157714.7

喷墨记录方法及层合体的制造方法_富士胶片株式会社_202280064929.3

龙图腾网&IPTOP

【发明授权】一种基于递归解码器的显著性检测方法_中南大学_202210620648.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务