买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于深度残差网络的视觉显著性检测方法_浙江工业大学_202010389359.8 

申请/专利权人:浙江工业大学

申请日:2020-05-10

公开(公告)日:2024-03-22

公开(公告)号:CN111797841B

主分类号:G06V10/46

分类号:G06V10/46;G06V10/82;G06V10/80;G06N3/0464;G06N3/09

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2020.11.06#实质审查的生效;2020.10.20#公开

摘要:本发明涉及一种基于深度残差网络的视觉显著性检测方法,包括以下四部分:(1)搭建视觉显著性检测神经网络:包括以深度残差网络为基础网络结构,增加金字塔特征增强模块、基于空间金字塔池化的语义监督模块以及特征融合模块;(2)神经网络训练优化:包括多路损失函数设计和数据集增强;(3)完成对神经网络的训练;(4)使用训练好的神经网络对通用图像进行检测,输出显著性区域的图像。与现有神经网络显著性检测方法相比,本发明具有更好的显著性检测效果,对具有复杂纹理信息、各种颜色背景的图像也能检测出精确的显著性区域,检测结果更接近真实值、噪声更少、分辨率更高、边缘精细,帧率更高,能够满足实时性检测的要求。

主权项:1.一种基于深度残差网络的视觉显著性检测方法,其特征在于:所述方法包括以下步骤:步骤1:搭建视觉显著性检测神经网络,包括以下步骤:步骤1.1:以深度残差网络为基础网络结构;步骤1.2:在深度残差网络中配合设置金字塔特征增强模块,输出特征图A1、A2、A3、A4;金字塔特征增强模块包括低层特征增强子模块、中层特征增强子模块、高层特征增强子模块;低层特征增强子模块采用重叠池化对深度残差网络第一层的输出进行特征提取,选用ReLu为激活函数,输出特征图A1;中层特征增强子模块采用3×3卷积核对深度残差网络第二层的输出进行特征提取,选用ReLu为激活函数,输出特征图A2;高层特征增强子模块先进行重叠池化运算,再采用1×1、3×3、5×5三种不同卷积核对深度残差网络第三层和第四层的输出进行特征提取,选用ReLu为激活函数,分别输出特征图A3和A4;步骤1.3:在深度残差网络中配合设置基于空间金字塔池化的语义监督模块,输出特征图C;步骤1.4:在深度残差网络中增加特征融合模块;特征融合模块的融合方法包括以下步骤:步骤1.4.1:对金字塔特征增强模块输出的四路特征图A1、A2、A3、A4采用大小为1×1的卷积核进行卷积,分别得到特征图B1、B2、B3、B4;步骤1.4.2:使用双线性插值的上采样方法对语义监督模块输出的特征图C同时进行四次上采样,分别得到四路特征图D1、D2、D3、D4,其中D1和B1、D2和B2、D3和B3、D4和B4的尺寸一致;步骤1.4.3:若当前特征融合模块位于神经网络的第四层,则将特征图B4与特征图D4通过级联方式进行融合;若当前特征融合模块位于神经网络的其它位置,则将特征图B3、特征图D3与神经网络第三层特征融合模块输出的特征图、或特征图B2、特征图D2与神经网络第二层特征融合模块输出的特征图、或特征图B1、特征图D1与神经网络第一层特征融合模块输出的特征图通过级联方式进行融合;步骤1.4.4:采用3×3的卷积核对步骤1.4.3融合的结果进行卷积运算,输出特征图;步骤2:对神经网络进行训练优化;步骤3:完成对神经网络的训练;步骤4:使用训练好的神经网络对输入图像进行检测,输出显著性区域的图像。

全文数据:

权利要求:

百度查询: 浙江工业大学 一种基于深度残差网络的视觉显著性检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。