【发明授权】基于半监督和注意力的全视野数字图像分类与检测方法_杭州电子科技大学_202210208369.6

申请/专利权人：杭州电子科技大学

申请日：2022-03-04

公开（公告）日：2024-04-02

公开（公告）号：CN114565593B

主分类号：G06T7/00

分类号：G06T7/00;G06V10/25;G06V10/764;G06V10/82;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.02#授权;2022.06.17#实质审查的生效;2022.05.31#公开

摘要：本发明公开了一种基于半监督和注意力的全视野数字图像分类与检测方法，该方法采用半监督学习，使用少量感兴趣区域标注的全视野数字图像训练特征提取网络，提取全部图像的特征后，训练深度门控通道注意力网络和分类层。构建了一种全视野数字图像分类与检测框架，可以直接输出分类结果并直观显示感兴趣区域，可以辅助用户准确判断所属图像类型，同时迅速锁定感兴趣区域。相比于完全不需要标注感兴趣区域的弱监督学习方法，本方法仅需标注少量全视野数字图片的感兴趣区域，就能实现全视野数字图像分类准确率的大幅提升和感兴趣区域的精准检测，具有更高的实用性。

主权项：1.基于半监督和注意力的全视野数字图像分类与检测方法，其特征在于，该方法具体包括以下步骤：步骤S1：收集全视野数字图像及预处理；步骤S2：预训练特征提取网络Resnet18,用于提取全视野数字图像的特征，具体步骤如下：步骤S21：选取部分全视野数字图像和标准对照样本，将感兴趣区域用标注框框定，将对标准对照样本的内容部分用标注框框定；步骤S22：利用感兴趣区域的标注框在预处理后的全视野数字图像上生成同感兴趣区域大小和位置相同的掩膜；步骤S23：利用滑动窗口将预处理后的全视野数字图像切分成若干个n×n的小图像块，其中n为小图像块的像素宽度和高度；步骤S24：将掩膜与预处理后的全视野数字图像重叠，剔除非重叠处的小图像块，保留重叠处的小图像块；步骤S25：将步骤S24保存的小图像块送入Resnet18网络进行训练，保存并输出训练完成后的网络结构及其参数；步骤S3：将所有的全视野数字图像送入上一步骤预训练的Resnet18网络提取特征，具体步骤如下：步骤S31：使用opencv对所有全视野数字图像进行自动分割，过滤空白背景和人为形成的空洞，并将其切分为n×n的小图像块，保存每个图像块的坐标；步骤S32：将小图像块送入预训练的Resnet18网络，并在第四个残差块处转换成512维的特征向量hk，即每个小图像块提取的特征；步骤S4：将步骤S3提取的特征hk送入深度门控通道注意力模块并综合生成Slide级别的特征，通过分类层实现全视野数字图像的分类；具体步骤如下：步骤S41：将特征向量hk送入深度门控通道注意力模块得到每个小图像块对应的注意力分数ak,n：其中ak,n表示第k个小图像块属于第n类的注意力分数，Pa,n表示属于第n类的线性层，σ·表示sigmoid激活函数，tanh·表示tanh激活函数，V•、W·、G·、J·、L·分别表示不同的线性层，N为图像块的总数；步骤S42：由每个小图像块对应的特征向量和注意力分数综合生成Slide级别的特征向量hslide,n： hslide,n表示每个全视野数字图像在第n类的特征；步骤S43：将Slide级别的特征向量hslide,n送入分类层得到分类结果，实现全视野数字图像的分类；步骤S5：提取步骤4生成的所有小图像块在模型预测类对应的注意力分数，使用matplotlib将小图像块对应的注意力分数生成相应颜色的颜色块，以一定的透明度覆盖在原始全视野数字图像上的对应位置，经模糊、平滑操作后，得到感兴趣区域的检测热图。

全文数据：

权利要求：

百度查询：杭州电子科技大学基于半监督和注意力的全视野数字图像分类与检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

下一篇：一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

相关技术

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种文旦柚栽培用的施肥装置_莆田冠腾科技有限公司_202322446584.2

一种液压锁密闭性测试装置_靖江市长源液压机械有限公司_202322518953.4

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

键合劈刀_有研(广东)新材料技术研究院_202322391831.3

一种电池叠放平台_济源市万洋绿色能源有限公司_202322480402.3

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

数字相关技术

数字能源空压站_广东鑫钻节能科技股份有限公司_202311659447.5

数字信号处理电路、数字滤波器和接收器_三星电子株式会社_202310772438.0

数字式纱线捻度仪_绍兴方圆检测科技有限公司_202322169862.4

样品体积的自数字化_华盛顿大学商业中心_202111601955.9

数字人视频显示方法及设备_卓世未来(成都)科技有限公司_202410164673.4

一种角度可调式数字监控装置_锡林浩特市视友电子科技有限责任公司_202322770621.5

随机乳化数字绝对定量分析方法及装置_深圳华大智造科技股份有限公司_201980102465.9

一种工业数字孪生虚实数据融合方法、系统、设备、终端_西安电子科技大学_202110713629.0

基于交易架构构建的业务数字化管理方法及系统_云南建投物流有限公司_202410031090.4

一种基于区块链的数字版权保护方法_中国科学院沈阳自动化研究所_202210660134.0

视野相关技术

一种汽车间接视野装置及汽车_上海映赛电子科技有限公司_202322382939.6

一种应用于多层零件无视野制孔钻模_中航沈飞民用飞机有限责任公司_202322497623.1

一种基于纯视觉的保持风机叶片位于相机视野中间的方法_中国长江三峡集团有限公司_202210018786.4

一种基于Unity的视野调整方法及系统_北京格如灵科技有限公司_202311778870.7

多屏视野的显示方法、系统及电子设备_杭州拓叭吧科技有限公司_201911399512.9

一种视野计的投影成像装置及视野计系统_合肥工业大学_202110987366.2

VR游戏的视野控制方法、VR显示终端、设备及介质_网易(杭州)网络有限公司_202010089745.5

一种扩大VR影片视野角的渲染方法_广东超元力文化科技有限公司_202410062295.9

展示区与实时区视野同步放大的显示方法_上海感图网络科技有限公司_202310911904.9

一种头盔安全帽视野及保护区域综合测试仪及测试方法_青岛中科恒维智能科技有限公司_202410239860.4

图像相关技术

前置图像信号处理装置及图像信息传输方法_OPPO广东移动通信有限公司_202110421250.2

基于图像处理的图像优化方法及相关装置_北京酷豹科技有限公司_202010622203.X

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

医用图像处理装置以及医用图像处理方法_富士胶片医疗健康株式会社_202010503352.4

图像形成装置_佳能株式会社_202311344855.1

图像处理方法和装置_京东方科技集团股份有限公司_201910569605.5

神经网络的训练方法、图像处理方法、图像处理装置_京东方科技集团股份有限公司_201910262329.8

粘合片、层叠片、柔性图像显示装置构件和柔性图像显示装置_三菱化学株式会社_202080080700.X

一种多模态信息指导的医学图像分割系统及图像处理方法_山东大学_202111524363.1

基于由旋转成像器捕获的图像的全景图像构建_泰立戴恩菲力尔商业系统公司_201980047034.7

龙图腾网&IPTOP

【发明授权】基于半监督和注意力的全视野数字图像分类与检测方法_杭州电子科技大学_202210208369.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务