买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于半监督和注意力的全视野数字图像分类与检测方法_杭州电子科技大学_202210208369.6 

申请/专利权人:杭州电子科技大学

申请日:2022-03-04

公开(公告)日:2024-04-02

公开(公告)号:CN114565593B

主分类号:G06T7/00

分类号:G06T7/00;G06V10/25;G06V10/764;G06V10/82;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2022.06.17#实质审查的生效;2022.05.31#公开

摘要:本发明公开了一种基于半监督和注意力的全视野数字图像分类与检测方法,该方法采用半监督学习,使用少量感兴趣区域标注的全视野数字图像训练特征提取网络,提取全部图像的特征后,训练深度门控通道注意力网络和分类层。构建了一种全视野数字图像分类与检测框架,可以直接输出分类结果并直观显示感兴趣区域,可以辅助用户准确判断所属图像类型,同时迅速锁定感兴趣区域。相比于完全不需要标注感兴趣区域的弱监督学习方法,本方法仅需标注少量全视野数字图片的感兴趣区域,就能实现全视野数字图像分类准确率的大幅提升和感兴趣区域的精准检测,具有更高的实用性。

主权项:1.基于半监督和注意力的全视野数字图像分类与检测方法,其特征在于,该方法具体包括以下步骤:步骤S1:收集全视野数字图像及预处理;步骤S2:预训练特征提取网络Resnet18,用于提取全视野数字图像的特征,具体步骤如下:步骤S21:选取部分全视野数字图像和标准对照样本,将感兴趣区域用标注框框定,将对标准对照样本的内容部分用标注框框定;步骤S22:利用感兴趣区域的标注框在预处理后的全视野数字图像上生成同感兴趣区域大小和位置相同的掩膜;步骤S23:利用滑动窗口将预处理后的全视野数字图像切分成若干个n×n的小图像块,其中n为小图像块的像素宽度和高度;步骤S24:将掩膜与预处理后的全视野数字图像重叠,剔除非重叠处的小图像块,保留重叠处的小图像块;步骤S25:将步骤S24保存的小图像块送入Resnet18网络进行训练,保存并输出训练完成后的网络结构及其参数;步骤S3:将所有的全视野数字图像送入上一步骤预训练的Resnet18网络提取特征,具体步骤如下:步骤S31:使用opencv对所有全视野数字图像进行自动分割,过滤空白背景和人为形成的空洞,并将其切分为n×n的小图像块,保存每个图像块的坐标;步骤S32:将小图像块送入预训练的Resnet18网络,并在第四个残差块处转换成512维的特征向量hk,即每个小图像块提取的特征;步骤S4:将步骤S3提取的特征hk送入深度门控通道注意力模块并综合生成Slide级别的特征,通过分类层实现全视野数字图像的分类;具体步骤如下:步骤S41:将特征向量hk送入深度门控通道注意力模块得到每个小图像块对应的注意力分数ak,n: 其中ak,n表示第k个小图像块属于第n类的注意力分数,Pa,n表示属于第n类的线性层,σ·表示sigmoid激活函数,tanh·表示tanh激活函数,V•、W·、G·、J·、L·分别表示不同的线性层,N为图像块的总数;步骤S42:由每个小图像块对应的特征向量和注意力分数综合生成Slide级别的特征向量hslide,n: hslide,n表示每个全视野数字图像在第n类的特征;步骤S43:将Slide级别的特征向量hslide,n送入分类层得到分类结果,实现全视野数字图像的分类;步骤S5:提取步骤4生成的所有小图像块在模型预测类对应的注意力分数,使用matplotlib将小图像块对应的注意力分数生成相应颜色的颜色块,以一定的透明度覆盖在原始全视野数字图像上的对应位置,经模糊、平滑操作后,得到感兴趣区域的检测热图。

全文数据:

权利要求:

百度查询: 杭州电子科技大学 基于半监督和注意力的全视野数字图像分类与检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。