买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于PU-Learning的图像语义分割方法_复旦大学_202010208014.8 

申请/专利权人:复旦大学

申请日:2020-03-23

公开(公告)日:2020-07-24

公开(公告)号:CN111444914A

主分类号:G06K9/32(20060101)

分类号:G06K9/32(20060101);G06N3/04(20060101);G06N3/08(20060101)

优先权:

专利状态码:失效-发明专利申请公布后的驳回

法律状态:2023.03.31#发明专利申请公布后的驳回;2020.08.18#实质审查的生效;2020.07.24#公开

摘要:本发明提供了一种基于正样本和无标签样本学习的图像语义分割方法,属于计算机视觉技术领域,其中方法包括:数据准备步骤、数据预处理步骤、深度卷积神经网络构建步骤、基于PU‑Learning的损失函数设计步骤、损失函数的优化学习步骤,迭代执行训练步骤直至所述图像语义分割模型的训练结果满足预定收敛条件。本发明采用深度神经网络提取待分割的图像特征,在此基础上,本发明设计了一种基于PU‑Learning的交叉熵损失函数,可以在只有部分像素级标注的情况下训练优化语义分割模型,本发明方案既可以端到端的训练优化语义分割模型,同时在一定程度上保留了像素级别的直接监督,在保证了良好的语义分割质量的同时,提升了数据的标注速度。

主权项:1.一种基于PU-Learning的图像语义分割方法,其特征在于:包括以下步骤:S1、数据准备,且待训练的图像数据库中,每一种类别的像素级图像标注都至少有一个;S2、接收图像,对所述图像进行数据预处理,进行减均值除以标准差的操作,控制样本的数值分布,且在样本不足的情况下,需要进行数据增广操作,包括对图片进行旋转一定角度、水平翻转、模糊噪声、多尺度缩放,最后把图像的宽高调整至相同的大小;S3、构建深度卷积神经网络,利用深度学习的全卷积神经网络作为语义分割的模型,使用全卷积神经网络进行预测,通过多个卷积层非线性激活层池化层学习中间表示的参数,得到训练图像的语义分割的初步结果;S4、损失函数的设计,其中:yi,pi分别表示该像素点被分到第i类的的真实概率和预测概率,真实概率可依据像素点的标签获得,预测概率可将语义分割模型的输出经过softmax函数获得,γ和α分别是两个超参数,其中γ的值一般设置为2,α的值应小于负样本占全部样本的比例,可以在实际应用中调节。k表示有标签样本的类别共有k个;S5、损失函数的优化学习,依据所述初步结果,利用损失函数计算本初步结果与对应图像标注的误差,采用随机梯度下降的方法对所述语义分割模型的模型参数进行修正调优;S6、迭代执行所述训练,直至所述语义分割模型的训练结果满足预定收敛条件。

全文数据:

权利要求:

百度查询: 复旦大学 一种基于PU-Learning的图像语义分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。