申请/专利权人:中科智脑(北京)技术有限公司;中国科学技术大学;北京中科研究院
申请日:2020-07-27
公开(公告)日:2024-04-02
公开(公告)号:CN111798471B
主分类号:G06T7/11
分类号:G06T7/11;G06T7/10;G06T7/13
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2020.11.06#实质审查的生效;2020.10.20#公开
摘要:本发明公开了一种图像语义分割网络的训练方法,基于不确定性的域分割方法,根据图像的不确定性在像素层面将输入图像分成两个域,元训练域和元测试域,元训练域由不确定度高的像素组成,元测试域由不确定度低的像素组成;基于元学习的模型优化方法,模型首先在元训练域上更新,然后再元测试域上进行更新方向的微调;通过以上两个方面,不仅提升分割效果还提升了网络模型的鲁棒性。
主权项:1.一种图像语义分割网络的训练方法,其特征在于,包括:每一次迭代训练过程中,利用图像语义分割网络对输入图像的每一个像素类别进行预测得到预测概率图;基于预测概率图判断输入图像中的每一像素是否为边界像素,统计每一像素周围的边界像素的数目,从而将每一像素划分为训练域或者元测试域;利用元训练域对网络参数进行更新,之后,再利用元测试域对更新后的网络参数做二次更新;其中,所述基于预测概率图判断输入图像中的每一像素是否为边界像素的方式包括:如果当前像素i与其K-邻域内像素的预测类别出现不一致的情况,则当前像素为边界像素,公式化表达如下: 其中,t表示第t次迭代,pi表示当前像素i的预测类别,Nbi表示当前像素i的K-邻域内像素集合,pj表示集合Nbi中像素j的预测类别;是一个二元判决子,pj=pi则为1,否则为0;所述统计每一像素周围的边界像素的数目,从而将每一像素划分为训练域或者元测试域的方式包括:统计当前像素i的K-邻域内像素中边界像素的个数,并作为当前像素i的权重,如果当前像素i的K-邻域内像素中没有边界像素,则赋予权重为1,表示为: 其中,t表示第t次迭代,Wti表示当前像素i的权重,Ftj表示当前像素i的K-邻域内像素集合中像素j是否为边界像素;根据当前像素i的权重大小,将其划分为元训练域Dtr或者元测试域Dte,表示为:Dtr={xs,ys|Wtxs,ys1}Dte={xt,yt[Wtxt,yt=1}其中,xs,ys、xt,yt表示元训练域Dtr、元测试域Dte中对应位置的像素。
全文数据:
权利要求:
百度查询: 中科智脑(北京)技术有限公司;中国科学技术大学;北京中科研究院 图像语义分割网络的训练方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。