买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于CNN且抗波动性强的客体检测方法及装置_斯特拉德视觉公司_201911294522.6 

申请/专利权人:斯特拉德视觉公司

申请日:2019-12-16

公开(公告)日:2024-03-15

公开(公告)号:CN111461161B

主分类号:G06V10/774

分类号:G06V10/774;G06V10/82;G06N3/0464;G06N3/084

优先权:["20190122 US 16/254162"]

专利状态码:有效-授权

法律状态:2024.03.15#授权;2020.08.21#实质审查的生效;2020.07.28#公开

摘要:本发明提供一种学习基于CNN且抗波动性强的客体检测器的方法及装置,该客体检测器可根据诸如KPI等使用者的要求事项而适应地利用目标客体预测网络。如果由所述KPI决定的分辨率或焦距发生改变,则客体的大小也改变。利用面向使用者优化设计的所述方法,能够更准确地检测到诸如正在落下或已落下客体的不确实的客体,而且能够感知所述客体的波动。因此,所述方法对于军事目的或位于远处的客体检测非常有用。所述方法包括如下步骤:在使k从1增加到n的同时,学习装置使RPN,输出与图像上的第k‑1目标区域对应的第k加工图像上的第k客体推选,使FC层输出与第k客体对应的客体检测信息,使FC损失层获得FC损失。

主权项:1.一种利用目标客体预测网络的客体检测器的参数的学习方法,其特征在于,包括:a步骤,输入至少一个训练图像后,学习装置i使一个以上的卷积层,对与所述训练图像对应的至少一个第1加工图像应用一个以上的卷积运算,使得输出至少一个第1特征图,ii使区域推选网络RPN,利用所述第1特征图,输出与位于所述第1加工图像内的一个以上第1客体分别对应的一个以上的第1客体推选,iii使池化层,在所述第1特征图上,对与各个所述第1客体推选分别对应的各个区域,应用一个以上的池化运算,输出至少一个第1池化后特征图,iv使全连接FC层,对所述第1池化后特征图应用至少一个FC运算,输出与所述第1客体对应的第1客体检测信息,v使FC损失层,参照所述第1客体检测信息和与其对应的地面真值GT,获得一个以上的第1FC损失,进而通过利用所述第1FC损失的反向传播,学习所述FC层与所述卷积层的参数中至少一部分;及b步骤,在使k从2增加到n的同时,所述学习装置i使所述目标客体预测网络,参照第k-1加工图像上的一个以上的第k-1客体推选,在所述第k-1加工图像上,查找与预测为至少一个目标客体所在的区域对应的第k-1目标区域,ii在所述训练图像或调整了大小的训练图像上,获得与所述第k-1目标区域对应的第k加工图像后,使所述卷积层,对所述第k加工图像应用所述卷积运算,输出第k特征图,iii使所述RPN,参照所述第k特征图,输出与位于所述第k加工图像内的一个以上第k客体分别对应的一个以上的第k客体推选,iv使所述池化层,在所述第k特征图上,对与各个所述第k客体推选分别对应的各个区域应用所述池化运算,输出至少一个第k池化后特征图,v使所述FC层,对所述第k池化后特征图应用所述FC运算,输出与所述第k客体对应的第k客体检测信息,vi使所述FC损失层,参照所述第k客体检测信息和与其对应的GT,获得一个以上的第kFC损失,进而通过利用所述第kFC损失的反向传播,学习所述FC层及所述卷积层的参数中至少一部分。

全文数据:

权利要求:

百度查询: 斯特拉德视觉公司 基于CNN且抗波动性强的客体检测方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。