买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于困难样本挖掘的交通图像自动标注方法和装置_之江实验室_202311743990.3 

申请/专利权人:之江实验室

申请日:2023-12-18

公开(公告)日:2024-03-26

公开(公告)号:CN117765534A

主分类号:G06V20/70

分类号:G06V20/70;G06V10/774;G06V10/82;G06N3/0464;G06N3/08

优先权:["20230911 CN 2023111677895"]

专利状态码:在审-实质审查的生效

法律状态:2024.04.12#实质审查的生效;2024.03.26#公开

摘要:本发明公开了一种基于困难样本挖掘的交通图像自动标注方法和装置,在通用交通图像数据集上训练初始标注模型;基于初始标注模型和通用交通图像数据集训练困难样本标注模型;接入终端采集的视频流数据并进行抽帧操作;在视频帧中抽帧得到不同的图像样本,当困难样本标注模型检测出未检出的困难标注区域时,将该图像样本标记为困难图像样本并存储;通过适当增大困难图像样本在困难样本数据集中的占比,从而增强困难样本标注模型的标注能力,直到准确率超过95%,此时困难样本标注模型作为最终的样本标注模型;本发明降低了交通图像中困难图像样本的筛选成本。持续优化困难样本标注模型,提高了困难图像样本筛选效率。最终提高交通图像标注的模型精度,极大节省了人工标注所需要的人力物力。

主权项:1.一种基于困难样本挖掘的交通图像自动标注方法,其特征在于,包括以下步骤:1获得SODA10M已标注数据集并随机等分成两份,其中一份数据集被划分为初始标注训练集、初始标注验证集和初始标注测试集,以初始标注训练集为输入对FasterR-CNN神经网络进行训练得到初始标注模型;2使用初始标注模型对SODA10M已标注数据集的另一份数据集进行划分,得到简单样本集合和困难样本集合;通过简单样本集合和困难样本集合构建困难样本数据集并用于对FasterR-CNN神经网络进行训练得到困难样本标注模型;3采集汽车终端的视频流数据并进行抽帧操作,得到图像数据集;4使用初始标注模型和困难样本标注模型对图像数据集中每一张图像进行检测:当未检测出图像中包括困难正样本目标时,将该图像记为困难图像样本,并放入困难图像样本集合;反之记为简单图像样本,并放入简单图像样本集合;5当困难图像样本集合中的图像样本数量达到N时,通过困难图像样本集合和简单图像样本集合对困难样本数据集进行更新,得到更新后的困难样本数据集并输入用于更新困难样本标注模型;6重复步骤3-步骤5,直到困难样本标注模型的准确率超过95%,将更新后的困难样本标注模型作为最终的样本标注模型;7将待测交通图像输入到最终的样本标注模型中,输出待测交通图像的目标检测框集合作为标注结果。

全文数据:

权利要求:

百度查询: 之江实验室 基于困难样本挖掘的交通图像自动标注方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。