【发明授权】图像重建模型的训练方法、商品识别方法、装置及设备_北京百度网讯科技有限公司_202310342126.6

申请/专利权人：北京百度网讯科技有限公司

申请日：2023-03-31

公开（公告）日：2024-04-16

公开（公告）号：CN116468816B

主分类号：G06T11/00

分类号：G06T11/00;G06V10/25;G06V10/774;G06V10/82;G06V10/40;G06V10/77;G06N3/08;G06N3/0464

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2023.08.08#实质审查的生效;2023.07.21#公开

摘要：本公开提供了图像重建模型的训练方法、商品识别方法、装置及设备。本公开涉及人工智能技术领域，具体为计算机视觉、图像处理、深度学习等技术领域，可应用于智慧城市等场景。具体实现方案为：随机选取各样本图像的K个随机掩码区域及其对应的K个原始图像；对各样本图像的K个随机掩码区域进行随机掩码处理，得到各样本图像的经过随机掩码处理后的输入图像；将各样本图像的输入图像和K个随机掩码区域的检测框输入图像重建模型，得到各样本图像的K个预测图像；基于各样本图像的K个预测图像和K个原始图像，对图像重建模型进行训练，得到图像重建模型。根据本公开的方案，能够增强模型的细粒度特征表达能力，从而提升商品识别的准确性。

主权项：1.一种图像重建模型的训练方法，包括：随机选取各样本图像的K个随机掩码区域，K为正整数；获取各样本图像的所述K个随机掩码区域对应的K个原始图像；对各样本图像的所述K个随机掩码区域进行随机掩码处理，得到各样本图像的经过随机掩码处理后的输入图像；将各样本图像的所述输入图像和所述K个随机掩码区域的检测框输入图像重建模型，得到各样本图像的K个预测图像；基于各样本图像的所述K个预测图像和所述K个原始图像，对所述图像重建模型进行训练，得到所述图像重建模型，所述图像重建模型用于作为商品识别模型的初始模型；其中，所述图像重建模型采用基于卷积神经网络的编码器-解码器网络结构，在所述编码器与所述解码器之间设置感兴趣区域对齐ROIAlign模块，所述ROIAlign模块用于根据各样本图像的所述K个随机掩码区域的检测框的位置，从各样本图像的特征图中提取出所述K个随机掩码区域的特征向量。

全文数据：

权利要求：

百度查询：北京百度网讯科技有限公司图像重建模型的训练方法、商品识别方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

下一篇：一种文旦柚栽培用的施肥装置_莆田冠腾科技有限公司_202322446584.2

相关技术

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

一种文旦柚栽培用的施肥装置_莆田冠腾科技有限公司_202322446584.2

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种钢带波纹螺旋管接头防护模具_吉林建工集团有限公司_202322063597.1

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

一种玉米种植用病虫害防治装置_黄金双_202322446508.1

一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

龙图腾网&IPTOP

【发明授权】图像重建模型的训练方法、商品识别方法、装置及设备_北京百度网讯科技有限公司_202310342126.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务