【发明授权】一种基于多区域数据增强的菜品识别方法_北京航空航天大学杭州创新研究院;杭州食方科技有限公司_202210163468.7

申请/专利权人：北京航空航天大学杭州创新研究院;杭州食方科技有限公司

申请日：2022-02-22

公开（公告）日：2024-04-26

公开（公告）号：CN114782735B

主分类号：G06V10/764

分类号：G06V10/764;G06V10/82;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.04.26#授权;2022.08.09#实质审查的生效;2022.07.22#公开

摘要：本发明一种基于多区域数据增强的菜品识别方法，在传统的菜品识别方法的基础上，对训练的过程中的每一张输入图像进行多区域数据增强；所述多区域增强方法分别由两步完成，第一步将输入图像从水平维度以及竖直维度平均裁剪为四等份，第二步选择每两个相邻的14等份分别做数据增强，将上述两步骤产生的四个多区域增强的增强图像用作训练菜品分类神经网络，通过同时计算四个样本的平均距离损失以及分类损失来对神经网络进行协同优化；本发明通过对输入图像做多区域数据增强，使得神经网络对菜品的特征提取鲁棒性更强，降低模型对识别环境变化以及菜品形态变化的敏感程度，提升菜品识别模型在不同环境下的鲁棒性。

主权项：1.一种基于多区域数据增强的菜品识别方法，其特征在于包括：A神经网络训练步骤，包括：对输入图像做水平与竖直裁剪得到四个等尺寸的14小裁剪图像，然后选择每两个相邻的14等份共四种组合分别做数据增强，将上述两步骤中的由四种组合产生的四个多区域增强的增强图像用作训练菜品分类模型，B训练步骤，除采用分类的损失函数外，还采用平均距离损失函数来约束神经网络对由同一张输入图像经过多区域数据增强后得到的四张增强图像提取出的特征向量相似度最大化，进而在优化菜品分类的同时提高神经网络特征提取的鲁棒性；所述步骤A包括：A1从训练集随机选取一组64张输入图像，对这64张输入图像中的每一张分别进行多区域数据增强，具体包括：对所选的输入图像同时进行水平、竖直裁剪，获取四张裁剪后的小裁剪图像分别用C0,C1,C2,C3表示，尺寸为原输入图像的14；选择每两个相邻的14等份，共四种不同的组合：C0,C1,C3,C0,C1,C2,C2,C3；对每两个相邻的14等份，分别做随机的数据增强，包括：i随机的亮度偏移I；ii随机的对比度偏移O；iii随机的饱和度偏移S；iv随机的高斯噪声U；由一张输入图像的四种组合经过前三个步骤可以得到四张多区域数据增强的增强图像，因此由64张原始输入图像得到了64*4＝256张增强图像，增强图像的菜品类别和输入图像一致；对所有的增强图像重采样到宽高均为224个像素，并通过除以255.0将每张增强图像的像素值归一化到0和1之间；步骤五，将上述重采样以及归一化处理后的256张增强图像输入到菜品识别网络中；A2模型优化步骤，包括：A21设菜品的总类别数量为N，菜品识别网络输出为V，尺寸为256，N；A22设由64张输入图像经过多尺寸数据增强得到的256张增强图像的正确菜品类别为向量Y,尺寸为256，基于V和Y计算SmoothCE分类损失LC，重排列V的尺寸为64,4,N，通过计算向量V的的平均值得到平均向量M，尺寸为64,1,N，从第二个维度将V分离成四个向量M01,M30,M12,M23，尺寸均为64,1,N，其中第二个维度长度为4且在矩阵的第二维；A23基于输出向量计算平均距离损失LD＝|M-M01|+|M-M30|+|M-M12|+|M-M23|4，进而获取总的损失值L＝LC+LD；A24基于总损失值L来计算神经网络参数的梯度，并采用AdamW优化器对神经网络的参数进行优化。

全文数据：

权利要求：

百度查询：北京航空航天大学杭州创新研究院;杭州食方科技有限公司一种基于多区域数据增强的菜品识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

下一篇：一种电石渣煅烧氧化钙粉体循环压球系统及工艺_江苏中圣园科技股份有限公司_202011333705.7

相关技术

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

一种电石渣煅烧氧化钙粉体循环压球系统及工艺_江苏中圣园科技股份有限公司_202011333705.7

一种防止带钢在精轧卷取中发生追尾的方法_首钢京唐钢铁联合有限责任公司_202210031884.1

一种含氟塑料加工助剂及其制备工艺_稷昶新材料科技(上海)有限公司_202311471760.6

一种用于开槽埋管的冷冻施工辅助设备及方法_长江生态环保集团有限公司_202310118173.2

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

一种富氦气藏区带的评价方法、装置、设备及介质_中国石油天然气股份有限公司_202311208279.8

一种外导体压接装置_江苏博之旺自动化设备有限公司_202111235070.1

一种基于动网格模拟隧道列车运动的结构网格划分方法_天津大学_202111426137.X

一种带角度弹性垫圈的热处理方法及热处理装置_贵州航天精工制造有限公司_202111464284.6

消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

数据相关技术

数据存储方法、数据处理方法、数据存储器、数据处理器_北京壁仞科技开发有限公司_202410251377.8

数据分发系统及数据分发方法_京东方科技集团股份有限公司_202080002860.2

基于大数据的销售数据智能分析系统_徐州欧意尔服饰有限公司_202410155636.7

空间大数据分区重复数据的剪枝方法_大连海事大学_202111188239.2

基于数据库的双向数据挖掘方法_数通十方(深圳)数字科技有限公司_202410046482.8

数据统一_微软技术许可有限责任公司_202280065303.4

自动数据生成_脸萌有限公司_202311488225.1

点云数据发送设备、点云数据发送方法、点云数据接收设备以及点云数据接收方法_LG电子株式会社_202280064897.7

三维数据编码方法、三维数据解码方法、三维数据编码装置、以及三维数据解码装置_松下电器(美国)知识产权公司_201980083201.3

多级数据沿袭视图_微软技术许可有限责任公司_202080022647.8

菜品相关技术

一种预制菜解冻装置_泰昌鲜味(山东)食品科技有限公司_202322182406.3

化妆品容器_洽兴包装工业(中国)有限公司_202111043422.3

树脂成型品_森六汽车配件株式会社_202011006437.8

一种压菜模块及切配机_杭州老板电器股份有限公司_202322836962.8

一种小型鱼菜共生装置_朗朗教育科技股份有限公司_202322181458.9

一种尾菜的青贮方法_天祝藏族自治县农牧业机械技术推广站_202410316617.8

一种连叶大头菜切削装置_四川缔梦科技有限公司_202322690247.8

一种富硒菜用搅拌机_石台县秋浦农业科技有限公司_201810630716.8

火工品等效系统_航天新长征大道科技有限公司_202311812434.7

化妆品组合物_信越化学工业株式会社_202180021789.7

识别相关技术

物体识别装置_丰田自动车株式会社_202010684954.4

路面垃圾识别装置_博景生态环境股份有限公司_202322802180.2

水漂识别方法_复旦大学_202410196163.5

图像识别方法_上海建工电子商务有限公司_202410114551.4

血样容器批量识别装置_青岛海尔生物医疗科技有限公司_202321480848.X

图像识别模型的训练方法和图像识别方法、装置_北京百度网讯科技有限公司_202210218135.X

文本识别方法、文本识别装置、介质与电子设备_OPPO广东移动通信有限公司_202211407144.X

钻井低效事件识别方法、识别模型训练方法及装置_昆仑数智科技有限责任公司_202211390266.2

一种基于图像识别的岩性识别方法_常州大学_202410162306.0

基于特征识别的直流电磁铁响应时间识别方法_北京易动宇航科技有限公司_202211021265.0

龙图腾网&IPTOP

【发明授权】一种基于多区域数据增强的菜品识别方法_北京航空航天大学杭州创新研究院;杭州食方科技有限公司_202210163468.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务