【发明授权】一种基于自适应对比学习的菜品识别方法_北京航空航天大学杭州创新研究院;杭州食方科技有限公司_202210163470.4

申请/专利权人：北京航空航天大学杭州创新研究院;杭州食方科技有限公司

申请日：2022-02-22

公开（公告）日：2024-04-26

公开（公告）号：CN114758167B

主分类号：G06V10/764

分类号：G06V10/764;G06V10/82;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.04.26#授权;2022.08.02#实质审查的生效;2022.07.15#公开

摘要：本发明涉及一种基于自适应对比学习的菜品识别方法，与传统的菜品识别方法不同，基于自适应对比学习的神经网络，无需在线训练，对推理环境要求较低，本发明提出多尺度三元组损失函数，使得神经网络自适应的学习不同尺度差异的损失，从而更好的区分菜品间的细微差异；所述的多尺度三元组损失函数由包括三种边界的三元组损失函数以及一个最大值选择函数组成，可自适应选择三元组损失的边界值；本发明通过自适应对比学习的方式来实现菜品识别的离线推理，不仅不受菜品种类的约束，能够应对类别的实时变化，离线推理还大大降低了菜品识别应用环境的算力要求；本发明通过在反馈过程中引入低相似度样本自动删除，使得菜品识别方法可以长时间稳定运行。

主权项：1.一种基于自适应对比学习的菜品识别方法，其特征在于包括：A训练步骤，包括从训练集中随机选择32个不同的菜品类别，然后从每个菜品类别中随机取8张图片，共256张图片进行数据增强，包括：A1对所选的256张图片以Q1的概率做水平翻转得到随机水平翻转后的256张图片；A2对步骤A1中得到的256张图片以Q2的概率做竖直翻转得到随机竖直翻转后的256张图片；A3对步骤A2中得到的256张图片按顺序以Q3的概率增加随机的对比度噪声、饱和度噪声和亮度噪声，得到随机增加随机噪声的256张图片；A4图像重采样和像素值归一化，包括将步骤A3中得到的256张图片均重采样，得到宽高均为224个像素的256张图片，将每张图片的像素值归一化处理为0和1之间；A5将上述重采样和像素值归一化处理后的256张图片输入到特征提取网络中，该特征提取网络可以是任意的可用于图像分类的神经网络，本发明以ResNet18、ResNet50为例，得到尺寸为256,V的特征向量,V可以是任意长度，本发明以常见的1000为例；A6根据256张图片的菜品ID找出这256张图片中存在的所有的三元组a,p,n，其中a为基于模版图片提取的特征，p为基于任意一张与a同菜品类别的输入图片提取的特征，n为基于任意一张与a不同菜品类别的输入图片提取的特征，计算每个三元组的多尺度三元组损失LB＝max{da,p-da,n+MB,0}、中等边界三元组损失LI＝g*max{da,p-da,n+MI,0}、以及较小边界三元组损失LS＝f*max{da,p-da,n+MS,0}，其中g、f为常量，dx,y为x与y的欧式距离，下标B、I、S分别代表较大边界、中等边界、较小边界，然后对每一个三元组a,p,n，保留L＝max{LB,LI,LS}为最终损失；A7基于AdamW优化器以及最终损失来计算神经网络参数的梯度，对模型的参数进行优化，B菜品识别步骤，包括：B1将一张未知菜品图像经过重采样和像素值归一化处理，得到尺寸为1,3,224,224的图像张量P，输入基于自适应对比学习优化的神经网络中，经过神经网络计算后得到一个尺寸为1,1000的特征向量M；B2若该菜品类别的菜品第一次出现或特征缓存区中为空，则认为是新菜品类别，不做识别且将特征向量及新类别加入特征库，否则，计算M与特征缓存区内所有特征的欧式距离，取最小值D对应的菜品类别为最终识别结果；步骤三，执行低相似度样本自动删除策略，若最小距离D小于预设的阈值T，则将当前识别的特征及识别结果保存到特征缓存区中，否则丢弃，完成识别过程。

全文数据：

权利要求：

百度查询：北京航空航天大学杭州创新研究院;杭州食方科技有限公司一种基于自适应对比学习的菜品识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

下一篇：一种差分解耦双螺线气敏间隙传感元件及其制备方法_中南大学_202410106028.7

相关技术

锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

一种差分解耦双螺线气敏间隙传感元件及其制备方法_中南大学_202410106028.7

一种燃气-蒸汽联合循环发电供热系统_西安热工研究院有限公司_202410130737.9

为放大器操作进行的平台资源的选择_超威半导体公司_202280065509.7

设备控制方法、装置、配电设备及存储介质_深圳市正浩创新科技股份有限公司_202410171534.4

一种肾病透析用体外固定装置_河北北方学院附属第一医院_202410336854.0

一种靶向性介孔聚多巴胺纳米颗粒及其制备方法和应用_中国药科大学_202410163612.6

用药患者血浆中抗人胸腺/淋巴细胞兔免疫球蛋白总IgG抗体浓度检测试剂盒及应用_武汉中生毓晋生物医药有限责任公司_202410128193.2

一种脑膜炎球菌发酵培养基及其制备方法和应用_成大生物(本溪)有限公司_202410343870.2

一种新型射灯天线_摩比天线技术(深圳)有限公司_202410125372.0

混合动力自动手动变速器_伊顿康明斯自动传输技术有限责任公司_202280063792.X

一种果树吊枝方法_上海市农业科学院_202410367417.5

学习相关技术

基于改进的核极限学习机和GAN的自适应学习方法_湘潭大学_201910043961.3

基于图对比学习的城市异构实体联合表征学习方法_北京航空航天大学_202311741013.X

机器学习模型运用管理系统以及机器学习模型运用管理方法_川崎重工业株式会社_202080017363.X

在线学习问答方法及相关装置_深圳青豆教育科技有限公司_202311797251.2

一种图文吊挂学习装置_西北大学现代学院_202323019165.7

基于强化学习和任务感知随机游走的深度学习任务调度方法和系统_北京大学_202211398671.9

一种基于强化学习和迁移学习的命名实体识别方法和装置_广东省人民医院_202410182078.3

食品污染预测装置、推理装置、机器学习装置、食品污染预测方法、推理方法及机器学习方法_东洋制罐集团控股株式会社_202280061922.6

以医疗数据为基础的深度学习模型的学习及推论方法、程序及装置_美迪科诶爱有限公司_202280063391.4

针对深度学习后门攻击防御的性能评估方法_南京理工大学_202410056834.8

识别相关技术

物体识别装置_丰田自动车株式会社_202010684954.4

路面垃圾识别装置_博景生态环境股份有限公司_202322802180.2

水漂识别方法_复旦大学_202410196163.5

图像识别方法_上海建工电子商务有限公司_202410114551.4

血样容器批量识别装置_青岛海尔生物医疗科技有限公司_202321480848.X

图像识别模型的训练方法和图像识别方法、装置_北京百度网讯科技有限公司_202210218135.X

基于特征识别的直流电磁铁响应时间识别方法_北京易动宇航科技有限公司_202211021265.0

一种基于图像识别的岩性识别方法_常州大学_202410162306.0

钻井低效事件识别方法、识别模型训练方法及装置_昆仑数智科技有限责任公司_202211390266.2

文本识别方法、文本识别装置、介质与电子设备_OPPO广东移动通信有限公司_202211407144.X

方法相关技术

制造方法_意法半导体(克洛尔2)公司_202311475458.8

增殖方法_花王株式会社_202080014224.1

训练数据生成方法、图像检测方法、图像分类方法及装置_第四范式(北京)技术有限公司_202211345497.1

编码方法、解码方法和处理比特流的方法_松下电器(美国)知识产权公司_202410304249.5

控制棒组件的安装方法、取出方法以及更换方法_中国原子能科学研究院_202111129136.9

排烟机拖车及其掉头方法、自行行走方法_苏州瑞奇安机电科技有限公司_202410210474.2

视频处理方法、影视视频处理方法及装置_阿里巴巴集团控股有限公司_202010147566.2

半导体结构及其制备方法、晶圆切割方法_北京弘图半导体有限公司_202410157714.7

喷墨记录方法及层合体的制造方法_富士胶片株式会社_202280064929.3

分类模型训练方法、分类方法、装置和设备_海通证券股份有限公司_202410186760.X

龙图腾网&IPTOP

【发明授权】一种基于自适应对比学习的菜品识别方法_北京航空航天大学杭州创新研究院;杭州食方科技有限公司_202210163470.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务