买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于明厨亮灶场景的复杂环境YOLO算法与混合注意力应用算法_联通(上海)产业互联网有限公司_202410121220.3 

申请/专利权人:联通(上海)产业互联网有限公司

申请日:2024-01-29

公开(公告)日:2024-04-30

公开(公告)号:CN117953406A

主分类号:G06V20/40

分类号:G06V20/40;G06V20/00;G06V10/82;G06V10/80;G06N3/0464;G06N3/045;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.17#实质审查的生效;2024.04.30#公开

摘要:本发明涉及明厨亮灶复杂环境监测技术领域,尤其为通过设计一种基于明厨亮灶场景的复杂环境YOLO算法与混合注意力应用算法,使用了增强型多头注意力和坐标注意力机制的混合注意力机制,提高了注意力网络感知上下文信息的能力,扩大了网络特征的利用范围,其中坐标注意力机制增强了不同通道之间的链接,减少了位置信息的丢失,从而增加了混合注意力机制网络感知远距离小微目标信息和学习局部特征的能力,并且把增强的FPN应用到YOLOv5检测模型中,改进后的算法模型具有较为良好的检测能力,进而与其他版本的YOLO相比,平均精度均值,精度,召回率和每秒帧数指标显著提升,并且在满足实时检测要求的同时,适应各种厨房的场景,且满足检测准确性要求。

主权项:1.一种基于明厨亮灶场景的复杂环境YOLO算法与混合注意力应用算法,其步骤具体如下:步骤1,混合注意力机制:混合注意力机制Hybridattentionmechanism-HAM模块式基于Transformer结构;首先,输入特征经过深度卷积DWConv残差块以实现参数共享并增强局部特征的学习;然后通过LayerNomalizationLN进行规划化处理,并且通过两个注意力机制模块,即增强多头自注意和坐标注意力,对输出进行处理;最后,经过LN层进行规范化,并最终通过MLP层输出处理结果,其中整个过程如下列公式所示:X1=X+DWconvXX2=LNX1X3=CAX2+EMSAX2+X1Y=MLPLNX3+X3其中X表示输入特征,Y表示输出特征,X1,X2,X3是中间特征;DWconv表示深度可分卷积,LN表示层规范化,CA表示坐标注意力,EMSA表示增强多头注意力,MLP是多层感知机;步骤2,基于混合注意力特征金字塔网络架构:在明厨亮灶项目中,存在光线暗,小微目标检测的痛点,从而通过增强FPN的特征融合能力实现对复杂情况下小微目标检测,并且为了增强FPN的特征融合能力,通过增加混合注意力特征金字塔网络对FPN进行优化;同时,提出了一个新颖的EMSA模块,已经被提出用来获取上下文信息和全局特征,同时使用CA机制来准确捕获位置特征并有效地捕获通道之间的信息;然后,通过EMSA和CA捕获的信息特征融合,以增强特征金字塔网络的特征融合能力,从而设计概念基于transformer中的MSA机制;具体实现机制如公式所示:Q,K,V=FCXinputQ`=LinearQK`=LinearKV`=LinearV 其中,Xinput表示输入特征,Xoutput表示输出特征,Xm和Xn表示中间特征,Q,K,V分别表示Query矩阵,Key矩阵和Value矩阵;Linear是线性变换操作,SiLU是Sigmoid线性单元激活函数,FC表示全连接层,d是参数规模大小表示因子;首先,Q,K,V组件通过全连接FC层形成,其次对三个组件分别进行线性变换,将变换后的Q和K矩阵相乘,然后对它们进行一系列非线性处理,最后,使用全连接层输入SiLU激活函数;经过全连接层后,使用Tanh激活函数进行处理,输出结果是一个与线性变换的V组件相乘的矩阵;最后,将全连接层与原始输入特征相融合,以获得最终输出结果;步骤3,YOLOv5中改进的特征融合网络:在原有的YOLOv5中,替换了原来的PAFPN结构和原始特征融合网络架构。

全文数据:

权利要求:

百度查询: 联通(上海)产业互联网有限公司 一种基于明厨亮灶场景的复杂环境YOLO算法与混合注意力应用算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。