申请/专利权人:桂林电子科技大学
申请日:2024-01-04
公开(公告)日:2024-04-05
公开(公告)号:CN117831076A
主分类号:G06V40/10
分类号:G06V40/10;G06V10/44;G06V10/764;G06V10/766;G06V10/82;G06T7/73;G06N3/045;G06N3/0464;G06N3/08
优先权:
专利状态码:在审-公开
法律状态:2024.04.05#公开
摘要:本发明公开了一种基于多尺度沙漏注意力和多分类多回归损失的头部姿态估计方法。其特征在于:将头部图像输入到特征提取网络,提取原始图像数据的高级语义信息;采用多尺度沙漏注意力模块聚合多尺度的特征,同时增强浅层细节特征和深度高级语义特征;采用不同细粒度的2、6、18、66和198分类构造多分类多回归损失,较低细粒度的2、6和18分类指导模型去学习更加突出和明显的低级语义特征,而更高细粒度的66和198分类则指导模型去学习类间潜在不明显的细节区别和高级语义特征。本发明提出的头部姿态估计方法能够有效提升模型对不同细粒度特征的提取与整合能力,形成不同尺度的空间特征聚合,降低头部姿态估计的误差。
主权项:1.一种基于多尺度沙漏注意力和多分类多回归损失的头部姿态估计方法,其特征在于,包括以下步骤:1提取头部姿态语义特征FRL:首先将原始头部图像I输入到特征提取网络Resnet50中,经过特征提取网络的首层卷积层Conv1、最大池化层Maxpooling和第一块残差块RL获得特征图FRL,如公式1所示:FRL=RLMaxpoolingConv1I1,2采用多尺度沙漏注意力模块HG对FRL进行特征增强:在Resnet50中的每一层残差块之后加入多尺度沙漏注意力模块HG,获得空间姿态特征聚合后的注意力特征图WHG,再将头部姿态语义特征FRL和注意力特征图WHG进行按位相乘和残差相加后获得第一块残差块的沙漏注意力权重重分配后的特征图FHA,如公式2所示, 在后续的残差块中同理;3采用多分类多回归损失模型训练策略,将数据集中[-99°,99°]范围内的姿态欧拉角平均拆分为2分类、6分类、18分类、66分类和198分类,利用多个全连接层对应实现不同的分类任务,采用交叉熵误差函数H计算其分类损失LossH,并使用均方误差损失函数MSE计算其头部姿态回归损失LossMSE,模型最终通过198分类进行正向推理,整体损失函数Loss如公式3所示,Loss=α*LossH+β*LossMSE3,其中α和β代表两个损失的不同权重。
全文数据:
权利要求:
百度查询: 桂林电子科技大学 一种基于多尺度沙漏注意力和多分类多回归损失的头部姿态估计方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。