买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于可变形卷积编码网络和特征区域关注的人体姿态估计方法_桂林电子科技大学_202410014783.2 

申请/专利权人:桂林电子科技大学

申请日:2024-01-04

公开(公告)日:2024-04-02

公开(公告)号:CN117809339A

主分类号:G06V40/10

分类号:G06V40/10;G06V10/44;G06V10/80;G06T7/73;G06N3/045;G06N3/0464;G06N3/08

优先权:

专利状态码:在审-公开

法律状态:2024.04.02#公开

摘要:本发明公开了一种基于可变形卷积编码网络和特征区域关注的人体姿态估计方法。所述方法包括如下步骤:1提取输入图像序列的视觉特征;2特征序列融合的增强全局视觉特征;3自适应区域特征;4通道和空间的特征信息表示;5生成姿态点热力图。本发明提出的一种基于可变形卷积编码网络和特征区域关注的人体姿态估计方法,能促进网络对特征区域的区分能力和对有效特征区域的关注,从而减少对错误特征区域的识别,提升网络的精准度。

主权项:1.一种基于可变形卷积编码网络和特征区域关注的人体姿态估计方法,其特征在于,包括如下步骤:1提取输入图像序列的视觉特征F1、F2、F3:首先将图像序列Xt输入到视觉特征提取网络HRNet中,提取不同阶段的视觉特征F1、F2、F3,所述的过程公式如下:Fi=HRNetXt,i=1,2,32特征序列融合的增强全局视觉特征St:多个阶段不同粗细的视觉特征F1、F2、F3,使用特征拼接Concat进行特征融合,再使用卷积编码网络Netc把不同阶段的视觉特征进行重构编码融合,获得能够更准确地检测和识别图像中目标区域边界的一个具有不同阶段视觉特征和更加具有细粒度的全局视觉特征St,所述的过程公式如下:St=NetcConcatF1,F2,F33自适应区域特征Mt:使用全局视觉特征St通过一个卷积模块Netconv计算偏移量的可训练参数Woffset和惩罚权值参数Wmask,把获得的全局视觉特征St,Woffset,Wmask输入到可变形卷积网络Netdef,使用可变形卷积运算,实现目标特征区域的特征提取,得到自适应区域特征Mt,所述的过程公式如下:Woffset=NetconvStWmask=NetconvStMt=NetdefSt,Woffset,Wmask4通道和空间的特征信息表示Mt':采用视觉特征的通道与空间注意力模块Netcs挖掘自适应区域特征Mt的通道和空间的特征信息,把自适应区域关注特征Mt通过通道注意力子模块Netca和空间注意力子模块Netsa进行通道维度和空间维度信息挖掘和特征提取,获得具有通道和空间的特征信息表示M't,所述的过程公式如下:NetcaMt=WCH×MtNetsaNetcaMt=WSP×NetcaMtM't=NetcsMt其中,WCH表示通道权重,WSP表示空间权重;5生成姿态点热力图Ht:把具有通道和空间的特征信息表示M't和视觉特征F3进行特征融合,得到增强表示Ft',通过检测模块Neth获得姿态点热力图Ht,所述的过程公式如下:Ft′=F3+M′tHt=NethFt'

全文数据:

权利要求:

百度查询: 桂林电子科技大学 一种基于可变形卷积编码网络和特征区域关注的人体姿态估计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。