申请/专利权人:匀熵智能科技(无锡)有限公司
申请日:2023-08-15
公开(公告)日:2024-03-22
公开(公告)号:CN117037215B
主分类号:G06V40/10
分类号:G06V40/10;G06V40/20;G06V10/52;G06V10/80;G06V10/776;G06V10/82;G06N3/0464;G06N3/045;G06N3/048;G06N3/084
优先权:
专利状态码:有效-授权
法律状态:2024.03.22#授权;2023.11.28#实质审查的生效;2023.11.10#公开
摘要:本发明涉及人体姿态估计技术领域,具体公开了一种人体姿态估计模型训练方法、估计方法、装置及电子设备,包括:获取训练数据集,所述训练数据集包括原始图像和标注数据,所述标注数据包括与所述原始图像对应的标注人体边界框和标注关键点数据;将所述原始图像输入至人体姿态估计网络结构,获得与所述原始图像对应的预测数据,所述预测数据包括预测人体边界框和预测关键点数据,所述人体姿态估计网络结构根据目标检测算法获得;根据所述预测数据及所述标注数据对所述人体姿态估计网络结构进行优化训练,获得人体姿态估计模型。本发明提供的人体姿态估计模型训练方法能够保证准确性的同时降低计算量。
主权项:1.一种人体姿态估计模型训练方法,其特征在于,包括:获取训练数据集,所述训练数据集包括原始图像和标注数据,所述标注数据包括与所述原始图像对应的标注人体边界框和标注关键点数据;将所述原始图像输入至人体姿态估计网络结构,获得与所述原始图像对应的预测数据,所述预测数据包括预测人体边界框和预测关键点数据,所述人体姿态估计网络结构根据目标检测算法获得;根据所述预测数据及所述标注数据对所述人体姿态估计网络结构进行优化训练,获得人体姿态估计模型;所述人体姿态估计网络结构根据目标检测算法获得,包括:对输入的原始图像进行多尺度特征提取,并获得N个尺度提取特征,其中N为大于1的自然数;将N个尺度提取特征中的至少M个尺度提取特征进行特征融合,获得M个特征融合结果,其中M为大于1的自然数,且M小于N;根据M个特征融合结果分别进行人体边界框检测和关键点数据检测,获得M个人体边界框检测结果和M个关键点数据检测结果;根据M个人体边界框检测结果进行预测获得M个预测人体边界框,以及根据M个关键点数据检测结果进行预测获得M个预测关键点数据;将N个尺度提取特征中的至少M个尺度提取特征进行特征融合,获得M个特征融合结果,包括:根据双向特征金字塔网络对N个尺度特征中的至少M个尺度提取特征进行特征融合;对至少M个尺度提取特征的融合结果进行注意力计算,获得M个特征融合结果;对输入的原始图像进行多尺度特征提取,并获得N个尺度提取特征,包括:将所述输入的原始图像进行向量处理,获得图像向量特征;对图形向量特征进行通道重排,获得重排向量特征;对所述重排向量特征进行特征分层处理,获得并行分层特征;针对每层特征分别进行卷积计算,获得分层特征计算结果;将分层特征的计算结果进行串联拼接,获得N个尺度提取特征;对输入的原始图像进行多尺度特征提取,并获得N个尺度提取特征,还包括在获得分层特征计算结果之前进行的:对获得的N个尺度提取特征进行通道注意力计算,获得通道注意力计算结果;根据通道注意力计算结果进行空间注意力计算,获得空间注意力计算结果。
全文数据:
权利要求:
百度查询: 匀熵智能科技(无锡)有限公司 人体姿态估计模型训练方法、估计方法、装置及电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。