买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于两分支交互的行人搜索方法_天津大学_202410039070.1 

申请/专利权人:天津大学

申请日:2024-01-10

公开(公告)日:2024-04-09

公开(公告)号:CN117854005A

主分类号:G06V20/52

分类号:G06V20/52;G06V10/25;G06V10/44;G06V10/774;G06V10/82;G06N3/0464;G06N3/084

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明提供一种基于两分支交互的行人搜索方法,所采用的行人搜索网络包括主干网络、连接网络、检测预测网络和重识别预测网络,包含下列步骤:准备行人图像数据集;训练行人搜索网络,分为以下子步骤:采用ImageNet预训练模型的参数初始化主干网络的权重;将训练集图像输入行人搜索网络,经过主干网络输出特征图;将特征图输入到连接网络中输出候选框,对候选框进行RoI特征提取,输出RoI特征;将RoI特征输入预测网络,经过检测预测网络生成行人检测特征以及检测结果;将RoI特征和行人检测特征输入重识别预测网络;将静态重识别特征和动态重识别特征输入交叉注意力模块计算两个重识别特征之间的注意力权重,输出最终的行人重识别特征以及重识别结果。

主权项:1.一种基于两分支交互的行人搜索方法,采用单步行人搜索的网络框架,构建基于深度卷积神经网络的行人搜索网络,包括主干网络、连接网络和预测网络三部分,其中预测网络分为检测预测网络和重识别预测网络,包含下列步骤:步骤1:准备行人图像数据集;步骤2:将数据集划分为训练集和测试集;步骤3:设置训练总共进行的周期数、训练学习率参数;步骤4:训练行人搜索网络,分为以下子步骤:子步骤1:初始化主干网络的权重;子步骤2:将训练集图像输入行人搜索网络,经过主干网络输出特征图;子步骤3:将特征图输入到连接网络中输出候选框,对候选框进行RoI特征提取,输出RoI特征;子步骤4:将RoI特征输入预测网络,经过检测预测网络生成行人检测特征以及检测结果;将RoI特征和行人检测特征输入重识别预测网络;重识别预测网络包括静态重识别模块和动态重识别模块两个并联分支;其中,静态重识别模块由两个全连接层串联构成,将RoI特征输入静态重识别模块生成静态重识别特征;动态重识别模块包括串联的动态卷积层和全连接层;将行人检测特征输入全连接层生成动态卷积计算所需的参数矩阵,再将参数矩阵均分为两部分,一部分部分作为第一个子参数矩阵,另一部分转置后作为第二个子参数矩阵;随后在动态卷积层中进行动态卷积计算,其过程为:将RoI特征依次与上述两个子参数矩阵进行卷积计算,输出中间特征;将中间特征输入动态卷积层串联的全连接层,输出动态重识别特征;将静态重识别特征和动态重识别特征输入交叉注意力模块计算两个重识别特征之间的注意力权重,输出最终的行人重识别特征以及重识别结果;子步骤5:设定模型训练的损失函数,该损失函数包括行人检测的损失函数和行人重识别的损失函数;通过深度卷积神经网络中的反向传播算法,更新网络的权重参数;子步骤6:完成模型训练。

全文数据:

权利要求:

百度查询: 天津大学 一种基于两分支交互的行人搜索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。