买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于人眼视觉注意机制的仿生双眼目标识别与跟踪方法_中国科学院上海微系统与信息技术研究所_202011298898.7 

申请/专利权人:中国科学院上海微系统与信息技术研究所

申请日:2020-11-18

公开(公告)日:2024-04-02

公开(公告)号:CN112418296B

主分类号:G06V20/00

分类号:G06V20/00;G06V10/764;G06V10/82;G06V10/80;G06V10/25;G06T7/246;G06F40/289;G10L15/26

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.03.16#实质审查的生效;2021.02.26#公开

摘要:本发明涉及一种基于人眼视觉注意机制的仿生双眼目标识别与跟踪方法,包括:仿生双眼装置对当前场景进行检测;构建实例级分割网络、和显著性注视点检测网络以及人体姿态检测网络;将当前场景的图像信息输入所述实例级分割网络,得到当前场景下的实例级分割结果图;尝试基于当前场景中的语音信息、人体姿态检测网络和显著性注视点检测网络获取显著性注视点区域的掩码图;将显著性注视点区域的掩码图与实例级分割结果图相对准,获取当前场景中的显著性目标及其实例级类别和轮廓,仿生双眼装置对该显著性目标进行追踪。本发明提高了跟踪切换鲁棒性,能使最终结果更精确,也更贴近人眼视觉机制。

主权项:1.一种基于人眼视觉注意机制的仿生双眼目标识别与跟踪方法,其特征在于,包括:步骤S1,提供一仿生双眼装置,该仿生双眼装置对当前场景进行检测,获取当前场景的多模态信息,其中,多模态信息包括图像信息和语音信息;步骤S2,构建实例级分割网络、和显著性注视点检测网络以及人体姿态检测网络;步骤S3,将当前场景的图像信息输入所述实例级分割网络,得到当前场景下的实例级分割结果图,其中,实例级分割结果图中包括实例级类别和轮廓;步骤S4,尝试基于当前场景中的语音信息获取显著性注视点区域的掩码图,尝试成功时,进行步骤S5;尝试不成功时,则继续尝试基于所述人体姿态检测网络获取显著性注视点区域的掩码图,尝试成功时,进行步骤S5;尝试不成功时,则继续尝试基于所述显著性注视点检测网络获取显著性注视点区域的掩码图,尝试成功时,进行步骤S5;尝试不成功时,则结束步骤;步骤S5,将得到的显著性注视点区域的掩码图与所述步骤S3中得到的实例级分割结果图相对准,获取当前场景中的显著性目标及其实例级类别和轮廓,所述仿生双眼装置对该显著性目标进行追踪;所述步骤S4包括:步骤S41,判断所述仿生双眼装置是否检测到当前场景中的语音信息,若是,则进行步骤S42,若否,则进行步骤S43;步骤S42,根据当前场景中的语音信息判断当前的语音交互的讨论内容是否与所述步骤S3中得到的实例级类别相关,若是,则将与讨论内容相关的实例级类别作为显著度最高的目标类别,生成显著性注视点区域的掩码图,进行步骤S5;若否,则进行步骤S43;步骤S43,将当前场景的图像信息输入所述人体姿态检测网络,对图像信息中的人体关键点进行检测,判断当前场景中人体是否存在特定动作,若是,则根据人体的关键点确定显著性注视点,生成显著性注视点区域的掩码图,进行步骤S5,若否,则进行步骤S44;步骤S44,将当前场景的图像信息输入所述显著性注视点检测网络,生成显著性注视点预测结果,并基于显著性注视点预测结果获取显著性注视点区域的掩码图;所述步骤S44包括:步骤S441,将若干连续帧的图像输入显著性注视点检测网络,得到若干连续帧的网络输出结果和仿生双眼装置追踪连续帧图像的转角数据,缓存得到的网络输出结果和转角数据;步骤S442,针对步骤S441中的若干连续帧,缓存处于静止状态的连续帧,建立显著点次数统计表;步骤S443,从网络输出结果中获取若干连续帧的最显著点的坐标,并判断当前帧i是否满足替换条件,若满足替换条件,则由前一帧i-1的网络输出结果替换当前帧i的网络输出结果,更新缓存的网络输出结果,进行步骤S444;若不满足替换条件,则直接进行步骤S444;步骤S444,判断此时的当前帧i是否为跳转初始帧,若是,则将缓存的显著点次数统计表全部清零;若否,则更新显著点次数统计表;步骤S445,针对步骤S444中得到的显著点次数统计表,采用高斯衰减策略得到显著性衰减系数图,将该显著性衰减系数图乘在当前帧i的网络输出结果图上,得到当前帧i最终的显著性注视点区域的掩码图。

全文数据:

权利要求:

百度查询: 中国科学院上海微系统与信息技术研究所 基于人眼视觉注意机制的仿生双眼目标识别与跟踪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。