买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于图像理解的景别识别方法及装置_北京电子科技学院;北京电影学院_202310469073.4 

申请/专利权人:北京电子科技学院;北京电影学院

申请日:2023-04-27

公开(公告)日:2024-03-19

公开(公告)号:CN116597470B

主分类号:G06V40/10

分类号:G06V40/10;G06V10/40;G06V10/764;G06V10/774;G06V10/82;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2023.09.01#实质审查的生效;2023.08.15#公开

摘要:本发明涉及一种基于图像理解的景别识别方法及装置,涉及图像视觉技术领域,该方法包括:获取镜头图像;根据预设的美学标准对镜头图像进行美学分类,得到美学镜头图像;获取美学镜头图像中的人体信息,根据人体信息对美学镜头图像进行初步分类,得到初步分类图像,其中,人体信息包括人体目标信息和关键点信息;获取初步分类图像的图像深度,根据图像深度、人体信息和预设的景别定义对初步分类图像进行景别识别。本发明的有益效果:根据美学标准对镜头图像进行美学分类,利用图像处理计算镜头图像的图像深度和人体信息,并根据图像深度和人体信息进行镜头图像的景别识别,有效增加了景别识别的精确度和分类效率。

主权项:1.一种基于图像理解的景别识别方法,其特征在于,包括:步骤S1:获取镜头图像;步骤S2:根据预设的美学标准对所述镜头图像进行美学分类,得到美学镜头图像;所述根据预设的美学标准对所述镜头图像进行美学分类,包括:步骤S21:获取所述镜头图像中的构图信息;步骤S22:根据所述构图信息确定所述镜头图像中的主体部分和留白部分;步骤S23:分别获取所述主体部分和所述留白部分的光影信息,并计算所述主体部分的所述光影信息与所述留白部分的所述光影信息的光影比例;步骤S24:将所述构图信息和所述光影比例输入美学评分模型,得到美学分数,并根据所述美学分数对所述镜头图像进行美学分类,其中,所述美学评分模型以样本构图信息和样本光影比例为数据集,训练预设评分模型得到;所述根据所述美学分数对所述镜头图像进行美学分类包括:步骤S241:按照所述美学分数由高至低的顺序,将与所述美学分数对应的所述镜头图像进行排序;步骤S242:按照排序后从前到后的顺序,以预设比例,将所述镜头图像分为优等图像、中等图像、低等图像和次等图像,得到分类后的所述美学镜头图像;步骤S3:获取所述美学镜头图像中的人体信息,根据所述人体信息对所述美学镜头图像进行初步分类,得到初步分类图像,其中,所述人体信息包括人体目标信息和关键点信息;所述获取所述美学镜头图像中的人体信息,根据所述人体信息对所述美学镜头图像进行初步分类,得到初步分类图像,包括:步骤S31a:对所述优等图像、所述中等图像和所述低等图像进行人体目标检测,得到所述优等图像、所述中等图像和所述低等图像中的所述人体目标信息,其中,所述人体目标信息包括有人信息和无人信息;步骤S32a:根据所述人体目标信息对所述优等图像、所述中等图像和所述低等图像进行第一分类,得到场景有人图像和场景无人图像;步骤S33a:根据所述场景有人图像中所述人体目标信息,将所述场景有人图像分类为单人图像和多人图像;所述人体信息还包括注视目标信息,所述获取所述美学镜头图像中的人体信息,根据所述人体信息对所述美学镜头图像进行初步分类,得到初步分类图像还包括:步骤S31b:对所述多人图像进行注视目标检测,得到所述注视目标信息;步骤S32b:根据所述注视目标信息,对所述多人图像进行第二分类,得到有注视图像和无注视图像;步骤S33b:根据所述有注视图像中的所述注视目标信息,将所述有注视图像分类为唯一注视图像和多人注视图像;步骤S4:获取所述初步分类图像的图像深度,根据所述图像深度、所述人体信息和预设的景别定义对所述初步分类图像进行景别识别,其中,所述图像深度为所述初步分类图像中图像像素到拍摄镜头的平均距离;所述获取所述初步分类图像的图像深度,根据所述图像深度、所述人体信息和预设的景别定义对所述初步分类图像进行景别识别还包括:步骤S41:根据所述注视目标信息,确定所述唯一注视图像中的注视人物;步骤S41:对所述单人图像中的人物和所述唯一注视图像中的所述注视人物进行关键点检测,得到所述关键点信息;步骤S41:根据所述关键点信息和所述景别定义,分别对所述单人图像和所述唯一注视图像进行景别识别;其中,所述景别定义为包含胸以上关键点的特写、包含腰部以上关键点的近景、包含膝盖以上关键点的中景、包含脚以上关键点的全景和包含全部关键点的远景。

全文数据:

权利要求:

百度查询: 北京电子科技学院;北京电影学院 一种基于图像理解的景别识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。