买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于多模态无人机航拍的电力系统实时语义分割方法_泉州装备制造研究所_202410107385.5 

申请/专利权人:泉州装备制造研究所

申请日:2024-01-26

公开(公告)日:2024-04-26

公开(公告)号:CN117635953B

主分类号:G06V10/26

分类号:G06V10/26;G06N3/0455;G06N3/0464;G06N3/048;G06N3/08;G06T7/10;G06V10/44;G06V10/80;G06V10/82

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2024.03.19#实质审查的生效;2024.03.01#公开

摘要:本发明公开一种基于多模态无人机航拍的电力系统实时语义分割方法,涉及图像数据处理领技术领域;本发明方法通过利用多传感器采集多模态信息,采用多级小波变换分析、特征级别多模态信息交互、全局多模态信息交叉引导,充分发挥多模态信息的互补能力,有效提升无人机航拍电力系统的分割检测性能;利用非对称加速理论,设计轻量级多模态特征编码器,使之更加契合无人端侧部署需求;建立了一个定量度量mIoU和FPS之间平衡关系的计算法。

主权项:1.一种基于多模态无人机航拍的电力系统实时语义分割方法,其特征在于,包括:S1,在RGBD多模态非对称编码阶段通过多级小波变换进行多尺度特征交互,并利用特征级多模态特征交互,通过卷积建立多种模态信息的局部相关性;S2,根据RGBD多模态非对称编码器在每个阶段的使用结果,通过多模态全局上下文模块进行全局信息融洽,得到融合特征图;S3,根据所述融合特征图的分辨率,通过对应的分割头利用深度监督进行多模态语义分割,并通过所述RGBD多模态非对称编码器进行加速处理;其中,所述RGBD多模态非对称编码器包括深度非对称编码器和结构非对称编码器;S4,根据F-score算法,建立mIoU和FPS之间定量比较的评价指标;其中,所述F-score算法如公式(1)所示,所述评价指标如公式(2)所示: ;公式(1)中,Precision表示精确率,Recall表示召回率,表示调节因子,公式(2)中,的取值0.5;其中,所述S1,具体包括:S11,在浅层网络将所述多模态特征映射到高维空间,通过所述多级小波变换产生不同分辨率的低频特征和高频特征;S12,根据所述低频特征和高频特征,根据不同分辨率分发至对应阶段;其中,所述S2,具体包括:S21,通过RGB信息和Depth信息分别将通道维度信息压缩到对应的低维空间内,所述低维空间包括全局信息;S22,根据所述低维空间,通过softmax函数得到全局空间嵌入向量RGB和Depth的注意力系数;S23,根据所述Depth的注意力系数,通过引导RGB分支全局注意力,进行引导所述RGB分支的原始特征图;S24,根据多模态交叉引导的特征进行关联,通过常规卷积完成特征融合。

全文数据:

权利要求:

百度查询: 泉州装备制造研究所 一种基于多模态无人机航拍的电力系统实时语义分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。