买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于跨语言图像变化描述的井下管道泄漏描述方法及装置_合肥工业大学智能制造技术研究院;合肥工业大学_202110626949.2 

申请/专利权人:合肥工业大学智能制造技术研究院;合肥工业大学

申请日:2021-06-04

公开(公告)日:2024-03-19

公开(公告)号:CN113239886B

主分类号:G06V20/40

分类号:G06V20/40;G06V20/52;G06V20/70;G06V10/774;G06V10/82;G06N3/044;G06N3/0442;G06N3/0455;G06N3/0464;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2021.08.27#实质审查的生效;2021.08.10#公开

摘要:本发明公开了基于跨语言图像变化描述的井下管道泄漏描述方法及装置,所述方法包括:获取井下管道场景图像,对图像进行预处理得到训练集和测试集;构建基于双重动态注意力机制的跨语言图像变化描述模型;将基于双重动态注意力机制的跨语言图像变化描述模型在训练集上训练;利用训练好的基于双重动态注意力机制的跨语言图像变化描述模型对测试集进行测试,获得图像描述结果;本发明的优点在于:井下管道泄漏描述较为准确。

主权项:1.基于跨语言图像变化描述的井下管道泄漏描述方法,其特征在于,所述方法包括:步骤a:获取井下管道场景图像,对图像进行预处理得到训练集和测试集;步骤b:构建基于双重动态注意力机制的跨语言图像变化描述模型;所述基于双重动态注意力机制的跨语言图像变化描述模型包括编码器、嵌入了空间注意力机制的RNN网络、基于动态发言机制的动态注意模块和打标签模块,动态注意模块和打标签模块都是基于LSTM的递归模型,训练集或者测试集输入到编码器,编码器连接嵌入了空间注意力机制的RNN网络,RNN网络输出空间注意力结果也即需要注意的图像位置,嵌入了空间注意力机制的RNN网络连接动态注意模块,动态注意模块连接打标签模块,打标签模块输出当前词,对当前词进行分发,当前词中包含注意图像时间也即何时开始注意每个图像;采用1个ResNet-101网络作为编码器提取输入图像组特征(Xbef,Xaft);将输入图像组特征(Xbef,Xaft)输入到一个嵌入了双重注意力机制的RNN网络,对编码后的输入图像组特征(Xbef,Xaft)通过公式Xaft-Xbef做差得到差异特征Xdiff;将得到的差异特征Xdiff分别与输入图像组特征(Xbef,Xaft)连接,得到两个不同的空间注意力图像组Abef和Aaft;动态注意模块中的LSTM解码器将打标签模块的先前隐藏状态和lbef、ldiff、laft的视觉特征的潜在投影v作为输入,预测注意权重;将注意权重与视觉特征累积求和得到动态参与特征,动态参与特征和前一个词输入到打标签模块的LSTM解码器,生成当前词的分布,对当前词进行分发;所述ResNet-101网络包括顺序连接的1个conv1卷积层,3个conv2_x卷积层,4个conv3_x卷积层,23个conv4_x卷积层,3个conv5_x卷积层以及1个全连接层,conv1卷积层是一个步长为2的的卷积层,conv2_x卷积层由一个卷积核且数量64的卷积层、一个卷积核且数量64的卷积层以及一个卷积核且数量256的卷积层组成,conv3_x卷积层由一个卷积核且数量128的卷积层、一个卷积核且数量128的卷积以及一个卷积核且数量512的卷积层组成,conv4_x卷积层由一个卷积核且数量256的卷积层、一个卷积核且数量256的卷积层以及一个卷积核且数量1024的卷积层组成,conv5_x卷积层由一个卷积核且数量512的卷积层、一个卷积核且数量512的卷积层以及一个卷积核且数量2048的卷积层组成;步骤c:将基于双重动态注意力机制的跨语言图像变化描述模型在训练集上训练;步骤d:利用训练好的基于双重动态注意力机制的跨语言图像变化描述模型对测试集进行测试,获得图像描述结果。

全文数据:

权利要求:

百度查询: 合肥工业大学智能制造技术研究院;合肥工业大学 基于跨语言图像变化描述的井下管道泄漏描述方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。