【发明公布】一种融合局部与全局特征的高分影像建筑物提取方法_中国地震局地震预测研究所_202410096234.4

申请/专利权人：中国地震局地震预测研究所

申请日：2024-01-23

公开（公告）日：2024-04-26

公开（公告）号：CN117934864A

主分类号：G06V10/44

分类号：G06V10/44;G06V20/10;G06V10/80;G06V10/82;G06N3/0455;G06N3/0464

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.14#实质审查的生效;2024.04.26#公开

摘要：本发明涉及地震灾体评估技术领域，具体地说是一种融合局部与全局特征的高分影像建筑物提取方法,采用具有相同拓扑结构的分组卷积即ResNeXt替换TransUnet编码层中的骨干网络ResNet的标准卷积，在不增加参数量的情况下提高快速获取建筑物特征的能力。采用深度可分离卷积替换TransUnet中的相对位置编码方式以隐式地构建建筑物特征的位置信息，使Transformer同时获得建筑物全局特征信息和局部特征信息；采用通道注意力机制改进跳层，级联多尺度的建筑物特征，通过增强通道维上的显著特征表示，提高关键通道中建筑物特征的权重。最终在GF2影像数据集上开展广泛实验，以验证模型的有效性和实用性。

主权项：1.一种融合局部与全局特征的高分影像建筑物提取方法，其特征在于，包括以下步骤：S1，在TransUnet模型的基础上，对编码器CNN部分、编码器Transformer部分以及跳层连接解码器部分三个方面进行了改进，具体包括以下三个模块：S1-1，具有分组卷积的多尺度特征提取模块：对TransUnet编码器的CNN部分进行改进，利用分组卷积替换原本的标准卷积，使相同参数下的网络分割为更多的子网络来生成更加精确的建筑物局部特征，同时减少过拟合现象；S1-2，结合卷积与Transformer结构的局部与全局特征融合模块：对编码器的Transformer部分进行改进，将Transformer部分的位置编码方式替换为卷积隐式生成位置信息，获取建筑物全局特征信息的同时增强局部特征信息；S1-3，通道注意力增强的级联上采样模块：对解码器的特征融合处进行改进，加入通道注意力增强模块，从通道方向上增强建筑物特征的表征能力；所述S1-1具有分组卷积的多尺度特征提取模块的处理步骤为：S1-1-1，首先对输入建筑影像x∈R512×512×3进行卷积后经过最大池化后下采样得到建筑特征Z1∈R256×256×64，如下式1-1所示：式1-1：Z1＝ReLUMaxpool3×3conv7×7x；其中conv7×7x为7×7的卷积，Maxpool3×3为最大池化；S1-1-2，将特征Z1输入到多尺度特征提取模块中，利用由分组卷积构成的卷积模块计算多尺度特征，三个尺度的卷积模块个数分别为3、3、9，每个尺度的第一个卷积模块中，将3×3的卷积的步长设为2来缩小特征尺度，通过含有分组卷积的卷积模块分别得到三个尺度的浅层建筑特征：Z2∈R128×128×256；Z3∈R64×64×512；Z4∈R32×32×1024；其中分组卷积的计算公式为下式1-2～1-5所示：式1-2：式1-3：式1-4：式1-5：其中式1-2中表示将d个分组卷积得到的特征与建筑特征Z1进行拼接，经过ReLU非线性激活得到卷积模块的输出Z；式1-3、式1-4、式1-5表示对特征x’进行具有三层分组卷积的卷积模块计算，其中式1-3中的式1-4中的以及式1-5中的分别表示卷积大小为1×1、3×3、1×1的分组卷积，i表示第i个分组卷积，通过d个平行的相同卷积来提高建筑特征的通道局部相关性；所述S1-2结合卷积与Transformer结构的局部与全局特征融合模块的具体处理步骤为：S1-2-1，将深层次特征输入X∈R224×224×3经过含有zero-padding的卷积计算降低特征大小得到X′∈R56×56×48，同时构建隐式的位置关系，将其进行不重叠分块后得到图像块序列X″∈RN×C作为Transformer输入，经过注意力计算后将多头注意力计算的特征与X″进行拼接得到的图像块序列X″′∈RN×C；S1-2-2，进入MLP模块进行非线性变换得到Y；其次进入PEG模块，将Y大小重塑为H×W×D的建筑特征，考虑到深度可分离卷积在遥感语义分割任务表现出的良好提取效果，通过深度可分离卷积对建筑特征进行局部语义信息交互，获取位置编码信息，利用图像边界效应以及卷积的zero-padding操作获取绝对编码位置信息，达到强化建筑物局部语义信息的目的；S1-2-3，与重塑建筑特征reshape2Y相加得到具体位置编码信息的特征Y″∈RH×W×D；S1-2-4，将具有位置编码信息的建筑特征Y″还原为图像块序列大小后与Transformer输出特征相加，得到具有位置编码信息的Z∈RN×C，并输入到下一模块当中，其具体计算过程为；式1-6：Z＝reshape2Y″+Y；式1-7：Y″＝reshape1Y+GNDSWreshape1Y；式1-8：Y＝concateW2GeLUW1LNX″′+b1+b2；式1-9：X‘’‘＝concateMSALNX‘’X‘’；式1-10：X″＝split4×4X′；式1-11：X′＝conv1×1conv8×8X；其中，式1-6中的reshape2表示将建筑特征还原为图像块序列，其大小为N×C；式1-7中的reshape1表示对图像块序列Y∈RN×C进行重塑，DSW表示通过卷积核大小为7×7，padding为3的深度可分离卷积；式1-8中W1、b1和W2、b2表示MLP中两层全连接层的权重，GeLU表示非线性激活函数；式1-9中LNLayerNormal层归一化表示对X‘’在C维度上进行归一化，MSA表示多头注意力的计算，concate表示将X‘’与多头注意力计算的特征进行拼接；式1-10中split4×4表示窗口大小为4×4的图像块窗口；式1-11中conv8×8表示卷积核K＝8×8、步长S＝8的深度卷积，conv1×1表示输出通道数D＝48的1×1逐点卷积；所述S1-3通道注意力的增强模块的处理步骤为：对建筑特征X∈RH×W×C在通道维度上分别进行全局最大池化和全局平均池化操作，得到两个1×1×C建筑特征ymax、yavg，随后输入到具有共享权重的多层感知器进行语义交互，再将感知器输出的特征y′max与y′avg相加经过非线性激活后得到具有通道注意力的建筑特征zchannel；其具体计算步骤为：式1-12：Zchannel＝X×Sigmoidy′avg+y′max；式1-13：y′max＝MLPCReLUMLPcrymax；式1-14：y′avg＝MLPCReLUMLPcryavg；式1-15：yavg＝GAPX；式1-16：ymax＝GMPX；其中，式1-12中Sigmoid表示非线性激活函数；式1-13中MLPcr表示感知器的第一层，其神经元个数为cr，r为减少率，ReLU为激活函数；式1-14中MLPC表示感知器的第二层，其神经元个数为C；式1-15中GAP表示全局平均池化操作；式1-16中GMP表示全局最大池化操作；S2，经过三层上采样后经过一个3×3的卷积进行语义分割，得到预测的建筑提取图；S3，选取交叉熵损失函数与Dice损失函数结合的方式Ltotal对训练过程中的预测值进行优化，使网络模型在训练过程中求解出损失函数对应损失值最小时网络中权重参数ω的取值，每个损失函数的权重设为0.5，公式为：式3-1，argminLtotal|ω＝argmin0.5×Lce+0.5×LD|ω；其中Lce为交叉熵损失函数，LD为Dice损失函数；交叉熵损失函数Lce的公式为：式3-2：其中，C表示类别数，yi表示是否为该类别，如果是，yi为1，否则yi为0；pi表示样本i属于类别C的概率值，在中类别数C为1；Lce用于评估图像在分割过程中对像素点分类时所产生的损失，其能够衡量同一随机变量中的两个不同概率分布的差异程度，函数值越小，表明两个概率分布越相似，模型的预测效果越好；Dice损失函数LD的公式为：式3-3：其中，|x∩y|表示真实样本与预测样本的交集，|x|+|y|表示真实样本与预测样本的并集；|x|与|y|分别表示样本的元素个数，LD是用于评估预测图像与真实图像之间集合相似度的一种度量损失；S4，精度评价指标与评价策略：评价指标用于评估模型的在语义分割任务中的性能优劣，选择准确率、召回率、精确率、F1分数和交并比用来检验该网络模型预测的准确度，其公式如下：公式4-1：公式4-2：公式4-3：公式4-4：公式4-5：其中，TP表示标签为建筑像元预测为建筑像元的个数，FN表示标签为背景像元并预测为背景像元的个数，FP表示标签为背景像元预测为建筑像元的个数，TN表示标签为建筑像元预测为背景像元的个数；准确度Accuracy表示预测结果中被预测正确的建筑像元和背景像元占预测像元和样本像元的比例；精确度Precision表示预测结果中建筑像元被正确预测的个数占预测建筑像元的比例；召回率Recall表示预测结果中建筑像元被正确预测的个数占样本建筑像元的比例；交并比IOU表示预测建筑像元与样本建筑像元交集与并集的比例；综合精度得分F1用来综合评估提取效果。

全文数据：

权利要求：

百度查询：中国地震局地震预测研究所一种融合局部与全局特征的高分影像建筑物提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种多功能便捷式水龙头及其加工工艺_安徽路达铜业有限公司_202410306491.6

下一篇：一种单体废旧电池的正负电极端壳剥离方法及装置_南京环务资源再生科技有限公司_201810729584.4

相关技术

一种多功能便捷式水龙头及其加工工艺_安徽路达铜业有限公司_202410306491.6

一种单体废旧电池的正负电极端壳剥离方法及装置_南京环务资源再生科技有限公司_201810729584.4

一种高效加工燕尾槽的夹具_广东工业大学_201811223010.6

微型履带式红枣吸拾机_昌吉市新奥农业制造有限公司_201810435755.2

基于人工智能的血糖预测系统及方法_动运科学技术有限公司_202280067919.5

一种高强度多图案人造草坪及其制备方法_洛阳康迈斯人造草坪有限公司_202410478178.0

一种浮选机_洛阳昶威机械制造安装有限公司_202410474059.8

一种水利工程破碎装置_河南鹏飞建设工程有限公司_202410495054.3

一种多芯片电路板散热布局优化方法、装置及介质_中南民族大学_202410498961.3

用于医用注射器的弯曲式贮存器_贝克顿·迪金森公司_202280068030.9

针对由一个DCI调度的多个PDSCH传输或PUSCH传输的波束确定_联想(北京)有限公司_202180101107.3

一种木塑复合材料用界面改性润滑剂及其制备方法与应用_桂林毛嘉工艺品有限公司_202410373870.7

高相关技术

高舒适度眼镜_温州市嘉洋眼镜有限公司_202322704236.0

具有高UV透射率和高耐晒性的玻璃_肖特股份有限公司_202210555135.9

高加速寿命及高加速应力筛选试验箱_重庆哈丁环境试验技术股份有限公司_202322379137.X

一种高糖番茄高垄种植的种植方法_山东千歌农业开发有限公司_202410390513.1

应用于高烈度、高水位的库区码头挡墙_中铁上海设计院集团有限公司_202323095547.8

高散热滚动直线导轨副_浙江思特亿精密机械科技有限公司_202323160341.9

高光谱目标检测方法及装置_中国人民解放军陆军工程大学_202410107560.0

一种高刚性重型机床_杭州开兰重工机械有限公司_202310150408.6

一种高功率液冷电缆_四川九洲线缆有限责任公司_202410502108.4

高转换增益图像传感器_格科微电子(上海)有限公司_202211476886.8

影像相关技术

动物影像设备用动物仓与动物影像设备_武汉中科医疗科技工业技术研究院有限公司_202322007192.6

影像传输系统_瑞昱半导体股份有限公司_202110230996.5

一种影像量测辅助夹持装置及影像检测系统_日善电脑配件(嘉善)有限公司_202322727562.3

智能排版的影像处理装置_虹光精密工业(苏州)有限公司_202322762058.7

显示装置以及影像显示方法_友达光电股份有限公司_202211678212.6

医学影像分割方法和电子设备_北京邮电大学_202111035523.6

医用防辐射影像辅助决策系统及其应用_山东利百加信息科技有限公司_202410217097.5

一种医疗整形及美容影像管理系统_武汉诚迅科技有限公司_202310069978.2

背照式影像传感器及其制造方法_力晶积成电子制造股份有限公司_202211553898.6

一种影像数据发布方法和装置_中国电子科技集团公司第十五研究所_202410145208.6

特征相关技术

一种切换人脸特征的特征提取算法的方法及系统_江苏中控安芯信息安全技术有限公司_201911218174.4

基于全局特征和局部特征的多层级水下图像增强方法_中国科学院长春光学精密机械与物理研究所_202410240487.4

基于自适应特征选取和特征组合的农作物产量预测方法_安徽项知信息技术有限公司_202410227726.2

基于边缘引导特征网络的图像去雾方法以及边缘引导特征网络的训练方法_中国科学院微电子研究所_202410231691.X

超导磁体故障特征提取方法_中国航天科工飞航技术研究院(中国航天海鹰机电技术研究院)_202211481946.5

一种特征点识别与自动跟踪方法_中国工程物理研究院总体工程研究所_202410315429.3

生物特征识别方法、装置、设备以及存储介质_斑马智行网络(香港)有限公司_201810955916.0

空间碎片微动特征与电磁特性模拟装置_中国西安卫星测控中心_202322579414.1

特征检索方法、装置及计算机存储介质_浙江大华技术股份有限公司_202410172633.4

基于知识感知和用户多兴趣特征表示的新闻推荐方法及系统_中国人民解放军战略支援部队信息工程大学_202410273442.7

龙图腾网&IPTOP

【发明公布】一种融合局部与全局特征的高分影像建筑物提取方法_中国地震局地震预测研究所_202410096234.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务