武汉大学傅嘉滢获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利基于多模态大模型的建筑物矢量多边形轮廓提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119888257B 。
龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510360726.4,技术领域涉及:G06V10/44;该发明授权基于多模态大模型的建筑物矢量多边形轮廓提取方法是由傅嘉滢;何堰玺;陈世豪;季顺平设计研发完成,并于2025-03-26向国家知识产权局提交的专利申请。
本基于多模态大模型的建筑物矢量多边形轮廓提取方法在说明书摘要公布了:本申请公开了基于多模态大模型的建筑物矢量多边形轮廓提取方法、装置、存储介质及电子设备。该方法包括:获取建筑物的遥感影像和文本指令;将所述遥感影像和所述文本指令输入到训练好的多模态大模型中,得到建筑物多边形角点坐标序列,连接角点形成建筑物矢量多边形轮廓;其中,所述多模态大模型是通过预测‑裁剪协同训练策略进行训练的。本申请能够满足复杂场景下的效率与鲁棒性要求,并提升了对小尺度建筑物的特征捕捉能力。
本发明授权基于多模态大模型的建筑物矢量多边形轮廓提取方法在权利要求书中公布了:1.一种基于多模态大模型的建筑物矢量多边形轮廓提取方法,其特征在于,所述方法包括: 获取建筑物的遥感影像和文本指令; 将所述遥感影像和所述文本指令输入到训练好的多模态大模型中,得到建筑物多边形角点坐标序列,连接角点形成建筑物矢量多边形轮廓; 其中,所述多模态大模型是通过预测-裁剪协同训练策略进行训练的,所述预测-裁剪协同训练策略包括:对所述多模态大模型的训练样本进行预测,得到训练样本中每栋建筑物边界框范围,基于所述边界框范围对训练样本进行裁剪;其中,所述多模态大模型包括视觉编码器、文本指令编码器、多模态特征对齐模块和大语言模型,所述通过预测-裁剪协同训练策略训练多模态大模型的过程,包括: 标注遥感影像中每栋建筑物的中心点和边界框范围,作为第一训练样本集; 将所述第一训练样本集中的图像输入到所述多模态大模型中,第一步预测遥感影像上每栋建筑物中心点坐标,第二步基于所述建筑物中心点坐标预测每栋建筑物边界框范围; 基于每栋建筑物边界框范围真值,对所述遥感影像进行裁剪得到只包含单栋建筑物的局部区域,基于所述包含单栋建筑物的局部区域和真值轮廓构成第二训练样本集; 基于所述第二训练样本集对应的真值轮廓坐标,冻结多模态大模型的视觉编码器参数和文本编码器参数,训练多模态大模型的其余模块直至收敛。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。