湖南大学杨恺伦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南大学申请的专利一种全景街景图像生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119850864B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510323125.6,技术领域涉及:G06T17/05;该发明授权一种全景街景图像生成方法及系统是由杨恺伦;吴盛;滕飞;罗凯设计研发完成,并于2025-03-19向国家知识产权局提交的专利申请。
本一种全景街景图像生成方法及系统在说明书摘要公布了:本发明提供一种全景街景图像生成方法及系统,属于图像数据处理技术领域。本发明直接生成完整的具有真实畸变的全景图像,不需要通过多视角图像拼接的方式,能够在保留精确几何控制的基础上,生成具有全局亮度一致性和无缝衔接的并且带有真实畸变的高保真全景街景图像,并且提升了图像的真实性和一致性,减少了多视角生成的复杂度,显著提高了在自动驾驶场景中的适用性和实时性。通过引入多尺度几何控制及条件编码,结合预训练扩散模型,从道路BEV地图、3D目标框、相机姿态、文本描述等多条件输入生成具有真实畸变的全景街景图像,在生成过程中能够精确控制道路高程、目标物体高度等几何细节,显著提升了3D感知任务的训练效果。
本发明授权一种全景街景图像生成方法及系统在权利要求书中公布了:1.一种全景街景图像生成方法,其特征在于,包括如下步骤:步骤S1,构建数据集,所述数据集中包括多个自动驾驶场景下街道的原始全景图像以及道路BEV地图,为每个全景图像和道路BEV地图标注场景条件,所述场景条件包括3D目标框、相机姿态和文本描述;步骤S2,分别提取原始全景图像、BEV地图以及3D目标框的图像特征、相机姿态的几何特征以及文本描述的文本特征;将提取的图像特征通过畸变噪声调制后与几何特征以及文本特征相融合,生成多尺度编码特征;步骤S3,对多尺度编码特征进行解码,通过条件注意力机制将场景条件信息嵌入到解码过程中的每一层,生成能够精确反应场景条件的修正全景图像;步骤S4,基于无分类器指导的训练策略对生成的修正全景图像进行优化,在训练过程中随机丢弃部分场景条件,提升修正全景图像与场景条件信息的一致性,避免对场景条件的过度依赖;步骤S2中,图像特征的畸变噪声调制过程具体包括如下步骤:将图像特征经过扩散模型先加入噪声再去除噪声,在加噪声过程中引入畸变噪声,模拟全景图像中可能存在的几何畸变,畸变噪声通过控制函数调节噪声特性,使其符合道路几何形状及环境光学畸变的特征,畸变噪声在时间步的生成公式为: 式中,表示时间步时生成的畸变噪声;表示畸变噪声强度;表示畸变映射函数;表示时间步时的图像特征输入;表示控制随机噪声的强度;表示标准高斯噪声。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南大学,其通讯地址为:410082 湖南省长沙市岳麓区麓山南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。