【发明授权】一种基于RGB数据的单视角三维物体重建方法及装置_北京工业大学_202110765943.3

导航：龙图腾网> 最新专利技术> 一种基于RGB数据的单视角三维物体重建方法及装置_北京工业大学_202110765943.3

申请/专利权人：北京工业大学

申请日：2021-07-05

公开（公告）日：2024-04-09

公开（公告）号：CN113538662B

主分类号：G06T17/00

分类号：G06T17/00;G06T15/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2021.11.09#实质审查的生效;2021.10.22#公开

摘要：一种基于RGB数据的单视角三维物体重建方法及装置，能够将对象三维重建任务转换成基底系数矩阵的生成问题，挖掘可见部分和遮挡部分形状之间的关系，从而得到具有精确细节信息的三维体素，提升了三维模型重建精度。方法包括：1建立从潜在特征到初始三维体素的生成模型，该潜在特征由基底和系数线性组合而成。令训练集中的样本张成形状空间，经编码‑解码后得到其形状潜空间，对其进行矩阵分解求得基底表示Θ；利用系数回归网络实现系数回归任务，将测试集中的图像再经编码过程回归其对应形状的系数矩阵Y；则基底Θ和系数Y的线性组合实现基于图像的三维模型重建。2建模体素数据为切片数据，利用设计的切片Transformer对初始三维体素进行细化处理，实现基于图像的精细化三维模型重建。

主权项：1.一种基于RGB数据的单视角三维物体重建方法，其特征在于：该方法包括以下步骤：1建立从潜在特征到初始三维体素的生成模型，该潜在特征由基底和系数线性组合而成；令训练集中的样本张成形状空间，经编码-解码后得到其形状潜空间，对其进行矩阵分解求得基底表示Θ；利用系数回归网络实现系数回归任务，将测试集中的图像再经编码过程回归其对应形状的系数矩阵Y；则基底Θ和系数Y的线性组合实现基于图像的三维模型重建；2建模体素数据为切片数据，利用设计的切片Transformer对初始三维体素进行细化处理，实现基于图像的精细化三维模型重建；所述步骤1包括以下分步骤：1.1通过一个自编码器学习训练集中三维体素的潜在特征S，然后利用SVD来定义一组基底；1.2用一个图像编码器提取输入图像的特征表示Z，对于每个物体类别，对该类别内所有实例的潜在嵌入进行聚类，并把聚类结果作为形状先验B；然后设计基于Transformer的网络去回归系数，其利用自注意力机制建模并融合图像视觉特征和先验信息以探索它们之间的关联关系，且提高特征的上下文依赖关系并学习复杂的语义抽象信息以得到更好的系数表示Y；所述步骤1.2中，Transformer编码器用来建模并融合视觉图像特征和先验信息以得到系数表示，编码器包含L个相同块组成，每个块有两个子层；第一个子层是多头自注意机制，第二个子层是多层感知机网络，这两个子层的每一层都使用一个残差连接；自注意是Transformer的核心组件，它将特征映射的不同位置关联起来，自注意描述为一个映射函数，将查询矩阵Q，键矩阵K和值矩阵V映射到输出注意矩阵，都是矩阵，输出是由值的加权和计算得到的，其中分配给每个值得权重是通过相应的键和查询计算得到，在注意力操作中，使用比例因子进行适当的归一化，当d导致点积在数量级上的增长时，缩放点积注意力的输出表示为：其中Q，K，和V是由嵌入特征通过WQ，WK，和的线性变换计算得到的：Q＝ZWQ,K＝ZWK,V＝ZWV2多头自注意层MSA利用多个头对来自不同位置的表示子空间的信息进行联合建模，每个头平行地使用缩放点积注意力，多头自注意的输出将是h个注意头输出的拼接：MSAQ,K,V＝ConcatH1,H2,...,HhWoutHi＝AttentionQi,Ki,Vi,i∈[1,...,h]3给定嵌入特征则L层的特征Transfomer编码器结构表示为：Z'l＝MSALNZl-1+Zl-1,l＝1,2,...LZl＝MLPLNZl+Zl',l＝1,2,...LY＝LNZL,4其中LN·定义为层归一化操作，最后编码器输出就是求得的系数；将系数与基底相乘之后送入到解码器中进行解码，从而得到重建的初始三维体素Vcoa；所述步骤2中，对于每一个三维体素，首先将其定义为V；然后定义为切片方向,表示沿着x-y坐标平面对三维体素切片，得到集合，其中集合里包含一个dr×dr的二维切片序列，序列长度为dr；每个二维切片被转换为大小为Dl的特征向量，并把此特征向量作为每个切片特征，则切片特征矩阵T为dr×Dl；将此特征矩阵送入Transformer编码器中，则L层的Transfomer编码器结构表示为：T'l＝MSALNTl-1+Tl-1,l＝1,2,...LTl＝MLPLNTl+Tl',l＝1,2,...LM＝LNTL,6其中LN·定义为层归一化操作，Transformer编码器包含L个相同层，输出与编码器输入保持一样的大小，然后将优化后的切片拼接形成完整而准确的三维体素。

全文数据：

权利要求：

百度查询：北京工业大学一种基于RGB数据的单视角三维物体重建方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

下一篇：一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

相关技术

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

一种方便拆装的瓦楞机用瓦楞辊_浙江永暉瓦楞辊有限公司_202322675014.0

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

三维相关技术

三维存储器及其制备方法_长江存储科技有限责任公司_202011545786.7

三维(3D)辅助个性化家庭对象检测_华为技术有限公司_201980090046.8

一种高效的三维旋转送料缝纫机_温州瀚海机电科技有限公司_202322477296.3

三维光学衍射层析成像方法及装置_唐摩库柏公司_202010932532.4

量化三维点云数据的表面平整度的设备及方法_艾光电子有限公司_202080069378.0

基于圆柱对称模型的单通道SAR目标三维坐标提取方法_西安电子科技大学_202110763425.8

一种制药用搅拌机及三维混合机_福建益昕葆生物制药有限公司_202111163067.3

一种植物群体三维表型数据采集装置及方法_北京市农林科学院信息技术研究中心_202111013344.2

一种三维存储器及其制作方法_长江存储科技有限责任公司_202011283688.0

接合的三维存储器器件及其制造方法_桑迪士克科技有限责任公司_201980078807.8

物体相关技术

物体检测方法、物体检测装置以及机动车辆_法雷奥汽车内部控制(深圳)有限公司_202211300042.8

用于产生对物体的照明的设备和方法_阿尔内·魏斯_202280060343.X

基于RGB视频的物体重建方法和装置_清华大学_202110832398.5

一种动物体生理指标检测设备_南通芯联心科技发展有限公司_202321367684.X

煤流监测兼物体入侵识别装置_徐州矿达机电科技有限公司_202322827671.2

一种用于物体搬运货仓车架_青岛贵通工贸有限公司_202322328365.4

用于清洁物体检测传感器的装置和方法_现代摩比斯株式会社_202111220832.0

一种地下管廊移动物体的精确定位方法及系统_通号通信信息集团有限公司_202011228718.8

物体检测装置、物体检测方法以及物体检测程序_株式会社电装_202280059573.4

一种物体标识装置及物体标识方法_珠海新华通软件股份有限公司_202311718734.9

视角相关技术

一种多视角分层的电磁态势标绘显示方法及系统_中国电子科技集团公司第二十九研究所_202410182056.7

一种视角切换方法、装置、设备及介质_海信集团控股股份有限公司_202311819810.5

一种便于配合视角进行角度调节的导航仪_孟凡宗_202321834894.5

一种高性能全视角液晶显示屏检测方法及系统_深圳市鑫显光电科技有限公司_202410008168.0

一种基于无人机视角语义分割的导航地图构建方法_北京理工大学_202311649087.0

一种基于可导渲染的多视角视频人脸牙齿重建方法_清华大学_202410045148.0

一种双视角跨模态重建CT影像的方法_电子科技大学_202311687658.X

空地视角图像协同的车载系统定位方法、终端及存储介质_深圳大学_202311746880.2

一种便携式全视角医疗显示屏_浙江国显科技有限公司_202322640747.0

一种运动式多视角图像采集装置_安徽炬视科技有限公司_202321633138.6

龙图腾网&IPTOP

【发明授权】一种基于RGB数据的单视角三维物体重建方法及装置_北京工业大学_202110765943.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务