【发明授权】基于自适应任务权重的多任务网络模型训练方法及系统_杭州电子科技大学_202210492786.8

申请/专利权人：杭州电子科技大学

申请日：2022-05-07

公开（公告）日：2024-04-16

公开（公告）号：CN114819091B

主分类号：G06V10/82

分类号：G06V10/82;G06N3/045;G06N3/047;G06N3/084;G06V10/764;G06V10/766;G06V10/26;G06F9/48;G06T7/66

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2022.08.16#实质审查的生效;2022.07.29#公开

摘要：本发明涉及基于自适应任务权重的多任务网络模型训练方法及系统。本发明通过一个特定于任务的策略学习共享模式，该策略自主选择在多任务网络中执行哪些层，并且能够同时搜索与任务较匹配的权重，以更好地训练模型。本发明基于ResNet重构了多任务网络模型，训练过程中根据数据集中的图像有效地优化了学习策略，提高了任务指标的同时克服了多任务模型的单一性。本发明基于概率论极大似然估计推导了适用于回归和分类任务的多任务损失函数，其能够在训练过程中自动调节任务权重以更好地提升模型性能，克服了任务权重不灵活的问题。

主权项：1.一种适用于图像的语义分割和表面法线估计的两个任务分类方法，其特征在于包括以下步骤：步骤1、选取数据集并进行预处理获取由室内场景RGB图像构成的数据集NYUv2，包括语义分割图像和像素级表面法线真实度；步骤2、构建多任务网络模型；其中多任务网络模型包括多个任务的网络模型；每个任务的网络模型包括ResNet主干网络、特定任务层；特定任务层由1个ASPP层组成，每个ASPP层包括四个并行的分类模块；每个任务的输出是由四个分类模块的结果进行相加；步骤3、对多任务网络模型进行预训练；具体是3-1利用学习策略对每个任务的网络模型进行自适应学习；所述学习策略具体如下：给定一组相关的任务，假设其集合为T＝{T1,T2,…,TK}，对任务Tk模型中主干网络的每一残差块l赋予决策变量ul,k，该决策变量ul,k∈{0,1}，当ul,k＝0时对任务k跳过第l层，当ul,k＝1时对任务k选择第l层；由于决策变量ul,k是离散不可微的，因此可将通过GumbelSoftmax采样方法使其连续化；假设任务k选择第l个残差块的概率为αl,k，那么关于ResNet主干网络残差块l的策略分布即为πl,k＝[1-αl,k,αl,k]，利用其得到选择或跳过决策：其中j∈{0,1}，分别对应跳过和选择决策；Gl,k＝-log-logUl,k，Ul,k采样于标准0,1均匀分布；利用重参数化技巧消除argmax操作：其中τ为一个大于零的参数，它控制着函数vl,k的平滑程度；当τ趋近于0时，vl,k无限接近于πl,k，当τ大于0时，vl,k是一个平滑的曲线，可以通过梯度下降法对其进行优化；3-2对每个任务的网络模型构建对应的任务损失；具体如下：1回归任务损失假设给定网络模型输入为x，网络权重为W，输出为fWx；将高斯分布作为回归任务的概率模型，模型输出作为均值，即：py1|fWx＝NfWx,σ123其中NfWx,σ12表示均值为fWx，标准差为σ1的正态分布，y1为回归任务的原始标签值，py1|fWx表示以模型输出fWx为条件，正态分布取到y1的概率，σ1为回归任务的观测噪声标量；对上式3两边取对数可得：因此回归任务损失即为：其中表示一种回归任务的损失；2分类任务损失利用Softmax函数获取网络模型的输出概率，并按照σ22对其进行缩放，可得：其中y2为分类任务的原始标签值，其中σ2为一个正的标量，可解释为玻尔兹曼分布，在其中被称为温度，这个标量是可以学习的，它决定了这个分布的平滑程度；同理，对上述公式取对数可得：其中c表示一种分类结果，表示分类任务的输出向量，其中的元素代表每种分类结果的概率，表示第c′种分类结果的概率；是模型输出向量fWx中的元素；因此可得分类任务损失即为：其中作为分类任务的交叉熵损失，当σ2趋近于1时，3利用回归任务损失和分类任务损失构建联合损失假设y1，y2为回归和分类任务的原始标签值，综上可得联合损失即为： 3-3对每个任务的网络模型构建辅助任务损失1稀疏损失：其中αl,k为任务k选择第l个残差块的概率；2共享损失：其中L表示残差块总数，l表示第l个残差块，和表示任务k1和k2选择第l块的概率；3-4对所有任务的网络模型构建多任务总损失其中ωsp和ωsh分别为稀疏损失和共享损失对应的权重；步骤4、对多任务网络模型进行再训练：获取预训练过程中多任务网络模型的最优任务权重，并获取每个任务的最优学习策略；利用最优学习策略构建每个任务的最优网络模型，然后在最优任务权重下进行再训练；步骤5、利用训练好的多任务网络模型进行语义分割和表面法线估计。

全文数据：

权利要求：

百度查询：杭州电子科技大学基于自适应任务权重的多任务网络模型训练方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种铸造铝合金中第二相空间分布均匀性的表征方法_华南理工大学_202210274792.6

下一篇：一种打扣机及工作方法_汇新智能科技(苏州)有限公司_201910831010.2

相关技术

一种铸造铝合金中第二相空间分布均匀性的表征方法_华南理工大学_202210274792.6

一种打扣机及工作方法_汇新智能科技(苏州)有限公司_201910831010.2

一种抗旋转攻击的矢量地理数据数字水印方法_金陵科技学院_202111259854.8

一种氮掺杂碳包覆MoC/MoO₂量子点异质结材料、制备方法及应用_合肥师范学院_202211735057.7

一种立式镗铣床加工用除杂装置_蚌埠市富瑞达机床机械制造有限公司_202011602435.5

一种核素治疗后使用的自动水化治疗系统_中国人民解放军空军军医大学_202111466443.6

轴对称应力条件下顶管泥浆套减阻性能测定装置及方法_西安理工大学_202110840090.5

一种野外矿产样品取样装置_李阳_202011273263.1

一种火花机加工中心专用调节装置_广东牧野迪克精密机械有限公司_202011612998.2

一种适应智能化测斜的测斜管装置及其施工方法_中国建筑第二工程局有限公司_202211243629.X

一种烹饪器具_杭州老板电器股份有限公司_202210803322.4

一种发动机扭矩控制方法、装置及车辆_长城汽车股份有限公司_202111257306.1

网络相关技术

一种网络云Overlay网络与Underlay网络叠加的方法及装置_中盈优创资讯科技有限公司_202311788114.2

适配总线型网络和交换型网络的系统_中国航空研究院_202011490399.8

网络切片管理方法、系统及通信网络_广州爱浦路网络技术有限公司_202410069924.0

用于监测基于链的网络的通信网络_泰科电子英国有限公司_201980066396.0

网络的选择方法、选择装置和网络选择系统_南方电网科学研究院有限责任公司_202410099224.6

网络功能的控制_诺基亚通信公司_201980100557.3

网络失步重连方法及网络失步重连系统_芯翼信息科技(南京)有限公司_202110129983.9

一种基于网络补丁的神经网络遗忘学习方法及装置_浙江大学杭州国际科创中心_202311835375.5

基于蜂窝网络的网络选择方法、设备以及存储介质_浙江大华技术股份有限公司_202311788208.X

用于5G网络的跨区域网络切片对等_华为技术有限公司_201880099840.4

任务相关技术

任务处理方法、任务处理装置、电子设备及存储介质_宁德时代新能源科技股份有限公司_202311600426.6

数据任务处理方法及装置_华为云计算技术有限公司_202211257053.2

一种任务设备吊装结构_哈尔滨飞机工业集团有限责任公司_202311736831.0

任务调度方法及其装置、设备、介质_广州商研网络科技有限公司_202410159151.5

渲染任务处理方法、装置、设备及存储介质_北京石境科技有限公司_202410057376.X

任务执行方法、装置，设备及计算机介质_北京有竹居网络技术有限公司_202410130685.5

多任务多模态数据仿真方法和装置_清华大学_202311766510.5

一种多AGV任务分配方法_无锡学院_202410087306.9

任务编排方法、系统、装置及存储介质_上海哔哩哔哩科技有限公司_202410101923.X

随机返工多任务调度方法、装置、设备及介质_广东工业大学_202410119895.4

训练相关技术

下肢训练器_河北大艾智能科技股份有限公司_202322473477.9

小鼠抗阻训练装置_莫斯莱特(杭州)生物技术有限公司_202322740826.9

踝泵运动训练装置_东莞东华医院有限公司_202322103398.9

一种预测模型训练方法、代码生成模型训练方法、装置_之江实验室_202311771630.4

模型的训练方法、训练装置、电子设备和可读存储介质_中国电信股份有限公司_202211116815.7

训练设备、训练方法和计算机可读记录介质_富士通株式会社_202010071123.X

踝关节康复训练器及康复训练装置_北京软体机器人科技股份有限公司_202410102287.2

盆底肌训练装置和盆底肌训练组件_厦门松霖科技股份有限公司_202321948869.X

训练样本获取及大模型优化训练方法和装置_北京百度网讯科技有限公司_202311765328.8

一种大规模作战模拟训练系统及其训练方法_西安羚控电子科技有限公司_202311585378.8

龙图腾网&IPTOP

【发明授权】基于自适应任务权重的多任务网络模型训练方法及系统_杭州电子科技大学_202210492786.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务