【发明授权】一种基于架构搜索和自知识蒸馏的学习基因继承方法_东南大学_202311232774.2

导航：龙图腾网> 最新专利技术> 一种基于架构搜索和自知识蒸馏的学习基因继承方法_东南大学_202311232774.2

申请/专利权人：东南大学

申请日：2023-09-22

公开（公告）日：2024-04-16

公开（公告）号：CN117195951B

主分类号：G06N3/042

分类号：G06N3/042;G06N3/0464;G06N3/045;G06N3/048;G06N3/086;G06N3/084;G06V10/774;G06V10/778;G06V10/764;G06V10/82

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2023.12.26#实质审查的生效;2023.12.08#公开

摘要：本发明提供一种基于架构搜索和自知识蒸馏的学习基因继承方法，为后代网络搭建超网络；随机选取增强后的数据输入超网络和祖先网络；计算超网络与祖先网络特征图的差异来更新超网络的参数；从超网络中搜索相似度最高的后代网络架构。随机选取少量下游任务样本增强后输入后代网络，输出样本类别预测概率；输出后代网络中继承学习基因的层和未继承学习基因的层的特征图的相似度来蒸馏学习基因；利用分类和相似度损失更新后代网络。本发明方法即使在噪声数据上也具有优秀的分类性能；和随机初始化方法相比，在达到相似的分类精度时，需要更少的分类数据；在少数精细标注的数据条件下，本发明方法能快速训练自动生成的后代网络使其具有较高的分类性能。

主权项：1.一种基于架构搜索和自知识蒸馏的学习基因继承方法，其特征在于，包括如下步骤：为后代网络中没有继承学习基因的层设计可供选择的卷积操作，按顺序搭建超网络；随机从训练祖先网络的源数据中选取增强后的样本，作为超网络和祖先网络的输入，超网络输出卷积操作产生的特征图，与祖先网络输出的特征图计算相似度来更新超网络的参数；选择与祖先网络输出的特征图具有最高相似度的卷积操作构建后代网络；随机从下游任务的数据集中选取样本增强后作为后代网络的输入，输出对数据样本类别预测的概率；计算后代网络中继承学习基因的层和没有继承学习基因的层输出的特征图的相似度，用于蒸馏学习基因的知识；利用分类损失函数和计算相似度的损失函数更新后代网络；包括如下具体步骤：步骤S1：随机从数据集中选取增强后的数据样本，训练具有大量参数的祖先网络按照祖先网络中每一操作块梯度的变化情况，将最后3个操作块提取为可以被继承的学习基因层，这之前的层被称为非学习基因层；增强的方式为：在训练环节，对于CIFAR100数据集，采取随机裁剪样本成长宽均为32、随机水平翻转的增强方式，对于ImageNet-Tiny数据集，采取调整样本长宽为224、随机裁剪和随机水平翻转的增强方式；在测试环节，对于CIFAR100数据集样本不进行数据增强的操作；对于ImageNet-Tiny数据集，只将其中样本的长宽调整为224；步骤S2：根据祖先网络中非学习基因层输出的特征图尺寸的变化情况，将其划分为N个连续的操作块，具体为：其中为第i个操作块，符号表示相邻操作的连接；步骤S3：根据祖先网络划分的操作块的数量，搭建具有相同数量的超网络具体为其中为第i个操作块，超网络中每个操作块和祖先网络相同位置的操作块输出的特征图尺寸一致；步骤S4：随机从数据集中选取数据样本x0进行增强，固定祖先网络参数，输入到训练好的祖先网络中的第一个操作块中并输出第一个操作块产生的特征图f1，具体为随后以特征图f1作为第二个操作块的输入并输出产生的特征图f2，具体为以此类推，最终输出祖先网络每个操作块生成的特征图f1,…,fN；步骤S5：选取祖先网络操作块的输入作为超网络中对应的操作块的输入并返回超网络每个操作块生成的特征图步骤S6：根据步骤S4和步骤S5输出的特征图，以祖先网络相同操作块输出的特征图作为标签，分别计算超网络中相同位置的操作块输出的4个特征图和标签的相似度差异来计算梯度下降，以此分别更新候选卷积操作的参数，具体为：其中，i对应祖先网络和超网络第i个操作块，为超网络第i个操作块输出的特征图；步骤S7：固定由步骤S6训练得到的超网络中每个候选卷积操作块的参数，随机从测试数据集中选取数据样本s0，输入到训练好的祖先网络中，采取和步骤S4相同的方式输出祖先网络每个操作块生成的特征图f1,…,fN；步骤S8：采取和步骤S5相同的方式在采样的测试数据s0上，输出超网络每个操作块生成的特征图步骤S9：在测试数据s0上，利用步骤S6中计算特征图相似度差异的损失函数衡量超网络每个操作块下候选卷积操作块和祖先网络对应位置操作块生成的特征图f1,…,fN的差异，选择差异最小的候选卷积操作块为后代网络的层；步骤S10：将从祖先网络中提取到的学习基因层继承到后代网络中，构建被学习基因层初始化的后代网络层步骤S11：将所有被选择的候选卷积操作块按顺序组合，形成后代网络的非学习基因层，将这些非学习基因层与从祖先网络中提取到的学习基因层按前后顺序组合，构成后代网络的特征提取层，最后在后代网络的特征提取层后组合全连接层FC，形成完整的后代网络具体为：步骤S12：随机从下游任务数据集中选取少量训练数据x,yc，其中yc是输入数据x的所属类别标签，作为后代网络的输入，训练后代网络的下游任务数据集和训练祖先网络超网络的数据集不一致且没有交集，输出对训练数据样本类别预测的概率和后代网络特征提取层中产生的特征图o1,…,oN,oN+1：步骤S13：对于训练数据x，将后代网络预测的类别概率与标签yc做交叉熵损失，计算分类损失函数，所属的分类损失函数具体为：其中log表示对数函数；步骤S14：为后代网络的每个非学习基因层设计额外模块B1,…,BN用来输出与olg大小一致的特征图，将由非学习基因层输出的特征图o1,…,oN分别输入到对应的额外模块B1,…,BN中，输出特征图o'1,…,o'N，具体为：o'i＝Bioi,i∈[1,N]；步骤S15：将由额外模块输出的特征图o’1,…,o’N分别与由学习基因层输出的特征图oN+1计算相似度差异，计算的公式为：步骤S16：将步骤S13获得的分类损失函数和步骤S14获得的计算相似度差异损失函数整合，计算总体损失函数，表达式如下：其中，α是超参数，用来调整两种损失的权重大小；步骤S17：利用总体损失函数计算梯度下降，以此更新后代网络的参数。

全文数据：

权利要求：

百度查询：东南大学一种基于架构搜索和自知识蒸馏的学习基因继承方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于宫颈癌液基细胞学病理图像的大数据筛查方法_成都市第二人民医院_202410181103.6

下一篇：车联网隐私协议的更新方法、云端、车辆及存储介质_芜湖雄狮汽车科技有限公司_202410205978.5

相关技术

一种基于宫颈癌液基细胞学病理图像的大数据筛查方法_成都市第二人民医院_202410181103.6

车联网隐私协议的更新方法、云端、车辆及存储介质_芜湖雄狮汽车科技有限公司_202410205978.5

流式细胞分析数据与CCD图像数据融合方法、系统及介质_中国科学院苏州生物医学工程技术研究所_202410138803.7

一种带有机械手的卡整理装置_石家庄优创科技股份有限公司_202410223060.3

基于人工智能的血糖预测系统及方法_动运科学技术有限公司_202280067919.5

一种变径微导管双层外层挤出模具及其制备得到的变径微导管和制备方法_河南驼人贝斯特医疗器械有限公司_202410220087.7

测试钳及中置柜断路器回路电阻测试装置_国网山东省电力公司泰安供电公司_201910017586.5

包括柔性显示器的电子装置_东友精细化工有限公司_202280068042.1

一种聚丙烯酰胺-聚乙烯醇-MXene-PEDOT:PSS复合导电有机水凝胶及其应用_浙江理工大学_202410104028.3

光伏瓦片收边安装结构_天合光能股份有限公司_202410078859.8

甜味剂制剂_因克莱多有限公司_202280067749.0

一种利用延迟还原策略诱导富含金属缺陷簇的合金催化剂及其制备方法_北京化工大学_202410179079.2

蒸馏相关技术

模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473801.1

知识蒸馏方法、装置、终端设备及介质_平安科技(深圳)有限公司_202110780582.X

基于光伏的咸水淡化蒸馏处理装置_山东省农业机械科学研究院_202410264198.8

一种白酒酿造蒸馏设备_贾永凤_202322574756.4

基于知识蒸馏的轨道交通列车测速方法_西北工业大学太仓长三角研究院_202410457964.2

一种天然植物精油蒸馏萃取装置_广州中康医药科技有限公司_202322740033.7

一种组合式蒸馏塔_溧阳市百利丰和机械设备制造有限公司_202322068096.2

一种芳香类植物提取物生产用蒸馏设备_福建师范大学_202410416494.5

一种橡胶硫化促进剂NS高效蒸馏釜_聊城金歌合成材料有限公司_202323046290.7

一种基于知识图谱蒸馏的知识图谱嵌入压缩方法_浙江大学_202111152202.4

学习相关技术

学习桌支撑底座_浙江护童人体工学科技股份有限公司_202322435106.1

基于均衡选择及对比学习的含噪声标签图像学习方法与系统_江苏开放大学(江苏城市职业学院)_202410281796.6

基于联邦学习和双重监督对比学习的故障诊断方法及系统_山东大学_202410501155.7

针对结构的机器学习工具_SOM建筑设计事务所_202080011231.6

一种日语学习设备_何瀚洋_202322066052.6

一种互动学习装置_罗洁_202322824064.0

用于机器学习的方法和系统_国际商业机器公司_201980082058.6

机器学习样本权重调整方法和装置、存储介质_京东科技控股股份有限公司_202010922347.7

基于深度学习的厚全息优化方法及其系统_哈尔滨黎曼人工智能应用软件有限责任公司_202311661573.4

基于机器学习的蛋白质设计法_瑞福卡有限公司_202280064287.7

基因相关技术

用于燕麦茎中基因表达分析的内参基因及应用_吉林省白城市农业科学院(吉林省向日葵研究所)_202210632709.8

多拷贝基因蛋白表达系统_诺华股份有限公司_201880053428.9

水稻基因OsGUX1及其应用_四川农业大学_202410274646.2

一种基于端粒酶基因的双基因表达载体及其制备和应用_上海联衡生物科技有限公司_202410266249.0

用于肥胖相关疾病治疗的基因药物_合肥星眸生物科技有限公司_202410071956.4

合成基因的组合物、试剂盒及方法_天津大学合成生物前沿研究院_202410407400.8

修饰油菜素内酯受体基因以改善产量性状_成对植物服务股份有限公司_202280068221.5

一种基因测序样本用存储装置_南京赛唐生物科技有限公司_202321413991.7

一种基因测序光谱自纠正方法_南京溯远基因科技有限公司_202410180992.4

一种肉鸭基因筛选采集器_山东省动物疫病预防与控制中心(山东省人畜共患病流调监测中心)_202410243224.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于架构搜索和自知识蒸馏的学习基因继承方法_东南大学_202311232774.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务