【发明公布】一种多老师监督的无数据知识蒸馏方法_天翼电子商务有限公司_202211029941.9

导航：龙图腾网> 最新专利技术> 一种多老师监督的无数据知识蒸馏方法_天翼电子商务有限公司_202211029941.9

申请/专利权人：天翼电子商务有限公司

申请日：2022-08-25

公开（公告）日：2023-01-03

公开（公告）号：CN115564984A

主分类号：G06V10/764

分类号：G06V10/764;G06V10/82;G06N3/04;G06N3/08

优先权：

专利状态码：在审-公开

法律状态：2023.01.03#公开

摘要：本发明公开了一种多老师监督的无数据知识蒸馏方法，在不同的数据源上训练出多个大模型作为老师模型，基于迁移学习和知识蒸馏的理论在无数据的情况使用噪声生成图像，不断迭代优化图像生成质量，通过多个老师模型监督学生模型的训练，多个老师模型在输出层维度上参与监督学生模型训练。本发明在图像分类和文本分类数据集上获得较高的准确率，继而体现出本发明的有效性；在神经网络模型广泛应用的今天，神经网络的推理时间和大小是限制神经网络应用场景的主要因素，基于此，本发明能够在数据受限的情况下有效降低模型大小，同时融合多个数据源的模型知识，提高泛化能力，使神经网络能够应用到数据受限和计算受限的场景中。

主权项：1.一种多老师监督的无数据知识蒸馏方法，其特征在于，包括以下步骤：S1，在多个隐私数据源从零训练多个老师模型，损失函数使用交叉熵；老师模型在隐私数据集上面进行训练具有良好的泛化能力；S2，第一阶段，多个老师模型加载训练好的权重，冻结权重；初始化一个图像生成器，通过损失函数迭代更新图像生成器的权重；给定一组随机向量{z1，z2，···，zn}，由这些向量生成的图像是{x1，x2，···，xn}，其中xi＝Generatorzi；将这些图像输入到教师网络中，可以得到图像的输出{y1T，y2T，···，ynT}；然后通过ti＝argmax计算预测标签{t1，t2，···，tn}；如果Generator生成的图像与教师网络的训练数据具有相同的分布，则它们也应具有与训练数据类似的输出；因此，使用引入了一个损失，这鼓励教师网络生成的图像的输出接近一个热的类向量；通过将{t1，t2，···，tn}作为伪真值标签，将一个one-hot损失函数表示为：其中Hcross是交叉熵损失函数；通过引入一个热损失，期望生成的图像能够以更高的概率被划分为所有的教师网络关注的一个特定类别；换句话说，我们需要的是与教师网络完全兼容的合成图像，而不是任何场景的一般真实图像；j是多个老师网络的损失求和，n是batch-size大小，i是一个batch内的所有的样本求和；将教师网络提取的特征表示为它对应于完全连接层之前的输出；如果输入图像是真实的，而不是一些随机向量，则特征映射往往会收到更高的激活值；因此，将激活损失函数定义为： ||·||1表示L1范数,j的含义同上；使用信息熵损失来衡量生成图像的类别平衡；具体而言，给定概率向量p＝p1，p2，···，pk，测量p的混淆程度的信息熵计算为的值表示p拥有的信息量，当所有变量都等于1k时，信息量将取最大值；给定一组输出向量{y1T，y2T，···，ynT}，其中每类生成图像的频率分布为因此，生成图像的信息熵损失定义为整体的损失函数： S3，第二个阶段，图像生成模块相对稳定以后，初始化学生模型，固定图像生成器参数，针对学生网络使用知识蒸馏；软化概率分布如5，6所示；加入温度系数T是为了软化分布，提供更多的监督信息；最大化得到的标签和分类预测概率之间的交叉熵，多个老师网络与学生网络结构构成的知识蒸馏损失；Qi是不同的老师网络和学生网络某个分支分类器之间的知识蒸馏损失权重；Losshard是交叉熵损失，Q是蒸馏损失比例；p和q分别是老师模型的软化输出和学生模型的软化输出； S4，第三阶段是仅仅使用交叉熵对学生网络进行训练，这是为了促进模型的进一步收敛。

全文数据：

权利要求：

百度查询：天翼电子商务有限公司一种多老师监督的无数据知识蒸馏方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

下一篇：一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

相关技术

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

一种人参肽粉研磨设备_上海中盈经济发展(集团)有限公司_202322368406.2

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

蒸馏相关技术

废乙二醇提纯蒸馏装置_广西华大骄阳能源环保科技有限公司_202322550904.9

一种金属钙蒸馏罐_长治县金世恒合金科技有限公司_202410129661.8

一种列管式多效蒸馏机_湖北滨润环保科技有限公司_202321471661.3

一种硫代二丙酸二烷基酯用电加热蒸馏釜_三门峡奥科化工有限公司_202322136457.2

一种用于甘油蒸馏物料输送管道的取液装置_青岛金牛油脂科技有限公司_202322504106.2

图像蒸馏方法、装置、电子设备和计算机可读存储介质_第六镜科技(成都)有限公司_202410052250.3

浓缩蒸馏生产系统_广东智子智能技术有限公司_202311863082.8

果酒蒸馏设备_河南宝泉酒业有限公司_202410076205.1

果酒蒸馏后冷却装置_河南宝泉酒业有限公司_202410151566.8

一种蒸馏设备_江苏正济药业股份有限公司_202322484700.X

老师相关技术

一种便携式体育老师教学用智能手写板_吉林大学_202111418541.2

一种语文老师教学用黑板_洛阳师范学院_202223354974.9

一种老师教学用挂图架_洛阳师范学院_202223324840.2

一种老师教学用书本摆放架_洛阳师范学院_202223324839.X

一种防粉笔灰老师校服_漳平市金富山制衣有限公司_202320160621.0

用于大学老师数学教学的双曲抛物面离散模型教具及方法_平顶山学院_202211614795.6

一种体育老师篮球训用的腿部力量拉伸训练器_阿坝师范学院_202222703613.4

一种老师教学专用文件夹_西安医学院_202222752051.2

一种优化老师批阅作业的方法、装置、设备及存储介质_广州业速教育科技有限公司_202211147707.6

一种多老师监督的无数据知识蒸馏方法_天翼电子商务有限公司_202211029941.9

方法相关技术

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

通信方法及装置_华为技术有限公司_202010617172.9

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

信息处理方法_丰田自动车株式会社_202311358127.6

通信方法及装置_华为技术有限公司_202311024020.8

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

冰箱及其控制方法_LG电子株式会社_202080061858.2

龙图腾网&IPTOP

【发明公布】一种多老师监督的无数据知识蒸馏方法_天翼电子商务有限公司_202211029941.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务