【发明授权】CTR预测模型的知识蒸馏方法及装置_深圳须弥云图空间科技有限公司_202310820709.5

导航：龙图腾网> 最新专利技术> CTR预测模型的知识蒸馏方法及装置_深圳须弥云图空间科技有限公司_202310820709.5

申请/专利权人：深圳须弥云图空间科技有限公司

申请日：2023-07-06

公开（公告）日：2023-11-10

公开（公告）号：CN116542328B

主分类号：G06Q30/0202

分类号：G06Q30/0202;G06N5/02

优先权：

专利状态码：有效-授权

法律状态：2023.11.10#授权;2023.08.22#实质审查的生效;2023.08.04#公开

摘要：本申请涉及机器学习技术领域，提供了一种CTR预测模型的知识蒸馏方法及装置。该方法包括：获取多个已训练好的重量级的教师模型和一个未被训练的轻量级的学生模型；将训练数据分别输入学生模型和多个教师模型，得到学生模型和多个教师模型各自的输出；利用门控模型确定多个教师模型各自的输出对应的权重，并基于多个教师模型各自的输出所对应的权重，计算多个教师模型各自的输出的加权和；基于学生模型的输出和加权和，利用目标损失函数计算损失值，并基于损失值更新学生模型的模型参数，以完成从多个教师模型到学生模型的知识蒸馏。采用上述技术手段，解决现有技术中，通过知识蒸馏得到的小规模的CTR预测模型往往使用效果不尽人意的问题。

主权项：1.一种CTR预测模型的知识蒸馏方法，其特征在于，包括：获取多个已训练好的重量级的教师模型和一个未被训练的轻量级的学生模型，其中，所述学生模型和多个教师模型均为CTR预测模型；获取训练数据，将所述训练数据分别输入所述学生模型和多个教师模型，得到所述学生模型和多个教师模型各自的输出；利用门控模型确定多个教师模型各自的输出对应的权重，并基于多个教师模型各自的输出所对应的权重，计算多个教师模型各自的输出的加权和；基于所述学生模型的输出和所述加权和，利用目标损失函数计算损失值，并基于所述损失值更新所述学生模型的模型参数，以完成从多个教师模型到所述学生模型的知识蒸馏；其中，更新模型参数后的所述学生模型应用于网络购物场景，用于预测推荐给用户的目标，所述训练数据是大量用户点击购买商品的数据；其中，基于所述学生模型的输出和所述加权和，利用目标损失函数计算损失值：；其中，为所述学生模型的输出，为所述加权和，x为所述训练数据，y为所述训练数据的标签，下标s用于标记为所述学生模型的输出，下标t用于标记是所述加权和，与多个教师模型各自的输出相关，τ为所述学生模型和多个教师模型的温度超参，和均与τ相关，为交叉熵损失函数，为计算推土机距离的函数，β为预设权重；其中，将所述训练数据按照预设比例划分为第一训练数据和第二训练数据；将所述第一训练数据中的样本输入所述学生模型，得到所述学生模型的第一输出，基于所述第一训练数据中样本的标签和所述第一输出，利用交叉熵损失函数计算交叉熵损失值，基于所述交叉熵损失值更新所述学生模型的模型参数，以完成对所述学生模型的第一阶段训练，其中，所述目标损失函数包括交叉熵损失函数；将所述第二训练数据中的样本分别输入所述学生模型和多个教师模型，得到所述学生模型和多个教师模型各自的第二输出，利用门控模型确定多个教师模型各自的第二输出对应的权重，基于多个教师模型各自的第二输出所对应的权重，计算多个教师模型各自的输出的加权和，基于所述学生模型的第二输出和所述加权和，利用所述目标损失函数计算所述损失值，基于所述损失值更新所述学生模型的模型参数，以完成对所述学生模型的第二阶段训练；其中，在对所述学生模型进行训练中，所述学生模型的超参温度被设置为动态超参温度。

全文数据：

权利要求：

百度查询：深圳须弥云图空间科技有限公司 CTR预测模型的知识蒸馏方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

下一篇：一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

相关技术

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种防卡管测斜仪探头_中国建筑西南勘察设计研究院有限公司_202420526288.5

方法相关技术

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

通信方法及装置_华为技术有限公司_202010617172.9

信息处理方法_丰田自动车株式会社_202311358127.6

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

冰箱及其控制方法_LG电子株式会社_202080061858.2

冰箱及其控制方法_重庆海尔制冷电器有限公司_202211295888.7

预测模型相关技术

一种日本鳀冬季渔场模型筛选预测方法_中国海洋大学_202010335702.0

一种供应链风险预测模型的训练和应用方法及装置_深圳前海微众银行股份有限公司_202011119200.0

一种基于模型预测控制的车辆横纵向集成控制方法_浙江零跑科技股份有限公司_202210186397.2

一种用于预测射血分数保留型心衰风险的模型_中国科学院北京基因组研究所(国家生物信息中心)_202110686960.8

一种基于概率神经网络模型的泥石流沟堵塞程度预测方法_辽宁工程技术大学_202110639590.2

一种船舶三自由度的混合神经网络模型预测方法及系统_武汉大学_202111053868.4

一种面向Spark的批处理应用执行时间预测模型构建方法_北京工业大学_202010102494.X

口腔种植导航演示模型_苏州迪凯尔医疗科技有限公司_202322297809.2

用于视频译码的双向预测_VID拓展公司_201980063042.0

电力负荷预测方法及装置_国网冀北电力有限公司计量中心_202011400686.5

蒸馏相关技术

用于模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473804.5

一种金属钙蒸馏罐_长治县金世恒合金科技有限公司_202410129661.8

一种列管式多效蒸馏机_湖北滨润环保科技有限公司_202321471661.3

一种用于甘油蒸馏物料输送管道的取液装置_青岛金牛油脂科技有限公司_202322504106.2

一种硫代二丙酸二烷基酯用电加热蒸馏釜_三门峡奥科化工有限公司_202322136457.2

图像蒸馏方法、装置、电子设备和计算机可读存储介质_第六镜科技(成都)有限公司_202410052250.3

浓缩蒸馏生产系统_广东智子智能技术有限公司_202311863082.8

果酒蒸馏设备_河南宝泉酒业有限公司_202410076205.1

一种蒸馏设备_江苏正济药业股份有限公司_202322484700.X

果酒蒸馏后冷却装置_河南宝泉酒业有限公司_202410151566.8

龙图腾网&IPTOP

【发明授权】CTR预测模型的知识蒸馏方法及装置_深圳须弥云图空间科技有限公司_202310820709.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务