买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】CTR预测模型的知识蒸馏方法及装置_深圳须弥云图空间科技有限公司_202310820709.5 

申请/专利权人:深圳须弥云图空间科技有限公司

申请日:2023-07-06

公开(公告)日:2023-11-10

公开(公告)号:CN116542328B

主分类号:G06Q30/0202

分类号:G06Q30/0202;G06N5/02

优先权:

专利状态码:有效-授权

法律状态:2023.11.10#授权;2023.08.22#实质审查的生效;2023.08.04#公开

摘要:本申请涉及机器学习技术领域,提供了一种CTR预测模型的知识蒸馏方法及装置。该方法包括:获取多个已训练好的重量级的教师模型和一个未被训练的轻量级的学生模型;将训练数据分别输入学生模型和多个教师模型,得到学生模型和多个教师模型各自的输出;利用门控模型确定多个教师模型各自的输出对应的权重,并基于多个教师模型各自的输出所对应的权重,计算多个教师模型各自的输出的加权和;基于学生模型的输出和加权和,利用目标损失函数计算损失值,并基于损失值更新学生模型的模型参数,以完成从多个教师模型到学生模型的知识蒸馏。采用上述技术手段,解决现有技术中,通过知识蒸馏得到的小规模的CTR预测模型往往使用效果不尽人意的问题。

主权项:1.一种CTR预测模型的知识蒸馏方法,其特征在于,包括:获取多个已训练好的重量级的教师模型和一个未被训练的轻量级的学生模型,其中,所述学生模型和多个教师模型均为CTR预测模型;获取训练数据,将所述训练数据分别输入所述学生模型和多个教师模型,得到所述学生模型和多个教师模型各自的输出;利用门控模型确定多个教师模型各自的输出对应的权重,并基于多个教师模型各自的输出所对应的权重,计算多个教师模型各自的输出的加权和;基于所述学生模型的输出和所述加权和,利用目标损失函数计算损失值,并基于所述损失值更新所述学生模型的模型参数,以完成从多个教师模型到所述学生模型的知识蒸馏;其中,更新模型参数后的所述学生模型应用于网络购物场景,用于预测推荐给用户的目标,所述训练数据是大量用户点击购买商品的数据;其中,基于所述学生模型的输出和所述加权和,利用目标损失函数计算损失值: ;其中,为所述学生模型的输出,为所述加权和,x为所述训练数据,y为所述训练数据的标签,下标s用于标记为所述学生模型的输出,下标t用于标记是所述加权和,与多个教师模型各自的输出相关,τ为所述学生模型和多个教师模型的温度超参,和均与τ相关,为交叉熵损失函数,为计算推土机距离的函数,β为预设权重;其中,将所述训练数据按照预设比例划分为第一训练数据和第二训练数据;将所述第一训练数据中的样本输入所述学生模型,得到所述学生模型的第一输出,基于所述第一训练数据中样本的标签和所述第一输出,利用交叉熵损失函数计算交叉熵损失值,基于所述交叉熵损失值更新所述学生模型的模型参数,以完成对所述学生模型的第一阶段训练,其中,所述目标损失函数包括交叉熵损失函数;将所述第二训练数据中的样本分别输入所述学生模型和多个教师模型,得到所述学生模型和多个教师模型各自的第二输出,利用门控模型确定多个教师模型各自的第二输出对应的权重,基于多个教师模型各自的第二输出所对应的权重,计算多个教师模型各自的输出的加权和,基于所述学生模型的第二输出和所述加权和,利用所述目标损失函数计算所述损失值,基于所述损失值更新所述学生模型的模型参数,以完成对所述学生模型的第二阶段训练;其中,在对所述学生模型进行训练中,所述学生模型的超参温度被设置为动态超参温度。

全文数据:

权利要求:

百度查询: 深圳须弥云图空间科技有限公司 CTR预测模型的知识蒸馏方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。