申请/专利权人:维沃移动通信有限公司
申请日:2022-09-26
公开(公告)日:2022-11-29
公开(公告)号:CN115409172A
主分类号:G06N3/08
分类号:G06N3/08;G06N3/04;G06F40/30
优先权:
专利状态码:在审-实质审查的生效
法律状态:2022.12.16#实质审查的生效;2022.11.29#公开
摘要:本申请公开了一种模型训练方法及装置,属于人工智能技术领域。该方法包括:获取多组训练样本,所述训练样本包含N个训练子样本;将所述训练样本中的所述训练子样本输入预设生成对抗网络模型中的对抗生成器,输出摘要语义向量和扰动摘要语义向量;将所述摘要语义向量和扰动摘要语义向量输入所述预设生成对抗网络模型中的判别器,输出正样本数据和负样本数据;基于所述正样本数据中的扰动摘要语义向量,输出摘要信息样本;根据生成器损失、判别器损失和交叉熵损失调整所述预设生成对抗网络模型,直至所述预设生成对抗网络模型满足预设训练条件,得到摘要生成模型。
主权项:1.一种模型训练方法,其特征在于,包括:获取多组训练样本,所述训练样本包含N个训练子样本,每个所述训练子样本包括:正文数据样本,所述正文数据样本对应的正文评论数据样本和摘要标签,所述N个训练子样本中的正文数据样本相同;将所述训练样本中的所述训练子样本输入预设生成对抗网络模型中的对抗生成器,输出摘要语义向量和扰动摘要语义向量;将所述摘要语义向量和扰动摘要语义向量输入所述预设生成对抗网络模型中的判别器,输出正样本数据和负样本数据,其中,所述正样本数据包括一个所述训练子样本生成的摘要语义向量和扰动摘要语义向量,所述负样本数据包括M个所述训练子样本生成的摘要语义向量和扰动摘要语义向量,N为正整数,M为大于2的正整数;基于所述正样本数据中的扰动摘要语义向量,输出摘要信息样本;根据生成器损失、判别器损失和交叉熵损失调整所述预设生成对抗网络模型,直至所述预设生成对抗网络模型满足预设训练条件,得到摘要生成模型;其中,所述生成器损失是基于所述对抗生成器的生成器损失函数与所述摘要语义向量和扰动摘要语义向量确定的,所述判别器损失是基于所述判别器的判别器损失函数与所述正样本数据和负样本数据确定的,所述交叉熵损失是基于交叉熵损失函数与所述摘要信息样本和所述训练子样本的所述摘要标签确定的,所述摘要生成模型用于基于正文数据和所述正文数据对应的一个评论数据,输出摘要信息。
全文数据:
权利要求:
百度查询: 维沃移动通信有限公司 模型训练方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。