【发明公布】模型训练方法、装置、非易失性存储介质及电子设备_中电信人工智能科技(北京)有限公司_202410186185.3

申请/专利权人：中电信人工智能科技(北京)有限公司

申请日：2024-02-19

公开（公告）日：2024-05-17

公开（公告）号：CN118051775A

主分类号：G06F18/214

分类号：G06F18/214;G06F18/23;G06N20/00

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.04#实质审查的生效;2024.05.17#公开

摘要：本发明公开了一种模型训练方法、装置、非易失性存储介质及电子设备。其中，该方法包括：获取至少包括多个目标指令数据的目标指令数据集；使用多个预设答复模型分别对每个目标指令数据进行处理，得到每个目标指令数据对应的多个答复结果，其中，多个预设答复模型至少包括：待训练答复模型；根据每个目标指令数据对应的多个答复结果，生成多个样本对，其中，每个样本对包括：顺序排列的第一样本和第二样本，同一样本对中的第一样本和第二样本分别包括：相同的目标指令数据，和不同的答复结果，第一样本中答复结果的偏好顺序大于第二样本中答复结果的偏好顺序；使用多个样本对训练待训练答复模型。本发明解决了模型训练效率低的技术问题。

主权项：1.一种模型训练方法，其特征在于，包括：获取目标指令数据集，其中，所述目标指令数据集至少包括：多个目标指令数据；使用多个预设答复模型分别对每个所述目标指令数据进行处理，得到每个所述目标指令数据对应的多个答复结果，其中，多个所述预设答复模型至少包括：待训练答复模型；根据每个所述目标指令数据对应的多个所述答复结果，生成多个样本对，其中，每个所述样本对包括：顺序排列的第一样本和第二样本，同一所述样本对中的所述第一样本和所述第二样本分别包括：相同的所述目标指令数据，和不同的所述答复结果，所述第一样本中答复结果的偏好顺序大于所述第二样本中答复结果的偏好顺序；使用多个所述样本对训练所述待训练答复模型，其中，每个所述样本对作为所述待训练答复模型的一组训练数据，所述待训练答复模型使用多组所述训练数据通过机器学习方式进行训练。

全文数据：

权利要求：

百度查询：中电信人工智能科技(北京)有限公司模型训练方法、装置、非易失性存储介质及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种高精密零件加工中的多工位夹具及一次成型方法_深圳市正泰隆科技有限公司_202410243263.9

下一篇：内存访问方法、装置、电子设备及计算机程序产品_龙芯中科技术股份有限公司_202410226942.5

相关技术

一种高精密零件加工中的多工位夹具及一次成型方法_深圳市正泰隆科技有限公司_202410243263.9

内存访问方法、装置、电子设备及计算机程序产品_龙芯中科技术股份有限公司_202410226942.5

GRP75抑制剂作为用于制备减缓或治疗肿瘤恶病质的药物的用途_北京肿瘤医院(北京大学肿瘤医院)_202211547930.X

5G小区业务信道干扰分析方法、装置及可读存储介质_中国联合网络通信集团有限公司_202410263226.4

脉冲注水压力波形精准调控鱼鳔稳压器、装置及方法_中国石油化工股份有限公司_202211549180.X

训练数据的生成方法、装置、电子设备和存储介质_OPPO广东移动通信有限公司_202211499299.0

高固含量氧化铝陶瓷造粒粉及其制备方法_重庆臻宝科技股份有限公司_202410217766.9

一种可持续心电血氧血压监测的便携设备_河北汇丰医药有限公司_202410133584.3

路面排水结构及其施工方法_义乌市宏太市政工程有限公司_202410206310.2

一种玉米种植用施肥装置及施肥方法_安庆师范大学_202410337560.X

一种二维材料的介孔包覆壳层构筑方法_同济大学_202410220352.1

公仔及其制造方法_高亨俊_202410159742.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】模型训练方法、装置、非易失性存储介质及电子设备_中电信人工智能科技(北京)有限公司_202410186185.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务