申请/专利权人:之江实验室
申请日:2024-03-20
公开(公告)日:2024-04-19
公开(公告)号:CN117909746A
主分类号:G06F18/214
分类号:G06F18/214;G06F18/20
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.07#实质审查的生效;2024.04.19#公开
摘要:本说明书公开了一种用于空间探索的代理模型的在线数据选择方法,可以获取训练样本集,首先确定出训练样本集中样本的实际排序结果,在每一轮迭代训练前,通过上一轮得到的代理模型对训练样本集中的各样本进行排序,得到一个排序结果,通过实际排序结果确定出子数据集A和子数据集C,以及通过另一种排序结果,确定出子数据集B。根据子数据集A、B、C,对代理模型进行每一轮训练,训练完成后的代理模型可以对给出的若干待排序数据进行排序,本方法重点考虑排序高的空间点的数据拟合能力,并提供了一种高排序点和全空间点之间权衡的可控调节机制,从而提高了空间探索准确性,且由于提高了对高排序点的预测准确性,提高了探索的空间采样效率。
主权项:1.一种用于空间探索的代理模型的在线数据选择方法,其特征在于,包括:服务器获取训练样本集,所述训练样本集中包含各样本以及每个样本对应的标注信息,其中,每个样本对应的标注信息用于表示该样本在训练样本集中的实际排序情况,根据每个样本对应的标注信息,对所述各样本进行排序,得到第一排序结果;在进行第i轮迭代训练之前,通过第i-1轮迭代训练后的代理模型对所述训练样本集中的各样本进行排序,得到第i-1轮迭代对应的第二排序结果;从所述训练样本集中确定出所述第一排序结果中排序高于第一预设排位的子数据集A,以及从所述训练样本集中确定出所述第i-1轮迭代对应的第二排序结果中排序高于第二预设排位的子数据集B,以及根据所述第一排序结果确定出子数据集S,从所述子数据集S中随机采样出第三预设数量的样本以确定出子数据集C;根据所述子数据集A、所述子数据集B和所述子数据集C,对代理模型进行第i轮迭代训练,直到完成对代理模型的最后一轮迭代训练,获取训练完成后的代理模型,所述训练完成后的代理模型用于对用户给出的若干待排序数据进行排序。
全文数据:
权利要求:
百度查询: 之江实验室 一种用于空间探索的代理模型的在线数据选择方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。