申请/专利权人:马上消费金融股份有限公司
申请日:2022-08-16
公开(公告)日:2023-05-23
公开(公告)号:CN116152588A
主分类号:G06V10/774
分类号:G06V10/774;G06V10/762
优先权:
专利状态码:在审-实质审查的生效
法律状态:2023.06.09#实质审查的生效;2023.05.23#公开
摘要:本申请提供一种模型训练方法、数据处理方法、装置、设备及存储介质,该模型训练方法包括:获取第一训练数据;对第一训练数据进行数据增强,得到多个增强数据;根据第一训练数据对多个增强数据进行聚类处理,得到第一数据集,第一数据集包括的第一数据与第一训练数据聚类为表示相同的含义;利用第一正例样本对和第一负例样本对,对识别模型进行模型训练,得到训练后的识别模型;第一正例样本对包括第一数据集中的两个数据;第一负例样本对包括第一训练数据和第二训练数据,其中,识别模型用于识别两个样本的含义是否相同。本申请能够提高识别模型的鲁棒性。
主权项:1.一种模型训练方法,其特征在于,所述方法包括:获取第一训练数据,所述第一训练数据包括图像样本或文本样本;对所述第一训练数据进行数据增强,得到多个增强数据;根据所述第一训练数据对所述多个增强数据进行聚类处理,得到第一数据集;所述第一数据集包括的第一数据与所述第一训练数据聚类为表示相同的含义;利用第一正例样本对和第一负例样本对,对识别模型进行模型训练,得到训练后的识别模型;所述第一正例样本对包括所述第一数据集中的两个数据;所述第一负例样本对包括所述第一训练数据和第二训练数据,若所述第一训练数据为图像样本,则所述第一训练数据和所述第二训练数据包含的对象不同,若所述第一训练数据为文本样本,则所述第一训练数据和所述第二训练数据的语义不同。
全文数据:
权利要求:
百度查询: 马上消费金融股份有限公司 模型训练方法、数据处理方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。