买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】样本增强方法、模型训练方法及系统_北京宜能高科科技有限公司_202110646519.7 

申请/专利权人:北京宜能高科科技有限公司

申请日:2021-06-10

公开(公告)日:2021-09-21

公开(公告)号:CN113420799A

主分类号:G06K9/62(20060101)

分类号:G06K9/62(20060101);G06F30/27(20200101)

优先权:

专利状态码:失效-发明专利申请公布后的驳回

法律状态:2023.10.27#发明专利申请公布后的驳回;2021.10.12#实质审查的生效;2021.09.21#公开

摘要:本发明公开一种样本增强方法、模型训练方法及系统,涉及数据处理技术领域,可提升样本数据的数量和质量,并减少样本生成时间。该样本增强方法包括:划分变量为独立变量、部分关联变量和剩余关联变量;独立变量数据随机生成,根据独立变量数据和指定公式计算部分关联变量数据,以上述两类数据作为输入,采用简化模型计算获取剩余关联变量数据;将上述三类数据合并作为严格机理模型模拟样本输入数据。根据欧式距离将所述样本输入数据分成多个子样本集,对各子样本集中的样本排序,按照样本顺序,利用严格机理模型依次进行分步模拟,获取样本输出数据,与相应的样本输入数据合并,获得完整样本数据。通过样本可视化样本分布,补充稀疏区域的样本。

主权项:1.一种样本增强方法,其特征在于,包括:将变量划分为独立变量、部分关联变量和剩余关联变量;根据历史生产数据中每种变量对应的历史数据,获取每种变量对应的历史数据分布范围;在每个独立变量对应的分布范围内随机生成多个随机数据,根据独立变量对应的随机数据计算出部分关联变量对应的中间数据,然后采用预先训练完成的简化模型以随机数据和中间数据作为输入计算并判断计算结果是否收敛,并在收敛时获取剩余关联变量对应的剩余数据;将随机数据、中间数据和剩余数据整理合并成作为后续模拟的输入数据;采用欧式距离对输入数据进行聚类得到多组子样本集,所述子样本集中包括多个样本,并对每组所述子样本集中的样本进行排序;通过预先训练完成的严格机理模型,对每个子样本集中样本按照顺序进行分步模拟计算,得到样本的输出数据;汇总并合并各样本的输入数据和对应的输出数据,得到通过样本增强获取的多个完整样本数据;对获取的多个样本数据的分布范围进行可视化分析,并对稀疏区域的样本进行补充。

全文数据:

权利要求:

百度查询: 北京宜能高科科技有限公司 样本增强方法、模型训练方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。