买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】数据解析装置_株式会社岛津制作所_201880097252.7 

申请/专利权人:株式会社岛津制作所

申请日:2018-09-13

公开(公告)日:2021-04-13

公开(公告)号:CN112654864A

主分类号:G01N27/62(20210101)

分类号:G01N27/62(20210101)

优先权:

专利状态码:在审-实质审查的生效

法律状态:2021.04.30#实质审查的生效;2021.04.13#公开

摘要:多次重复进行以下一系列处理:将被提供的带标签教师数据分割为模型构建用数据和模型验证用数据,使用模型构建用数据来构建机器学习模型,并将该模型应用于模型验证用数据来识别样本赋予标签S2~S5。虽然当模型构建用数据改变时构建出的机器学习模型改变,但是应该能够以高概率准确地进行识别,因此在错误标签样本中,原本的标签与识别结果不一致从而成为错误识别的可能性高。当针对每个样本计算该错误识别次数来求出错误识别率时,在错误标签样本中错误识别率相对变高,因此基于错误识别率来确定错误标签样本S6~S7。像这样,通过以高精度检测教师数据所包含的、错误标签状态的可能性高的样本,能够提升机器学习模型的识别性能。

主权项:1.一种数据解析装置,基于关于多个样本的被赋予了标签的教师数据来构建机器学习模型,使用该机器学习模型来识别未知的样本并赋予标签,该数据解析装置的特征在于,具备错误标签检测部,该错误标签检测部在所述教师数据中检测错误标签状态的样本,该错误标签检测部具备:a重复识别执行部,其多次重复以下一系列处理:使用从所述教师数据中选择出的、或者与该教师数据不同的作为带标签的数据的模型构建用数据来构建机器学习模型,将构建出的该机器学习模型应用于从所述教师数据中选择出的模型验证用数据来识别样本并进行标签赋予;以及b错误标签判定部,在由所述重复识别执行部多次重复进行一系列处理时,该错误标签判定部针对每个样本求出作为所述一系列处理的识别结果的标签与原本赋予到数据中的标签不一致的错误识别的次数,基于该错误识别的次数或该错误识别的概率来判定样本是否为错误标签状态。

全文数据:

权利要求:

百度查询: 株式会社岛津制作所 数据解析装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。