申请/专利权人:厦门大学
申请日:2024-01-15
公开(公告)日:2024-04-16
公开(公告)号:CN117892243A
主分类号:G06F18/2433
分类号:G06F18/2433;G06F18/25;G06F18/214;G06N20/20
优先权:
专利状态码:在审-公开
法律状态:2024.04.16#公开
摘要:本发明公开了一种概念漂移数据流集成分类方法,包括以下步骤:S1:获取训练数据和待分类数据,通过初始训练数据训练多个基分类器,构成集成模型M,并集成新颖类检测模块,S2:将不断到达的数据流通过多个基于聚类的基分类器构成的半监督集成模型M进行分类;S3:对数据流中的测试实例进行离群点判断;S4:对测试实例进行分类,并计算一个置信度分数估计分类的置信度,置信度数被存储在动态窗口W中。使用动态的分类器边界从而可以更好地将可能为新别的实例筛选出来,同时通过概念漂移检测,使得模型可以花费更小的时间代价的同时保持较好的分类性能;使得算法具有较高的准确率识别出新颖类实例,使得只有较少的现有类实例被误分为新颖类。
主权项:1.一种概念漂移数据流集成分类方法,其特征在于,包括以下步骤:S1:获取训练数据和待分类数据,通过初始训练数据训练多个基分类器,构成集成模型M,并集成新颖类检测模块;S2:将不断到达的数据流通过多个基分类器构成的集成模型M进行分类;S3:对数据流中的测试实例进行离群点判断;S4:对测试实例进行分类,并计算一个置信度分数估计分类的置信度,置信度数被存储在动态窗口W中;S5:使用动态窗口W进行概念漂移检测,如果检测到概念漂移的发生,就使用发生概念漂移的数据训练一个新的基分类器,随后更新集成模型M。
全文数据:
权利要求:
百度查询: 厦门大学 一种概念漂移数据流集成分类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。