申请/专利权人:淮阴工学院
申请日:2023-12-01
公开(公告)日:2024-03-22
公开(公告)号:CN117743914A
主分类号:G06F18/241
分类号:G06F18/241;G06F18/214
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.09#实质审查的生效;2024.03.22#公开
摘要:本发明公开了一种快速小样本多层次分类方法及器件。首先对文本小样本原始数据进行预处理得到预处理数据集;接着对预处理数据集中文本数据进行层级标签化处理得到一维标签矩阵,之后,再对预处理数据集中的文本数据使用独热编码进行编码初始化得到文本二维矩阵,将上述的一维标签矩阵和文本二维矩阵存入复合数组,得到复合数组集,并按8:2划分复合数组集得到训练集和验证集;构造MLF混合损失函数;将训练集输入损失函数为MLF的M2AM模块进行训练;之后将验证集作为训练后的M2AM模块输入,使用快停法控制训练效率,最终生成一种快速小样本多层次分类器。本发明在实际文本分类任务中不仅比现有技术提升了2%的准确率,同时还使分类的效率提高了3倍。
主权项:1.一种快速小样本多层次分类方法,其特征在于,包括如下步骤:步骤1对文本小样本原始数据进行预处理得到预处理数据集OriData;步骤2对预处理数据集OriData中文本数据进行层级标签化处理得到一维标签矩阵,然后再对预处理数据集OriData中的文本数据使用独热编码进行编码初始化得到文本二维矩阵,将一维标签矩阵和文本二维矩阵存入复合数组,由此得到复合数组集DataAll,按8:2划分DataAll得到训练集TrainData和验证集ValData;步骤3构造MLF混合损失函数;步骤4将训练集TrainData输入损失函数为MLF的M2AM模块进行训练;步骤5将验证集ValData作为训练后的M2AM模块输入,使用快停法控制训练效率,若不满足快停法终止条件则继续执行步骤4训练步骤,若满足,则停止训练,得到一种快速小样本多层次分类器。
全文数据:
权利要求:
百度查询: 淮阴工学院 一种快速小样本多层次分类方法及器件
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。