买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于问答方法的不限长小样本文本分类训练方法及系统_中科曙光南京研究院有限公司_202211566022.5 

申请/专利权人:中科曙光南京研究院有限公司

申请日:2022-12-07

公开(公告)日:2023-06-23

公开(公告)号:CN116303921A

主分类号:G06F16/332

分类号:G06F16/332;G06F16/35;G06F40/126;G06F40/30;G06F18/214

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.07.11#实质审查的生效;2023.06.23#公开

摘要:本发明提出一种基于问答方法的不限长小样本文本分类训练方法及系统,属于样本分析的数据处理技术领域。其中方法包括:构建用于文本分类的文本分类模型;文本分类模型读取用于性能优化的训练数据集;对训练数据集进行预处理,转换成文本分类模型可使用的数据格式;文本分类模型利用训练数据集执行性能训练;训练过程中,当预设训练周期内的损失不再下降,结束分类训练。通过分阶段的文本分类训练过程,加强了对文本语义的理解,随后,通过将文本与候选标签、问题一同列出的方式,利用模型训练所得的理解能力,迁移到对特性问题的分类上,以问答的方式挖掘文本分类模型的潜力,达到文本分类模型可以轻易迁移到不同领域的文本分类任务中。

主权项:1.一种基于问答方法的不限长小样本文本分类训练方法,其特征在于,具体包括以下步骤:步骤1、构建用于文本分类的文本分类模型;步骤2、所述文本分类模型读取用于性能优化的训练数据集;步骤3、对所述训练数据集进行预处理,转换成所述文本分类模型可使用的数据格式;步骤4、所述文本分类模型利用所述训练数据集执行性能训练;步骤5、训练过程中,当预设训练周期内的损失不再下降,结束分类训练。

全文数据:

权利要求:

百度查询: 中科曙光南京研究院有限公司 一种基于问答方法的不限长小样本文本分类训练方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。