【发明公布】基于统计学和预训练语言模型的多标签文本分类方法_电子科技大学_202011121726.2

导航：龙图腾网> 最新专利技术> 基于统计学和预训练语言模型的多标签文本分类方法_电子科技大学_202011121726.2

申请/专利权人：电子科技大学

申请日：2020-10-20

公开（公告）日：2021-01-12

公开（公告）号：CN112214599A

主分类号：G06F16/35(20190101)

分类号：G06F16/35(20190101);G06F40/216(20200101);G06F40/30(20200101);G06F40/126(20200101);G06K9/62(20060101);G06N3/04(20060101)

优先权：

专利状态码：有效-授权

法律状态：2022.06.24#授权;2021.01.29#实质审查的生效;2021.01.12#公开

摘要：本发明公开了一种基于统计学和预训练语言模型的多标签文本分类方法，包括以下步骤：S1、对需要分类的训练语料进行预处理；S2、建立基于统计学方法和语言模型的标签获取模型；S3、对获取的标签数据进行处理；S4、建立基于预训练语言模型的多标签分类模型，利用得到的标签数据进行模型训练；S5、使用训练好的多标签文本分类模型，对待分类的文本数据进行多标签分类。本发明提出一种结合了统计学方法与预训练语言模型标签获取方法，使用ALBERT语言模型来获取文本的语义编码信息，不需要人工标注数据集，能够提高获取标签的准确度。

主权项：1.基于统计学和预训练语言模型的多标签文本分类方法，其特征在于，包括以下步骤：S1、对需要分类的训练语料进行预处理；S2、建立基于统计学方法和语言模型的标签获取模型；S3、对获取的标签数据进行处理；S4、建立基于预训练语言模型的多标签分类模型，利用得到的标签数据进行模型训练；S5、使用训练好的多标签文本分类模型，对待分类的文本数据进行多标签分类。

全文数据：

权利要求：

百度查询：电子科技大学基于统计学和预训练语言模型的多标签文本分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

下一篇：一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

相关技术

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种高效型苗种植机_海南勤璞园农业科技有限公司_202322496666.8

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

摄像头安装组件和应用其的仪表屏_深圳市航盛电子股份有限公司_202322569773.9

一种钢带波纹螺旋管接头防护模具_吉林建工集团有限公司_202322063597.1

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

龙图腾网&IPTOP

【发明公布】基于统计学和预训练语言模型的多标签文本分类方法_电子科技大学_202011121726.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务