【发明公布】基于主题增强词表示的短文本分类方法和系统_合肥工业大学_202311818547.8

导航：龙图腾网> 最新专利技术> 基于主题增强词表示的短文本分类方法和系统_合肥工业大学_202311818547.8

申请/专利权人：合肥工业大学

申请日：2023-12-27

公开（公告）日：2024-01-30

公开（公告）号：CN117473095A

主分类号：G06F16/35

分类号：G06F16/35;G06F40/166;G06F40/216;G06F40/284;G06N3/0464;G06N3/08;G06F16/36

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.02.20#实质审查的生效;2024.01.30#公开

摘要：本发明提供一种基于主题增强词表示的短文本分类方法和系统，涉及文本分类技术领域。本发明基于预先训练的词向量增强模型对所述待分类文本的初始词向量进行主题增强，得到待分类文本的主题增强的词向量；基于预先构建的TextCNN网络对所述主题增强的词向量进行处理，得到文本分类结果；其中，所述预先构建词向量增强模型通过目标领域的训练文本训练改进的Skip‑gram模型得到，所述改进的Skip‑gram模型是在Skip‑gram模型上增加预测中心词主题得分的任务。本发明通过待分类文本所属领域的训练文本对改进的Skip‑gram模型进行训练，得到的词向量增强模型可以获得词语的丰富语义信息，减少短文本信息量少、特征稀疏对分类任务的影响，有效提升短文本分类的分类精度。

主权项：1.一种基于主题增强词表示的短文本分类方法，其特征在于，包括：S1、获取目标领域的待分类文本并进行预处理，对预处理后的待分类文本中的词进行初始向量化，得到待分类文本的初始词向量；S2、基于预先训练的词向量增强模型对所述待分类文本的初始词向量进行主题增强，得到待分类文本的主题增强的词向量；S3、基于预先构建的TextCNN网络对所述主题增强的词向量进行处理，得到文本分类结果；其中，所述预先构建词向量增强模型通过目标领域的训练文本训练改进的Skip-gram模型得到，所述改进的Skip-gram模型是在Skip-gram模型上增加预测中心词主题得分的任务。

全文数据：

权利要求：

百度查询：合肥工业大学基于主题增强词表示的短文本分类方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：供电系统、功率变换器以及功率变换电路的控制方法_华为数字能源技术有限公司_202410139301.6

下一篇：一种燃气管道修复装置及方法_广州燃气集团有限公司_202410161508.3

相关技术

供电系统、功率变换器以及功率变换电路的控制方法_华为数字能源技术有限公司_202410139301.6

一种燃气管道修复装置及方法_广州燃气集团有限公司_202410161508.3

一种海底设施多关节柔性智能体的控制方法及系统_同济大学_202410164319.1

一种全自动铜铝焊接装置_怀化亚信科技股份有限公司_202410351666.5

一种转向管柱固定工装_芜湖普威技研有限公司_202311573386.0

一种基于氟硼荧的离子型多孔有机聚合物及其制备方法和光催化应用_常州大学_202311787384.1

热解油提质为BTEX的两级催化方法_沙特阿拉伯石油公司_202280065181.9

一种可移动车载伸缩无人机起降机场_齐鲁理工学院_202410345681.9

用药患者血浆中抗人胸腺/淋巴细胞兔免疫球蛋白总IgG抗体浓度检测试剂盒及应用_武汉中生毓晋生物医药有限责任公司_202410128193.2

一种热升华水性油墨及其制备方法_广东睿智环保科技股份有限公司_202410410854.0

锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

龙图腾网&IPTOP

【发明公布】基于主题增强词表示的短文本分类方法和系统_合肥工业大学_202311818547.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务