【发明公布】基于金字塔池化与LDA主题模型的短文本分类方法_中国电子科技集团公司第七研究所_201911276404.2

申请/专利权人：中国电子科技集团公司第七研究所

申请日：2019-12-12

公开（公告）日：2020-05-15

公开（公告）号：CN111159335A

主分类号：G06F16/33(20190101)

分类号：G06F16/33(20190101);G06F16/35(20190101);G06F40/30(20200101)

优先权：

专利状态码：有效-授权

法律状态：2023.06.23#授权;2020.06.09#实质审查的生效;2020.05.15#公开

摘要：本发明公开了一种基于金字塔池化与LDA主题模型的短文本分类方法，包括以下步骤：构建文本向量矩阵；通过金字塔池化模型将不同文本的向量固定为统一的向量表示；采用LDA主题模型对上述的文本向量进行文本主题概率向量提取，得出文本的主题概率向量；将通过金字塔池化模型后的向量与得到的文本的主题概率向量进行拼接，采用余弦相似性的公式进行文本之间相似度计算，结合相似度阈值进行文本分类计算；完成短文本的分类。本发明不仅考虑了词语的空间分布，还能考虑词语的频次关系，避免特征丢失的问题，有效的提高了短文本分类的准确度。

主权项：1.一种基于金字塔池化与LDA主题模型的短文本分类方法，其特征在于：所述的短文本分类方法包括以下步骤：S1：构建文本向量矩阵；S2：通过金字塔池化模型将不同文本的向量固定为统一的向量表示；S3：采用LDA主题模型对步骤S1的文本向量进行文本主题概率向量提取，得出文本的主题概率向量；S4：将步骤S2通过金字塔池化模型后的向量与步骤S3得到的文本的主题概率向量进行拼接，采用余弦相似性的公式进行文本之间相似度计算，结合相似度阈值进行文本分类计算；S5：完成短文本的分类。

全文数据：

权利要求：

百度查询：中国电子科技集团公司第七研究所基于金字塔池化与LDA主题模型的短文本分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于预制箱梁底板钢保间距检测的辅助装置_上海公路桥梁(集团)有限公司_202322267362.4

下一篇：一种防堵塞感应冲水台式蹲便器_长葛市东宏陶瓷制品有限公司_202322350659.7

相关技术

一种用于预制箱梁底板钢保间距检测的辅助装置_上海公路桥梁(集团)有限公司_202322267362.4

一种防堵塞感应冲水台式蹲便器_长葛市东宏陶瓷制品有限公司_202322350659.7

一种打捆机用强制喂入转子用喂入叶片_潍坊泰铭机械有限公司_202322345005.5

一种低吸膨胀防水强化地板_江苏欧圣新材料有限公司_202321962220.3

一种可防静电的LED显示屏_深圳市天合光电有限公司_202322362940.2

连续纸滚筒负压吸附折叠机构_青岛高乐数字技术有限公司_202322311791.7

一种塑料色母粒加料机_台山市世隆塑料有限公司_202322076929.X

一种用于多孔粒状铵油炸药安全生产的上料装置_察右中旗柯达化工有限责任公司_202322339243.5

一种电极片组件、收纳结构及除颤仪_苏州维伟思医疗科技有限公司_202322021310.9

变形缝防水装置_广东天元建筑设计有限公司_202322244995.3

一种服装生产加工用布料裁切机构_苏州鸿鑫纺织股份有限公司_202322142376.3

一种高精度皮带秤_安徽元拓智能包装科技有限公司_202321918515.0

龙图腾网&IPTOP

【发明公布】基于金字塔池化与LDA主题模型的短文本分类方法_中国电子科技集团公司第七研究所_201911276404.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务