【发明授权】一种文本分类方法_大连交通大学_202311004850.4

导航：龙图腾网> 最新专利技术> 一种文本分类方法_大连交通大学_202311004850.4

申请/专利权人：大连交通大学

申请日：2023-08-10

公开（公告）日：2024-03-19

公开（公告）号：CN117171343B

主分类号：G06F16/35

分类号：G06F16/35;G06N5/02;G06F40/289;G06F40/30

优先权：

专利状态码：有效-授权

法律状态：2024.03.19#授权;2023.12.22#实质审查的生效;2023.12.05#公开

摘要：本发明提供了一种文本分类方法，属于文本分类技术领域，包括：将文本中的词转化为词向量；将文本的词向量转化为文本图后，将文本图输入到图神经网络层中，利用图神经网络输出标签向量；将文本的词向量输入到多头自注意力神经网络中进行特征提取，输出自注意力特征向量；将自注意力特征向量和标签向量点乘后的结果，输入预测层中进行分类得到分类后的预测标签，实现文本分类。该方法能够使得预测过程既考虑了词与词之间的交互关系，又考虑了文本标签之间的相关性，使得预测结果更加准确。

主权项：1.一种文本分类方法，其特征在于，包括：获取待分类的文本信息；将文本中的词转化为词向量，并将文本的词向量转化为文本图；将文本图输入到图神经网络中，利用图神经网络输出文本图所对应的标签向量；将文本的词向量输入到多头自注意力神经网络中进行特征提取，输出自注意力特征向量；将自注意力特征向量和标签向量点乘后的结果，输入神经网络的预测层中进行分类得到分类后的预测标签，实现文本分类；所述利用图神经网络输出文本图所对应的标签向量；包括：对节点进行随机池化和平均池化；根据随机池化和平均池化的结果得到节点最终的特征信息；对迭代T次提取出的节点的特征信息进行求和，得到标签向量Mgnn；所述标签向量Mgnn为：Mgnn＝{Mt+Mt+1+……+MT}其中，M＝ηMsto+1-ηMmean 其中，Msto表示每个节点通过随机池化学习到的特征信息；Mmean表示每个节点通过平均池化机制学习到的特征信息；Rand函数为规约函数，表示按概率取各个维度上的元素值，元素值越大被取到的概率越大；Mean函数表示各个维度上的元素值的平均值；表示文本中距离n节点距离为p的节点的集合；ean表示节点a与节点n之间的边特征；ta表示节点a的特征；M表示每个词最终获得的特征信息；η控制池化操作的比重；T表示图神经网络的迭代次数；所述将文本的词向量输入到多头自注意力神经网络中进行特征提取，输出自注意力特征向量；包括：词向量V＝{v1,v2……vn}经过多头自注意力神经网络的嵌入层后被转化为第一词向量a1,a2,a3……an；使用三个权值矩阵WQ，WK，WV与第一词向量a1,a2,a3……an相乘，分别得到qi，ki，vi，i∈[1,n]；利用q1分别与k1,k2,k3……kn进行点乘计算向量点积，得到q1对应的自注意力分数α11，α12……α1n；分别计算q2,q3……qn的自注意力分数；将q1,q2,q3……qn的自注意力分数拼接得到自注意力分数矩阵α：将自注意力分数矩阵α归一化得到系数矩阵式中，d表示键的维度，表示把注意力矩阵转化为标准正态分布；将系数矩阵分别与对应的vii∈[1,n]相乘并求和，得到对应的输出其中，为每个子空间中的自注意力特征向量，表示系数矩阵中第n行i列对应的值，head为头数；将所有的拼接后，将拼接后的结果通过线性转换和softmax激活得到最终的自注意力特征向量bT；

全文数据：

权利要求：

百度查询：大连交通大学一种文本分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种园林绿化便携铲_马丽丽_202322375183.2

下一篇：一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

相关技术

一种园林绿化便携铲_马丽丽_202322375183.2

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

一种实验室地层品质因子估算方法_中国石油化工股份有限公司_202211297976.0

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

文本相关技术

基于深度学习的评论文本方面级情感分类方法及系统_上海哈蜂信息科技有限公司_202010776165.3

一种基于深度学习的文本生成图像学习方法_大连理工大学_202111183091.3

文本检测方法、装置、计算机设备和存储介质_腾讯科技(深圳)有限公司_202011020108.9

一种文本行图片的解码方法、装置和设备_北京有竹居网络技术有限公司_202110558943.6

基于宏微观特征的中文文本笔迹鉴别方法、装置及存储介质_大连海事大学_202011643169.0

文本意图识别方法、装置、设备和存储介质_平安科技(深圳)有限公司_202010033742.X

文本细粒度情感分类方法、系统、装置及存储介质_华南理工大学_202010560649.4

一种基于文本的实体识别方法及相关装置_广东工业大学_202010844442.X

一种相似文本内容的识别方法、装置及存储介质_广州腾讯科技有限公司_201810595368.5

基于注意力机制的幽默文本分类方法、装置、设备、介质_中国平安人寿保险股份有限公司_202111433978.3

分类相关技术

图像分类方法、图像分类模型的训练方法及装置_腾讯科技(深圳)有限公司_202210102561.7

账户分类模型训练方法及装置和账户分类方法及装置_百度在线网络技术(北京)有限公司_201910324589.3

一种分类筛沙机_孙锋_202322157347.4

一种基于细胞骨架图像定量分析的细胞图像分类方法及其分类器_上海大学_202111001522.X

一种能够快速分类的码垛装置_济南昊中智能科技有限公司_202322772854.9

广告分类评估方法、装置及存储介质_蓝色火焰科技成都有限公司_202410161898.4

文档分类方法、装置及电子设备_北京百度网讯科技有限公司_202110737169.5

包括自动特征检测和分类的检查工具_米沃奇电动工具公司_202280047516.4

一种便于使用的分类档案管理柜_山西水利职业技术学院_202321858991.8

一种石灰岩矿物质加工用矿石分类装置_淳安县元洋实业有限公司_202322168294.6

方法相关技术

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202010617172.9

通信方法及装置_华为技术有限公司_202211296381.3

信息处理方法_丰田自动车株式会社_202311358127.6

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

冰箱及其控制方法_LG电子株式会社_202080061858.2

冰箱及其控制方法_重庆海尔制冷电器有限公司_202211295888.7

龙图腾网&IPTOP

【发明授权】一种文本分类方法_大连交通大学_202311004850.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务