买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】有标签高维数据的最优投影集合方法及情感文本分类方法_中南大学_202010208815.4 

申请/专利权人:中南大学

申请日:2020-03-23

公开(公告)日:2022-06-10

公开(公告)号:CN111382274B

主分类号:G06F16/35

分类号:G06F16/35;G06F40/30

优先权:

专利状态码:有效-授权

法律状态:2022.06.10#授权;2020.07.31#实质审查的生效;2020.07.07#公开

摘要:本发明公开了一种有标签高维数据的最优投影集合方法,包括获取需要投影的有标签高维数据的所有类别对;计算类别对之间的类别对可分离向量空间;对可分离高维空间范围求交集得到可分离向量空间的交空间;选取可分离向量空间的交空间中的轴组成二维投影集合并得到最终的最优投影集合。本发明还公开了包括所述有标签高维数据的最优投影集合方法的情感文本分类方法。本发明通过类别对可分离向量空间的交集选取交空间中的轴组成二维投影集合,来组成最终的有标签高维数据的最优投影集合,因此本发明方法能够有效帮助呈现有标签高维数据中的类别信息,而且可靠性高,实用性好。

主权项:1.一种情感文本分类方法,其特征在于具体包括如下步骤:S1.获取需要投影的自然语言情感分类的高维数据的所有情感语义类别对;S2.针对步骤S1获取的所有情感语义类别对,计算类别对之间的类别对可分离向量空间;具体为采用如下步骤计算情感语义类别对可分离向量空间:A.根据需要投影的自然语言情感分类的高维数据的所有类别对,利用感知驱动的监督降维PDD方法,计算降维至一维的情感语义最优投影向量wi,从而得到所有类别对的情感语义最优投影向量集合W={w1,w2,...,wi,...,wm};B.采用基于超平面包围盒的类别对可分离向量空间的表达,对步骤A得到的情感语义最优投影向量集合进行表达,从而得到情感语义类别对可分离范围集合Bi={rij|j∈[1,n-1]};其中rij为第i个类别对元素的第j维的满足阈值条件的范围;所述情感语义类别对可分离范围集合构成情感语义类别对可分离向量空间;S3.根据步骤S2得到的情感语义类别对可分离向量空间,对情感语义可分离高维空间范围求交集,从而得到情感语义可分离向量空间的交空间;具体为采用如下步骤得到情感语义可分离向量空间的交空间:a.初始化邻接矩阵邻接矩阵G中,对角线元素为1,剩余元素均为0;b.遍历步骤S2获取的类别对可分离范围集合Bi={rij|j∈[1,n-1]}:若则步骤a中的邻接矩阵G中的元素G[i][j]=1;否则G[i][j]=0;c.以步骤b获取的上三角邻接矩阵G作为情感语义可分离向量空间的交空间:若G[i][j]=0,表示最优投影向量wi和wj所在的两个情感语义可分离空间有交空间;否则,表示最优投影向量wi和wj所在的两个情感语义可分离空间无交空间;S4.根据步骤S3得到的情感语义可分离向量空间的交空间,选取情感语义可分离向量空间的交空间中的轴组成二维投影集合,从而得到最终的情感语义最优投影集合;具体为采用如下步骤获取二维投影集合:1将步骤S3得到的邻接矩阵G中的每个类别对作为一个点,类别对中的相交关系作为点与点之间的连线,构建得到图G={V,E};其中V表示图中的点,E表示图中的边;2采用近似算法得到步骤1中的图的最大团集合,并根据顶点数目从多到少排序,得到完全图集合C={c1,c2,...,ci,...,ck},其中ci表示包含第i多个顶点数目的完全图;3初始化结果集合R={c1},并从c2开始依次遍历完全图集合C中每一个元素ci,依次获取最大且与集合R中不重复的元素,并将获取的元素加入集合R中,得到第一结果集合R;4若步骤3中得到的集合R的元素个数为奇数,则对集合R中顶点数最多的团进行顶点细分,从而使得集合R的元素个数为偶数;5步骤4中得到的集合R中,以集合R的奇数轴依次作为视图集合的x轴,偶数轴依次作为视图集合的y轴,构建情感语义最优投影集合。

全文数据:

权利要求:

百度查询: 中南大学 有标签高维数据的最优投影集合方法及情感文本分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。