买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于图的特征排序和降维方法_电子科技大学长三角研究院(衢州)_202111063272.2 

申请/专利权人:电子科技大学长三角研究院(衢州)

申请日:2021-09-10

公开(公告)日:2024-04-02

公开(公告)号:CN113780416B

主分类号:G06V10/77

分类号:G06V10/77;G06V10/771

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.12.28#实质审查的生效;2021.12.10#公开

摘要:基于图的特征排序和降维方法,它属于计算机和生物学交叉领域。本发明解决了现有降维方法的通用性差,降维过程费时的问题。本发明集成了多种特征排序方法,利用这些方法之间存在的互补性,这样更有利于挖掘出数据的潜在信息,有利于去除数据的冗余特征,有利于筛选出更有利于建模的特征。将这些算法的结果以图的形式表示,相对于其他算法而言,本发明方法更具有普适性、通用性。使用户不需要去尝试测试不同的降维方法,大大节省了降维所需要的时间。本发明可以应用于计算机和生物学交叉领域。

主权项:1.基于图的特征排序和降维方法,其特征在于,所述方法具体包括以下步骤:步骤一、读取待处理的数据文件;步骤二、选择多种特征排序算法,再分别采用每一种特征排序算法对待处理数据文件进行处理,得到每一种特征排序算法对应的处理结果;所述步骤二的具体过程为:对于选择的某种特征排序算法,采用该特征排序算法计算待处理数据文件中每个特征的分数后,再根据分数由大到小对各特征进行排序,得到一个有序的列表,即得到了该特征排序算法对应的处理结果;同理,分别得到每种特征排序算法对应的处理结果;步骤三、采用随机删除机制对步骤二获得的各列表中的特征进行删减,获得经过删减的各列表;步骤四、利用经过删减后的全部列表构成一张有向图,对于有向图中的任意两个特征对应的结点,若这两个特征在任意一个经过删减后的列表中存在相邻关系,则在有向图中,这两个特征对应的结点之间存在边,且边的方向是:由两个特征中分数低的特征对应的结点指向分数高的特征对应的结点;步骤五、分别计算步骤四构成的有向图中每个特征的重要性分数,并根据重要性分数大小对特征进行重新排序;步骤六、采用手肘法,基于特征重新排序结果确定聚类的簇数;再对待处理数据文件中各特征的初始特征向量进行更新,得到各特征的最终特征向量;基于确定的聚类簇数,对各特征的最终特征向量进行聚类,保留每类中的首位特征作为降维后的特征;所述对待处理数据文件中各特征的初始特征向量进行更新,得到各特征的最终特征向量;其具体过程为:步骤S1、统计有向图中保留下来的特征的列表save以及在步骤三中被删除过的特征的列表delete;步骤S2、构建列表save的状态转移矩阵M以及列表delete的状态转移矩阵N;状态转移矩阵M的对角线上元素全为0,若在有向图中,特征i对应的结点直接到达特征j对应的结点,则状态转移矩阵M的第i行第j列的元素mij为: 其中,i≠j,若特征i对应的结点无法到达特征j对应的结点,则mij为0;状态转移矩阵N的第i'行第j'列的元素ni’j’为:若在有向图中,特征i'对应的结点直接到达特征j'对应的结点,则 其中,i'≠j',否则,特征i'对应的结点无法直接到达特征j'对应的结点,则ni’j’=0,且状态转移矩阵N的对角线上元素全为0;步骤S3、计算保留的特征对应的向量Rs:RS=aMR0其中,a为超参数,R0是待处理的数据文件中各特征的初始特征向量组成的矩阵;步骤S4、计算被删除的特征对应的向量Rd:Rd=bNR0其中,b为超参数;步骤S5、构建随机向量Random_r: 其中,代表向量1;Numtotal为列表中总特征的个数;步骤S6、计算新的R0:R0=Rs+Rd+Random_r步骤S7、利用新的R0,重复步骤S3至步骤S6的过程,直至R0的值收敛,将最后一次迭代获得的R0作为待处理的数据文件中各特征的最终特征向量组成的矩阵,即分别获得每个特征最终的特征向量。

全文数据:

权利要求:

百度查询: 电子科技大学长三角研究院(衢州) 基于图的特征排序和降维方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。