买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于2D-Kernels特征聚类的深度学习变异体集约简方法_南京工业大学_202310840844.6 

申请/专利权人:南京工业大学

申请日:2023-07-10

公开(公告)日:2024-04-02

公开(公告)号:CN117807419A

主分类号:G06F18/213

分类号:G06F18/213;G06F18/23213;G06N3/0464;G06N3/08;G06F18/214;G06F11/36

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.19#实质审查的生效;2024.04.02#公开

摘要:本发明提出一种基于2D‑Kernels特征聚类的深度学习变异体集约简方法。首先基于模型卷积核可解释性分析卷积核2D‑Kernels特征,并利用该特征表示深度学习变异体,得到一个由特征向量表示的变异体集。然后,结合聚类方法,将具有不同特征的变异体归入不同的簇中,从而将变异体集划分为多个簇和一个少数空间聚类过程中的离群数据。最后,通过选择算法在各簇中选择具有代表性的变异体;同时,通过随机选择的方法选择少数空间中的变异体;两次选择组成的变异体集即为约简后的变异体集。本发明目的在于有效地在保持变异得分准确性的同时,减少变异体数量与测试执行开销。此外,约简后的变异体子集具有和全集近似相同的测试数据集质量评估能力。

主权项:1.一种基于2D-Kernels特征聚类的深度学习变异体集约简方法;其特征在于,首先基于模型卷积核可解释性分析卷积核2D-Kernels特征如,核稀疏、核熵,并利用该特征表示深度学习变异体,得到一个由特征向量表示的变异体集;然后,结合聚类方法,将具有不同特征的变异体归入不同的簇中,从而将变异体集划分为多个簇和一个少数空间聚类过程中的离群数据;最后,通过选择算法在各簇中选择具有代表性的变异体;同时,通过随机选择的方法选择少数空间中的变异体;两次选择组成的变异体集即为约简后的变异体集;该方法包括下列步骤:1特征提取;深度学习软件通过自身卷积核从训练数据中学习特征,以调整其参数并构建软件逻辑;训练完备的卷积层可以从测试数据中提取特征;以图像分类模型为例,靠近输入层的卷积层提取颜色、纹理等较低层的特征,而靠近输出层的卷积层提取局部特征、类别等更抽象的特征;不同的变异体具有不同的卷积核;变异体参数不同,特征提取能力有所差别;卷积核的特征主要包括两个方面,卷积核稀疏和核熵;在模型特征提取过程中,各层提取的数据特征都会正向传播到最后一个卷积层;本发明使用变异体最后一个卷积层的核稀疏、核熵特征表示变异体;本发明使用表示第c维的输入特征数据Xc对应的2D-Kernels;核稀疏KSc、核熵KEc的计算公式如下: 其中,Mc表示第c维输入特征数据对应的2D-Kernels最邻近矩阵,i和j分别表示矩阵中的行列;核稀疏和核熵都是多维向量,cin表示输入数据;由此,对于深度学习变异体集MS={Mi|1≤i≤m},可以利用上述两项特征将变异体表示为特征向量对于深度学习变异体集MS,相应的深度学习变异体特征向量集MSvector可表示如下: 2特征聚类;对于MSvector,在利用相似性度量方法进行聚类之前,要进行归一化操作,让特征向量尺度在[0,1]之间;归一化算法计算公式如下: 其中,x表示待计算数据,xMin表示数据x所在列的最小值,xMax表示数据x所在列的最大值,x’表示标准化后的结果;归一化后的深度学习变异体特征向量集MSvector′可表示如下: 然后利用聚类算法,对特征向量集MSvector′进行聚类;聚类过程种,使用可达距离MRDiski,j表示变异体i和变异体j之间的距离,计算公式如下:MRDiski,j=max{Coreki,Corekj,EDisi,j}4其中Coreki,Corekj分别表示i、j与其第k个最邻近之间的距离;EDisi,j表示i和j之间的欧氏距离;经过聚类算法后,可以得到n个具有不同典型特征的簇Clusters和一个少数空间MSpace;具体的,可以表示为: 其中,1<a,b,c,d,e,f,g≤m;3质心选择;在得到Clusters和MSpace后,要从中选择具有代表性的变异体组成变异体子集,达到约简的目的;不同簇内的变异体具有不同的特征,同一个簇内的变异体具有相似的特征;本发明应用简单经典的K-means算法从各簇中选择最具代表性的变异体;具体的,首先遍历簇,在每一个簇中随机选择k个变异体作为质心,计算簇内每一个变异体与的距离,按就近归类的原则形成k个类;然后重新计算,更新每个组的质心,直到不发生变化,最终得到的就是最具代表性的变异体;遍历结束时可以得到k*n个变异体,加入约简后的变异体子集MSreduced;少数空间MSpace的变异体没有被归进簇种,表示该类变异体与簇中的变异体具有较大差异;也就是说,该变异体的缺陷出现较少;本发明为了保持变异体特征的分布多样性,采用随机选择的方法,选择l个变异体,加入约简后的变异体子集MSreduced;两次选择组成的变异体子集,数量为k*n+l,即为约简后的变异体子集MSreduced;理论上,变异体子集拥有和全集同等的数据集测试能力,并且满足k*n+l<m;具体的,可以表示为:

全文数据:

权利要求:

百度查询: 南京工业大学 一种基于2D-Kernels特征聚类的深度学习变异体集约简方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。