买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种多模态数据聚类方法_北京科技大学_202310975304.9 

申请/专利权人:北京科技大学

申请日:2023-08-03

公开(公告)日:2024-03-22

公开(公告)号:CN117036762B

主分类号:G06V10/762

分类号:G06V10/762;G06V10/44;G06V10/74;G06V10/80

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2023.11.28#实质审查的生效;2023.11.10#公开

摘要:本发明公开了一种多模态数据聚类方法,属于数据处理技术领域,包括获取样本数据集;提取图像数据的边缘特征;提取转录组数据的差异性特征,差异性特征包括mRNA特征和miRNA特征;计算各个样本数据的相关系数矩阵;采用软阈值,对相关系数矩阵进行非线性映射;计算各个样本与其余样本的连通度;计算离散化的连通度以及相应的概率,得到样本间距离矩阵;通过K‑means++聚类算法对样本数据进行预聚类;将样本间距离矩阵转化为样本间相似度矩阵;根据预聚类信息,构建核矩阵;根据核矩阵,对样本间相似度矩阵进行迭代;综合在mRNA数据视图、microRNA数据视图以及Image数据视图下的样本间相似度矩阵,得到样本间相似度融合矩阵;通过谱聚类算法,对样本进行聚类。

主权项:1.一种多模态数据聚类方法,其特征在于,包括:S101:获取样本数据集,所述样本数据集包括多个样本数据,每个所述样本数据包括图像数据与转录组数据;S102:通过双边滤波器,对所述图像数据进行滤波处理;S103:引入Sobel算子,计算滤波处理后的图像数据中像素点的梯度信息,所述梯度信息包括梯度强度和梯度方向;S104:当滤波处理后的图像数据中存在多个梯度信息时,保留极大值像素点,抑制非极大值像素点;S105:对非极大值抑制后的样本数据进行去噪处理,得到所述图像数据的边缘特征;S106:提取所述转录组数据的差异性特征,所述差异性特征包括mRNA特征和miRNA特征;S107:根据所述样本数据的边缘特征、mRNA特征和miRNA特征,计算各个样本数据的相关系数矩阵;S108:采用软阈值,对所述相关系数矩阵中的相关系数进行非线性映射;S109:计算各个样本与其余样本的连通度;S110:通过Histogram算法,将所述连通度离散化,计算离散化的连通度以及相应的概率,得到样本间距离矩阵;S111:通过K-means++聚类算法对样本数据在mRNA数据视图、microRNA数据视图以及Image数据视图下进行预聚类,得到预聚类信息;S112:在mRNA数据视图、microRNA数据视图以及Image数据视图下将所述样本间距离矩阵转化为样本间相似度矩阵;S113:根据所述预聚类信息,构建mRNA数据视图、microRNA数据视图以及Image数据视图下的核矩阵;S114:根据所述核矩阵,对在mRNA数据视图、microRNA数据视图以及Image数据视图下的样本间相似度矩阵进行迭代;S115:综合在mRNA数据视图、microRNA数据视图以及Image数据视图下的样本间相似度矩阵,得到样本间相似度融合矩阵;S116:通过谱聚类算法,根据所述样本间相似度融合矩阵,对样本进行聚类;其中,所述S109具体为:通过以下公式,计算当前样本与其余样本的连通度: 其中,ki表示第i个样本与其余样本的连通度,aij表示第i个样本与第j个样本之间的相关系数,β表示软阈值,m表示样本数。

全文数据:

权利要求:

百度查询: 北京科技大学 一种多模态数据聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。