首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于跨模态视图关联发现网络的卵巢癌预后预测方法_太原理工大学_202311332203.6 

申请/专利权人:太原理工大学

申请日:2023-10-13

公开(公告)日:2024-05-14

公开(公告)号:CN117594243B

主分类号:G16H50/50

分类号:G16H50/50;G16H50/20;G16H50/30;G06F18/27;G06F18/243

优先权:

专利状态码:有效-授权

法律状态:2024.05.14#授权;2024.03.12#实质审查的生效;2024.02.23#公开

摘要:本发明公开了基于跨模态视图关联发现网络的卵巢癌预后预测方法,引入随机森林与LASSO回归结合的特征选择方法RLASSO,去除冗余和带有噪声的特征,充分选择与卵巢癌预后相关的基因;引入临床特征,将其分别与mRNA表达、DNA甲基化、miRNA表达和拷贝数变异进行整合;采用多模态深度神经网络并行学习特定组学数据的高级特征表示,进行卵巢癌初始预后预测;提出使用跨模态视图关联网络对初始预测结果构建发现张量,探索空间中交叉组学的互相关性,实现最终的卵巢癌预后预测。本发明能够有效解决现有方法忽略不同组学数据之间的差异性和互相关性的问题,更准确地预测了卵巢癌患者的预后。

主权项:1.基于跨模态视图关联发现网络的卵巢癌预后预测方法,其特征在于,包括以下步骤:步骤S1、获取卵巢癌患者的临床数据和多个组学数据,构建多模态特征空间,并对临床数据和多个组学数据进行预处理;步骤S2、预处理后的组学数据利用RLASSO进行组学特征选择,使用LASSO回归将组学特征稀疏化,结合随机森林对组学特征进行重要性排序,并将随机森林选取的重要组学特征作为LASSO回归中丢失组学特征的补充,获得与卵巢癌相关的预后特征;步骤S3、预处理后的临床数据与预后特征进行整合,得到整合组学数据;步骤S4、采用多模态深度神经网络,提取整合组学数据的高级特征表示;步骤S5、采用跨模态视图关联发现网络,对整合组学数据的高级特征表示构建发现张量,探索空间中交叉组学的互相关性,构建卵巢癌预后预测模型;步骤S6、训练卵巢癌预后预测模型;步骤S7、验证并评估卵巢癌预后预测模型的预测能力和有效性;其中,多个所述组学数据包括mRNA表达、DNA甲基化、miRNA表达和拷贝数变异,所述临床数据中的临床特征包括年龄、种族、Figo分期、卵巢癌亚型;步骤S2中,具体包括:LASSO回归进行特征选择的公式如下: 其中,i表示第i个组学数据,N表示样本数量,di表示第i个组学数据的组学特征总量,yj表示第j个样本的标签,λ表示正则化参数;使用随机森林构建决策树,对所有组学特征进行重要性排名,根据组学特征重要性标准选择前K个重要组学特征;在组学数据的特征集中,根据特征重要性,输出特征重要性集合其中di表示第i个组学数据的组学特征总数,Ix计算公式如下所示: 其中,和表示扰动前后的袋外数据,即决策树重采样时未采样到的样本,并统计分类正确的样本数;按重要性降序排列,选择重要性较高的K个特征作为筛选后的特征;将随机森林选择的重要特征与LASSO回归中保留的特征共同作为特定组学数据的总特征,即与卵巢癌相关的预后特征;步骤S3中,具体包括:将临床数据中的年龄、种族、卵巢癌亚型、Figo分期这4个临床特征分别与经过特征选择的组学特征,即预后特征,进行拼接,得到整合组学数据,作为多模态深度神经网络的输入,其中,一个深度神经网络输入的特征如下所示: 其中,Xi表示第i个组学特征与临床特征融合后的总特征,表示第i个组学数据的第p个组学特征,i=1,2,3,4,c1-c4表示临床特征;步骤S4中,具体包括:采用多模态深度神经网络,从多个通道并行学习整合组学数据,每个通道对应一个深度神经网络,每个通道独立学习并提取不同类型整合组学数据的高级特征表示;第i个整合组学数据具有l个隐藏层的深度神经网络表示如下: 其中,y表示样本标签,θ表示所有神经网络的参数,Zkk=1,2,…,l均是通过隐藏神经元处理后的结果,b是偏置向量;Z和W取决于输入维度的大小,隐藏神经元的个数以及类别的数量;σ·是激活函数LeakyRelu,g·是softmax函数,将输出层的值转换为预测概率;对于第i个类型的整合组学数据的预测过程可以写为: 其中,使用表示中的第j行,这是第i个整合组学数据的第j个训练样本的预测标签分布,即整合组学数据的高级特征表示;步骤S5,具体包括:采用跨模态视图关联发现网络对每个多组学数据的预测标签分布构建跨组学发现张量,通过跨组学发现张量充分学习不同组学数据之间的互相关性;其中,对mRNA表达、DNA甲基化、miRNA表达和拷贝数变异的相关性进行建模,令Pj∈R2×2×2×2表示第j个样本的跨组学发现张量,计算公式如下: 表示的第i项,使用Pj挖掘不同组学数据预测标签分布之间的关系,充分学习它们之间的互相关性;将跨组学发现张量Pj∈R2×2×2×2重塑为长度是24的一维向量pj∈R16,pj表示融合后的标签特征,使用全连接神经网络学习重塑后的跨组学发现张量,即融合后的标签特征,获得卵巢癌预后预测的最终结果;其中,将pj输入全连接神经网络中获得卵巢癌最终的预后预测结果y′j;当全连接网络由2个隐藏层组成,每个层数均为100时,获得最好的预测结果,公式如下:MACODNpj=σ2W2σ1W1pj+b1+b2yj=MACODNpj其中,σ1和σ2表示激活函数分别为LeakyRelu和Softmax,W表示权重矩阵,b表示偏置向量,y'j∈R2;步骤S6中,训练卵巢癌预后预测模型,具体包括:采用交叉熵作为代价函数,以最小化训练多模态神经网络误差: 其中,v表示组学类型的数量,N表示样本数量,表示交叉熵损失函数,yj∈R2是第j个样本的one-hot编码的标签;跨模态视图关联发现网络使用交叉熵损失函数进行训练,即: 其中,MACODNpj∈R2,v表示组学数据的类型总数,全连接网络中的激活函数分别为LeakyRelu和Softmax,最终输出维度为2的预测结果;多模态深度神经网络和跨模态视图关联发现网络总的损失函数如下所示: 其中,β是特定组学的预测损失与最终预测损失之间的权衡参数,设置β=1;采用Adam优化器对目标函数进行优化,学习率和批处理分别设置为0.01和32,采用dropout技术和权重衰减进一步防止模型过度拟合。

全文数据:

权利要求:

百度查询: 太原理工大学 基于跨模态视图关联发现网络的卵巢癌预后预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。