买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于数据融合的玉米可变剪接异构体功能预测系统_山东大学_202210736872.9 

申请/专利权人:山东大学

申请日:2022-06-27

公开(公告)日:2024-04-16

公开(公告)号:CN115101120B

主分类号:G16B5/00

分类号:G16B5/00;G16B15/30;G16B35/00;G16B40/00;G06N3/0464;G06N3/048;G06N3/082

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.10.14#实质审查的生效;2022.09.23#公开

摘要:本发明提供了一种基于数据融合的玉米可变剪接异构体功能预测系统,通过对可变剪接异构体进行多组学数据融合来得到可变剪接异构体功能关联网络,实现多多组学数据的有效整合,能够更好地支撑可变剪接异构体的功能预测;通过对可变剪接异构体功能关联网络进行结构与属性相结合的图表示学习,可以学习到有效的可变剪接异构体特征表示;通过基于注意力机制的多示例学习,可以自适应地学习基因中每个可变剪接异构体的注意力权重,同时考虑了基因的功能由多个可变剪接异构体共同负责的情况,可以更好地区分可变剪接异构体的功能,实现了更准确更全面的可变剪接异构体功能预测。

主权项:1.一种基于数据融合的玉米可变剪接异构体功能预测系统,其特征在于:包括:数据获取模块,被配置为:获取待预测玉米可变剪接异构体的RNA-seq数据和序列数据、玉米可变剪接异构体与其从属基因的关联矩阵、玉米可变剪接异构体从属基因的已知功能标签注释以及基因本体标签功能描述文本;数据融合及特征学习模块,其被配置为:通过玉米可变剪接异构体的RNA-seq数据和序列数据进行数据融合得到玉米可变剪接异构体功能关联网络,将玉米可变剪接异构体的序列数据编码为等长的编码数据作为属性数据,通过网络表示学习,得到玉米可变剪接异构体的多组学特征数据;功能预测模块,其被配置为:根据玉米可变剪接异构体多组学特征数据,通过基于注意力机制的多示例多标记学习,将基因中玉米可变剪接异构体的特征向量加权聚合到基因层面,将基因本体标签功能文本描述编码为等长数字特征,并利用其得到所聚合的基因层面功能注释,结合已知基因功能注释得到玉米可变剪接异构体的功能预测结果;功能预测模块,包括:利用可变剪接异构体与其从属基因的关联矩阵,分别提取出每个基因所产生可变剪接异构体的特征数据;通过注意力机制,学习出基因中每个可变剪接异构体的注意力权重,并根据注意力权重对可变剪接异构体的特征进行加权求和,得到基因层面的特征向量,通过对每个基因的特征向量进行拼接,得到聚合基因层面特征矩阵;对基因本体标签描述文本进行编码,得到所有基因本体标签的特征矩阵;利用所聚合的基因层面特征矩阵和基因本体标签特征矩阵,得到基因层面功能注释矩阵;利用交叉熵计算基因层面功能注释矩阵与全部基因的已知功能标签注释矩阵之间的多示例学习损失;优化多示例学习损失至最小值,得到最优的可变剪接异构体特征矩阵,结合基因本体的特征矩阵,对可变剪接异构体功能注释进行预测。

全文数据:

权利要求:

百度查询: 山东大学 基于数据融合的玉米可变剪接异构体功能预测系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。