买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于改进蛋白质序列位置特异性矩阵的DNA结合蛋白识别方法_湖南大学_202210274125.8 

申请/专利权人:湖南大学

申请日:2022-03-20

公开(公告)日:2024-04-05

公开(公告)号:CN114512188B

主分类号:G16B25/10

分类号:G16B25/10;G06N3/049;G06N3/08;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2022.06.03#实质审查的生效;2022.05.17#公开

摘要:本发明公开了一种基于改进蛋白质序列位置特异性矩阵的DNA结合蛋白识别方法,包括:S1、参数初始化;S2、构建DNA结合蛋白序列信息;S3、采用位置特异性得分矩阵表示蛋白质序列;S4、对位置特异性得分矩阵进行归一化,得到改进后的位置特异性得分矩阵;S5、输入卷积神经网络;S6、将卷积神经网络的输出结果输入至双向长短时记忆网络;S7、采用时间分布稠密层对不同存储单元生成的隐藏特征进行加权;S8、将稠密层的输出输入到Flatten层;S9、将改进后的位置特异性得分矩阵输入随机森林模型得到对特定蛋白质序列的决策结果;S10、将步骤S8的输出和步骤S9的决策结果输入评分层,按照设定的权重进行最终的预测评分。本发明提高了预测的性能和准确率。

主权项:1.基于改进蛋白质序列位置特异性矩阵的DNA结合蛋白识别方法,其特征在于,包括以下步骤:S1、参数初始化,包括设置网络输入维度dim,网络序列长度l,卷积神经网络第一个卷积层的过滤器数量和大小设置为n1和size1,第二个卷积层的过滤器数量和大小设置为n2和size2,最大池化层的池化核大小为size3,设置双向长短时记忆网络的神经元数量为n3,设置全连接层的节点数量设置为n4,设置最终的DNA结合蛋白的预测评分为scoreDBP,神经网络预测结果为score1,随机森林预测结果为score2,神经网络预测结果所占的权重为w1,随机森林预测结果所占权重为w2;S2、构建DNA结合蛋白序列信息;S3、对于给定的蛋白质序列S,采用位置特异性得分矩阵表示蛋白质序列为S1S2...SL,其中,Si1≤i≤L表示出现在S中第i位的氨基酸,L为S的长度;S4、对位置特异性得分矩阵进行归一化,并将归一化后的矩阵分解为n个子矩阵,计算所有子矩阵的局部位置特异性得分矩阵特征,将蛋白质序列表示为特定维数的特征载体,得到改进后的位置特异性得分矩阵;S5、将改进后的位置特异性得分矩阵输入卷积神经网络,并顺序堆叠两个卷积层,上一层的输出作为下一层的输入,卷积层采用ReLU作为激活函数;S6、将所述卷积神经网络的输出结果输入至所述双向长短时记忆网络,并采用ReLU作为激活函数;S7、采用时间分布稠密层对不同存储单元生成的隐藏特征进行加权;S8、将稠密层的输出输入到Flatten层,并将结果变成一维数据,再输入到全连接层,得到输出,该输出的节点采用sigmoid作为激活函数;S9、将步骤S4得到的改进后的位置特异性得分矩阵输入随机森林模型,通过随机森林决策树得到对特定蛋白质序列的决策结果;S10、将步骤S8的输出和步骤S9的决策结果输入评分层,按照设定的权重进行最终的预测评分。

全文数据:

权利要求:

百度查询: 湖南大学 基于改进蛋白质序列位置特异性矩阵的DNA结合蛋白识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。