首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于复杂网络的多肽分类方法_江南大学_202110275496.3 

申请/专利权人:江南大学

申请日:2021-03-15

公开(公告)日:2024-04-30

公开(公告)号:CN112951341B

主分类号:G16C20/50

分类号:G16C20/50;G16C20/70

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2021.07.02#实质审查的生效;2021.06.11#公开

摘要:本发明公开了一种基于复杂网络的多肽分类方法,属于计算机辅助药物设计领域。所述方法根据网络结构获取待分类多肽的中氨基酸Phe、Trp、Lys、Arg、Ile、Leu、Val、Tyr的度、接近中心性和介数中心性,并将其作为网络特征来判断待分类多肽的类别,提供了一种新的思路实现对于多肽类别的判定;并可以再辅以根据一级结构特征、二级结构特征和三级结构特征对待分类多肽的类别进行最终确定,判断结果更准确。

主权项:1.一种基于复杂网络的多肽分类方法,其特征在于,所述方法包括:Step1提取待分类多肽的一级结构和三级结构,并对三级结构进行解析获得二级结构和网络结构;Step2根据网络结构获取待分类多肽的中氨基酸Phe、Trp、Lys、Arg、Ile、Leu、Val、Tyr的度、接近中心性和介数中心性作为网络特征;Step3以待分类多肽的网络特征为输入,采用以网络特征进行训练得到的训练好的分类模型对待分类多肽进行分类,得到待分类多肽所属类别的第一判断结果;所述训练好的分类模型包括基于支持向量机、K近邻、随机森林三种算法的分类模型;所述获取待分类多肽的中氨基酸Phe、Trp、Lys、Arg、Ile、Leu、Val、Tyr的度、接近中心性和介数中心性作为网络特征,包括:将每条多肽表示为:C=c1,c2,…,c20,c21,…,c40,c41,…c60;其中:1c1~c20代表各种氨基酸的平均度,在网络中反映氨基酸节点的重要程度;氨基酸节点i的度di的计算公式为di=∑aij,其中aij表示氨基酸节点i和氨基酸节点j之间有边记为1,否则为0;2c21~c40代表各种氨基酸的平均接近中心性,在网络中反映氨基酸节点与氨基酸节点之间的接近程度;氨基酸节点i的接近中心性ci计算公式为其中dij表示以氨基酸节点i为起点,以氨基酸节点j为终点的最短路径中所含边的数量,N为氨基酸节点的总数;3c41~c60代表各种氨基酸的平均介数中心性,在网络中反映某个氨基酸节点对其他氨基酸节点的影响程度;氨基酸节点i的介数中心性Bi计算公式为其中σjki表示从氨基酸节点j通过氨基酸节点i到氨基酸节点k最短路径的条数,σjk表示从氨基酸节点j到氨基酸节点k之间所有最短路径的总数;所述方法还包括:Step4提取待分类多肽的一级结构特征、二级结构特征和三级结构特征,并去除不相关和冗余的特征;Step5以待分类多肽的去除不相关和冗余的特征后的一级结构特征、二级结构特征和三级结构特征为输入,采用以一级结构特征、二级结构特征和三级结构特征进行训练得到的训练好的分类模型对待分类多肽进行分类,得到待分类多肽所属类别的第二判断结果;Step6根据待分类多肽所属类别的第一判断结果和待分类多肽所属类别的第二判断结果最终确定待分类多肽所属类别。

全文数据:

权利要求:

百度查询: 江南大学 一种基于复杂网络的多肽分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术