买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于基因类型和氨基酸序列的决定性互补区分类方法_鲁东大学_202410240576.9 

申请/专利权人:鲁东大学

申请日:2024-03-04

公开(公告)日:2024-04-09

公开(公告)号:CN117854601A

主分类号:G16B40/20

分类号:G16B40/20;G16B30/00;G06F18/213;G06F18/241;G06F18/25;G06N3/045;G06N3/0464

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明属于生物信息学领域,涉及一种基于基因类型和氨基酸序列的决定性互补区分类方法,将T细胞受体的决定性互补区的可变基因段、连接基因段以及氨基酸序列进行充分融合,旨在提高决定性互补区的分类能力。该方法使用了一种新型的预处理方法,使得决定性互补区的基因类型和氨基酸序列数据合并为一种新数据,并对可变基因段和连接基因段各使用两个卷积神经网络模块同时提取特征,根据卷积提取到的特征对决定性互补区进行分类。该方法包括基因类型和氨基酸序列预处理、特征提取模块的构建和特征分类模块的构建三个步骤。该方法可有效融合决定性互补区的基因类型和氨基酸序列特征,取得更优的分类效果,对临床治疗和免疫过程的研究具有重要意义。

主权项:1.一种基于基因类型和氨基酸序列的决定性互补区分类方法,其特征在于,使用了一种新型的预处理方式将决定性互补区的基因类型和氨基酸序列进行有效的融合,从而形成一种新的数据,并提出相应的深度学习模型来对数据所包含的特征进行充分提取,包括基因类型和氨基酸序列预处理、特征提取模块的构建和特征分类模块的构建三个步骤,其具体步骤如下:步骤1、使用pytorch框架的nn.Embedding函数为所有类型的氨基酸生成一个词向量,并额外生成一个无意义的词向量,使用生成的词向量将决定性互补区的氨基酸序列转换为其对应的词向量矩阵,为决定性互补区的可变基因和连接基因各生成一个特征矩阵,矩阵的维度为基因类型数×氨基酸序列长度×词向量维度,将两个基因类型所在的行替换为氨基酸序列的词向量矩阵,其余空间则使用无意义词向量进行填充;步骤2、使用pytorch框架的nn.Conv2d函数构建两个卷积模块,每个卷积模块含有两个平行且卷积核不同的卷积神经网络,第一个卷积模块以步骤1中的可变基因特征矩阵作为输入,第二个卷积模块以步骤1中的连接基因特征矩阵作为输入;步骤3、一种基于基因类型和氨基酸序列的决定性互补区分类方法,步骤3实现过程如下:使用pytorch框架的nn.Linear函数构建两个全连接层,将步骤2中两个卷积模块提取到的特征拼接到一起并传入到全连接层中,全连接层则通过对特征进行维度变换来完成对决定性互补区的分类。

全文数据:

权利要求:

百度查询: 鲁东大学 一种基于基因类型和氨基酸序列的决定性互补区分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。