买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种变异数据降维输入的驴种群自然选择分类系统_湖南大学_202210038022.1 

申请/专利权人:湖南大学

申请日:2022-01-13

公开(公告)日:2024-04-05

公开(公告)号:CN114512185B

主分类号:G16B20/20

分类号:G16B20/20;G16B40/20;G06N3/0464;G06F18/241;G06F18/25

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2022.06.03#实质审查的生效;2022.05.17#公开

摘要:本发明属于生物信息数据挖掘领域,具体公开了一种变异数据降维输入的驴种群自然选择分类系统。该系统包括:输入模块,驴基因组序列数据处理模块,分类模块;输入模块,用于获取驴基因组序列数据;驴基因组序列数据处理模块,包括:驴基因组序列数据预处理单元、驴基因组序列数据融合单元,用于对输入模块获取的驴基因组序列数据进行处理,转换成变异位点融合数据;分类模块包括模型构建单元、模型预测单元,该模块利用卷积神经网络构建自然选择分类模型,利用变异位点融合数据进行数据降维,然后进行驴种群的自然选择分类。本发明具有通过挖掘驴种群基因组数据,分析驴种群所受的自然选择影响的功能优势,且模型参数少,准确度高。

主权项:1.一种变异数据降维输入的驴种群自然选择分类系统,其特征在于,所属分类系统包括:输入模块,驴基因组序列数据处理模块,分类模块;所述输入模块,用于获取驴基因组序列数据;所述驴基因组序列数据处理模块,与输入模块相联,用于对输入模块获取的基因组序列数据进行处理,输出驴基因组序列的变异位点位置数据和变异矩阵数据;所述驴基因组序列数据处理模块包括:驴基因组序列数据预处理单元、驴基因组序列数据融合单元;所述驴基因组序列数据预处理单元,用于对驴基因组序列数据划分、清洗;所述驴基因组序列数据预处理单元包括:驴基因组序列数据切片分割器,变异节点位置计算器,驴基因组序列数据转换器,驴基因组序列数据清洗器;所述驴基因组序列数据切片分割器用于将驴基因组序列切分为若干大小相等的片段;所述变异节点位置计算器用于计算驴基因片段中的位点在相应片段的相对位置;所述驴基因组序列数据转换器用于将划分的驴基因组片段数据转换为0,1二值数据矩阵,即变异矩阵数据,其中0表示祖先基因,1表示变异基因;所述驴基因组序列数据清洗器用于删除过短和过长的数据,合并重复位点数据,将重复位点的数据通过或运算得出结果;所述驴基因组序列数据融合单元用于将变异位点位置数据和变异矩阵数据进行运算生成变异位点融合数据,所述运算具体过程为:Mij=Hij*posj其中Hij指变异矩阵的第i行第j列数据,posj指第j个变异位点在片段区间内的相对位置,*表示乘法,Mij指变异位点融合数据的第i行第j列数据;所述分类模块包括:驴基因组序列模型构建单元、驴基因组序列模型分类单元,分类模块利用卷积神经网络构建驴种群自然选择分类模型,利用所述驴基因组序列数据处理模块输出的数据进行驴种群的自然选择分类;所述驴基因组序列模型构建单元采用卷积神经网络,构建自然选择模型,模型构建按照如下次序进行:调用Input层,CNN层,Dropout层,搭建分类模型;其中CNN层用于向量表征学习,Dropout层用于防止模型过拟合,然后根据每个特征调整权重,最后对权重和特征值向量相乘后求和输出;其中CNN层的计算过程为:V=convW,X+b W是权值矩阵,X是变异位点融合数据,b是偏置,是激活函数,conv是卷积函数,V是卷积函数输出结果,Y是激活函数的输出结果;所述驴基因组序列模型分类单元将驴基因组序列数据处理模块得到的变异位点融合数据输入到基因组序列模型构建单元构建的模型,利用训练集数据对模型进行训练,并将测试集读入训练好的模型进行自然选择分类;其中,自然选择预测分类过程按照如下次序进行:1读入驴基因组序列数据处理模块输出的变异位点融合数据,将读入的数据按照8:2划分成训练集和测试集,2采用独热编码方式对离散后的类型数据进行编码,最终得到变异位点数据的向量表示,3将转化成向量表示的训练集数据输入到模型中进行模型训练,4利用训练好的模型,读入测试集数据,进行自然选择分类。

全文数据:

权利要求:

百度查询: 湖南大学 一种变异数据降维输入的驴种群自然选择分类系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。