买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】利用SNP标记估算大豆物候期模拟模型基因型特异参数的机器学习方法_南京农业大学_202311768727.X 

申请/专利权人:南京农业大学

申请日:2023-12-21

公开(公告)日:2024-04-09

公开(公告)号:CN117854590A

主分类号:G16B30/00

分类号:G16B30/00;G16B20/20;G16B40/00;G06F18/2113;G06F18/2431;G06F18/213;G06F18/214;G06N20/20;G06N3/0464;G06N5/01;G06N3/0442;G06N3/045;G06N3/126

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明公开了一种利用SNP标记估算大豆物候期模拟模型基因型特异参数的机器学习方法,通过机器学习构建基于SNP的基因型特异参数估算方法,并将估算的基因型特异参数结合DSSAT‑CROPGRO大豆物候期模拟模型模拟大豆物候期。该方法针对SGWAS对小效应SNP标记检出率低,忽略了众多对GSP变异有影响的标记的问题以及Bi‑LSTM等深度学习方法存在的远距离依赖难以学习的问题,设计了基于集成学习增强特征选择和局部记忆‑全局残差网络的基因型特异参数估算方法,以提高基因型特异参数估算精度,进而提高结合DSSAT‑CROPGRO大豆物候期模拟模型实现物候期预测精度。

主权项:1.一种利用SNP标记估算大豆物候期模拟模型基因型特异参数的机器学习方法,其特征在于其包括以下步骤:1确定要使用的大豆物候期模拟模型,准备种植于多年份、多生态点的大豆育种群体的实测物候期数据开花期R1,初荚期R3,始粒期R5,初熟期R7等,气象数据;2通过参数敏感性分析方法拉丁超立方一次一因子采样确定大豆物候期模拟模型待调的基因型特异参数Genotype-SpecificParameters,GSP,并确定GSP取值初始范围;3基于大豆育种群体在多年份、多生态点下的实测物候期,气象数据以及大豆物候期模拟模型采用差分进化算法对每个大豆材料的GSP进行参数校正以生成每个大豆材料的GSP;4使用三个嵌入式特征选择方法随机森林RandomForest,RF,自适应增强AdaptiveBoosting,AdaBoost,极端梯度提升eXtremeGradientBoosting,XGBoost构建SNP标记特征筛选框架;5确定三个特征选择方法待调超参数和超参数取值范围;6通过网格搜索法确定三个特征选择方法的最优超参数;7根据每个大豆材料全测序SNP标记和GSP以及确定的超参数分别对三个特征选择方法进行模型训练,获得三个特征选择模型;8分别输出训练后的三个特征选择模型对输入SNP标记的权重矩阵A基于AdaBoost得到的输入SNP标记权重矩阵,B基于XGBoost得到的输入SNP标记权重矩阵,C基于RF标记得到的输入SNP标记权重矩阵;9基于权重矩阵A和AdaBoost采用增量特征选择算法实现筛选阈值自适应获得SNP标记特征子集A*,基于权重矩阵B和XGBoost采用增量特征选择算法实现筛选阈值自适应获得SNP标记特征子集B*,基于权重矩阵C和RF采用增量特征选择算法实现筛选阈值自适应获得SNP标记特征子集C*,并对三个特征子集两两取交集,以过滤冗余和或不相关的SNP标记,最终将交集中的SNP标记作为最终的SNP标记特征子集RXA-IFS;10将每个大豆材料的GSP和SNP标记特征子集数据划分为训练集,验证集;11使用局部记忆-全局残差网络构建基于SNP标记的GSP估算框架,其包含基于双向长短期记忆网络Bi-directionalLongShort-TermMemory,Bi-LSTM的局部特征提取模块和基于残差网络ResidualNetwork,ResNet的全局特征提取模块;12使用训练集对局部记忆-全局残差网络进行训练;13在验证集上基于训练好的局部记忆-全局残差网络模型进行GSP估算后,将估算的GSP结合气象数据驱动大豆物候期模拟模型实现对大豆物候期的预测。

全文数据:

权利要求:

百度查询: 南京农业大学 利用SNP标记估算大豆物候期模拟模型基因型特异参数的机器学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。