买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种迭代更新的生物学高维数据集的知识推理方法及系统_华中农业大学_202410108571.0 

申请/专利权人:华中农业大学

申请日:2024-01-26

公开(公告)日:2024-04-12

公开(公告)号:CN117634618B

主分类号:G06N5/045

分类号:G06N5/045;G06N5/04;G16B40/00;G16B5/00

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2024.03.19#实质审查的生效;2024.03.01#公开

摘要:本发明涉及一种迭代更新的生物学高维数据集的知识推理方法及系统,该知识推理方法包括:收集m个案例的第一序列信息;定义条件变量和结果变量,数据集编码;初始化迭代更新参数;随机初始化产生两个大小相同的和声库;依据新和声产生方法分别产生两个新和声;依据和声库更新方法更新两个和声库;构建模型集合;模型的统计学计算。本发明的知识推理方法采用迭代更新的方法,设计了两个和声库,通过和声库更新方法,迭代对和声库进行更新,最后提取两个和声库的交集,做统计学检验,与现有技术相比,不需要删除案例或者条件变量构建新的数据集,降低了计算机算力的要求,改善了面对生物学高维数据集的计算的组合爆炸问题。

主权项:1.一种迭代更新的生物学高维数据集的知识推理方法,其特征在于,包括:步骤1:根据待分析的问题,收集m个案例的第一序列信息,所述第一序列信息采样于对应案例的同一位置的基因片段;步骤2:定义条件变量、结果变量和数据集编码;从所述基因片段中选取n个等位基因定义为条件变量,将待分析的问题定义结果变量,并对每个案例的所述条件变量按照1、2、3进行编码,编码具体为将野生型纯合子基因型编码为1,将杂合子基因型编码为2,将突变纯合子基因型编码为3;对每个案例的所述结果变量按照1、2进行编码,编码具体为将显性结果编码为1,将隐性结果编码为2;每一行代表一个案例,由此构建以数据矩阵表示的生物学高维数据集;步骤3:初始化迭代更新参数,包括和声库大小HMS,记忆库取值概率HMCR,微调概率PAR,最大迭代次数max_iterations,音调微调带宽bw;将条件变量两两组合后加上结果变量构成解空间,每个条件变量取值为1,2或3,结果变量取值为1或2;步骤4:根据步骤3的迭代更新参数和解空间随机初始化产生两个大小均为HMS的和声库HM1和HM2;步骤5:依据新和声产生方法分别产生两个新和声Hnew1和Hnew2;步骤6:依据和声库更新方法更新和声库HM1和HM2;步骤7:构建模型集合MS,对和声库HM1中的和声按必要性指数Nec进行降序排列,对和声库HM2中的和声按组合解释力Exp进行降序排列,扫描和声库HM1和HM2,选出HM1和HM2中都包含的和声构建模型集合MS;步骤8:模型的统计学计算;将模型集合MS中的和声分别进行统计学计算,统计学计算采用皮尔森卡方检验,将模型集合MS中的和声及其对应的必要性指数Nec、组合解释力Exp、统计学计算得到的P值依次添加至结果集合中,最后得到结果集合;其中,所述的和声库HM1和HM2具体为:HM1将必要性指数Nec作为目标函数,根据二维条件变量的组合的状态Sa*b和结果变量的状态Sy计算必要性指数Nec:Nec=NumSa*b,SyNumSa*b,其中,NumSa*b,Sy表示条件变量的组合的状态为Sa*b且结果变量的状态为Sy的案例的数量,NumSa*b表示条件变量的状态为Sa*b的案例的数量,二维条件变量的组合的状态包括a=1*b=1、a=1*b=2、a=1*b=3、a=2*b=1、a=2*b=2、a=2*b=3、a=3*b=1、a=3*b=2、a=3*b=3共9种,结果变量的状态包括y=1、y=2共2种;HM2将组合解释力Exp作为目标函数,根据二维条件变量的组合的状态Sa*b和结果变量的状态Sy计算组合解释力Exp:Exp=NumSa*b,SyNumSy,其中,NumSa*b,Sy表示条件变量的组合的状态为Sa*b且结果变量的状态为Sy的案例的数量,NumSy表示结果变量的状态为Sy的案例的数量,二维条件变量的组合的状态包括a=1*b=1、a=1*b=2、a=1*b=3、a=2*b=1、a=2*b=2、a=2*b=3、a=3*b=1、a=3*b=2、a=3*b=3共9种,结果变量的状态包括y=1、y=2共2种。

全文数据:

权利要求:

百度查询: 华中农业大学 一种迭代更新的生物学高维数据集的知识推理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。