买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于混合熵优化互信息的基因调控网络构建方法_华中农业大学_202210294214.9 

申请/专利权人:华中农业大学

申请日:2022-03-23

公开(公告)日:2024-04-16

公开(公告)号:CN114925837B

主分类号:G06N7/01

分类号:G06N7/01;G06N5/04;G06F17/16;G06F17/18

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.09.06#实质审查的生效;2022.08.19#公开

摘要:本发明公开了一种基于混合熵优化互信息的基因调控网络构建方法,该方法包括:根据设置的离散度对基因表达连续型数据进行离散化处理,根据真实概率与James‑Stein估计概率产生的均方误差MSE计算得到收缩强度λ;根据概率与熵值的转换公式,得到James‑Stein估计熵值;通过概率分布的β矩求导简化Dirichlet先验分布下的贝叶斯熵值估计,将两种熵值估计器得到的值转换为互信息矩阵;计算与互信息矩阵类似的Z‑score矩阵,将两个矩阵组合得到初始基因调控网络;根据路径一致算法进行遍历,通过动态阈值对基因调控网络中基因间关系进一步进行筛选,得到最终的基因调控网络。本发明解决了现有技术中构建网络存在大量错误调控关系的问题,得到了更准确的基因调控网络。

主权项:1.一种基于混合熵优化互信息的基因调控网络构建方法,其特征在于,该方法包括以下步骤:S1、获取基因表达连续型数据,根据设置的离散度对基因表达连续型数据进行离散化处理,计算并得到每个基因对应的计数向量;根据真实概率与James-Stein估计概率产生的均方误差MSE计算得到收缩强度λ;S2、根据得到的收缩强度λ,计算无先验分布James-Stein估计的概率,根据概率与熵值的转换公式,得到James-Stein估计熵值;通过概率分布的β矩求导简化Dirichlet先验分布下的贝叶斯熵值估计,其中先验参数a通过收缩强度λ来计算,具体为当λ等于某一定值时使基于Dirichlet先验计算的概率等于贝叶斯估计下的概率,由此得到先验参数a与收缩强度λ的对应关系;根据熵值和互信息计算公式,将两种熵值估计器得到的值转换为互信息矩阵;S3、在对两种熵值估计的互信息矩阵进行优化的基础上,计算每个基因的Z-score,进而计算每对基因的Z-score,得到与互信息矩阵类似的Z-score矩阵,将两个矩阵组合得到初始基因调控网络;S4、根据初始阈值筛选初始的基因调控网络中的调控关系,然后根据路径一致算法进行遍历,通过动态阈值对基因调控网络中基因间关系进一步进行筛选,得到最终的基因调控网络;在所述S1步骤中:首先对连续基因表达数据集进行离散化;如果随机变量X的值分布在区间[a,b]中,则根据区间的大小将该区间划分为等距的子区间;子区间的数量表示为bin,离散化后的随机变量X如Eq.1所示:X=[X1,X2,X3,......,Xn]1经过离散化操作后,随机变量X的n个变量Xi分布在K个bin中,其中K表示分布概率大于0的bin数量;每个bin对应的索引向量为xi,随机变量X对应的索引向量如Eq.2所示:χ=[x1,x2,x3,......,xK]2此外,收缩目标t没有方差,但有更高的偏差;确定最佳收缩强度λ的第一步是选择合适的损失函数,使用平方误差作为损失函数;第二步是最小化风险函数Rλ,使用均方误差进行计算,如Eq.3所示: 然后得到最小化MSE的收缩强度λ,如Eq.4所示: 给定和得到Eq.5: 为了避免过度收缩,当令当出现负收缩时,令保证

全文数据:

权利要求:

百度查询: 华中农业大学 基于混合熵优化互信息的基因调控网络构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。