首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】确定SNP位点集合的方法、装置及其应用_深圳华大生命科学研究院_201780094353.4 

申请/专利权人:深圳华大生命科学研究院

申请日:2017-09-06

公开(公告)日:2024-05-14

公开(公告)号:CN111051537B

主分类号:C12Q1/6888

分类号:C12Q1/6888

优先权:

专利状态码:有效-授权

法律状态:2024.05.14#授权;2020.05.15#实质审查的生效;2020.04.21#公开

摘要:提供了一种确定SNP位点集合的方法。其中,该SNP位点集合用于预定物种的预定品种的纯种鉴定,该方法包括:1构建第一SNP位点集合和第二SNP位点集合,该第一SNP位点集合中的每一个SNP位点均来源于该预定物种的生物体,该第二SNP位点集合中的每一个SNP位点均来源于该预定品种的生物体;2针对该第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在该预定物种中的物种出现频率;3针对该第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在该预定品种中的品种出现频率;4基于该品种出现频率与该物种出现频率的差异,确定用于该预定品种的纯种鉴定的SNP位点集合。

主权项:1.一种针对预定物种的预定品种进行纯种鉴定的方法,其特征在于,包括:(I)针对所述预定品种选择用于进行纯种鉴定的SNP位点集合,所述用于进行纯种鉴定的SNP位点集合是基于下述方法确定的:(1)构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所述预定物种的生物体,所述第二SNP位点集合中的每一个SNP位点均来源于所述预定品种的生物体;(2)针对所述第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定物种中的物种出现频率;(3)针对所述第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定品种中的品种出现频率;(4)基于所述品种出现频率与所述物种出现频率的差异,确定用于所述预定品种的纯种鉴定的SNP位点集合;(II)基于所述用于进行纯种鉴定的SNP位点集合,构建候选SNP位点集合,所述候选SNP位点集合是所述用于进行纯种鉴定的SNP位点集合的子集;(III)针对所述候选SNP位点集合的每一个SNP位点,确定待鉴定生物体的SNP碱基类型,并按照下列公式确定所述待鉴定生物体的差异度D: ,a是所述候选SNP位点集合中SNP位点的数目,maf是基于多个预定品种的纯种生物体确定的所述候选SNP位点集合中每一个SNP位点的特定碱基类型的出现频率,所述特定碱基类型为每一个SNP位点的出现频率较高的碱基类型,针对所述候选SNP位点集合中每一个SNP位点,Min(Test)是基于下列原则确定的:当所述待鉴定生物体的SNP碱基类型是纯合的所述特定碱基类型,则Min(Test)为1,当所述待鉴定生物体的SNP碱基类型是杂合的所述特定碱基类型,则Min(Test)为0.5,当所述待鉴定生物体的SNP碱基类型不含有所述特定碱基类型,则Min(Test)为0;(IV)基于所述待鉴定生物体的差异度D与预定阈值的比较,确定所述待鉴定生物体是否为所述预定品种的纯种生物体;其中,所述预定阈值是基于多个预定品种的纯种生物体的所述差异度D确定的,是通过下列步骤确定的:(i)针对所述候选SNP位点集合,基于多个所述预定品种的纯种生物体,分别确定各纯种生物体的差异度D;(ii)基于步骤(i)中获得的各纯种生物体的差异度D,确定所述多个预定品种的纯种生物体的差异度D的平均值E和标准偏差SD;(iii)基于公式E+4*SD,确定所述预定阈值;所述候选SNP集合是通过从用于进行纯种鉴定的SNP位点集合中减去所述待鉴定生物体中无法检测的SNP而确定的,所述候选SNP集合中SNP位点的数目比所述用于进行纯种鉴定的SNP位点集合少1~2个,所述无法检测的SNP为不易进行PCR扩增的SNP;所述待鉴定生物体的差异度D小于所述预定阈值是所述待鉴定生物体为所述预定品种的纯种生物体的指示;在步骤(2)中,所述物种出现频率是通过下述公式确定的:(特定SNP的预定碱基类型出现次数)(构成所述第一SNP位点集合的生物体数目)×2;在步骤(3)中,所述品种出现频率是通过下述公式确定的:(特定SNP的预定碱基类型出现次数)(构成所述第二SNP位点集合的生物体数目)×2;在步骤(2)和(3)的至少之一中,基于以下原则确定特定SNP的预定碱基类型出现次数:针对纯合型预定碱基类型,将所述预定碱基类型的出现次数记为2次;针对杂合型预定碱基类型,将所述预定碱基类型的出现次数记为1次;所述预定碱基类型为野生型碱基;在步骤(4)中,基于所述品种出现频率与所述物种出现频率的差值绝对值,确定用于所述预定品种的纯种鉴定的SNP位点集合;选择所述品种出现频率与所述物种出现频率的差值绝对值最大的20个SNP位点,作为用于预定品种的纯种鉴定的SNP位点集合;用于进行纯种鉴定的SNP位点集合进一步包括:(5)对所述用于预定品种的纯种鉴定的SNP位点集合进行过滤,所述过滤是基于对所述SNP位点进行PCR引物设计实现的;用于进行纯种鉴定的SNP位点集合进一步包括:(a)构建第三SNP位点集合,所述第三SNP位点集合中的每一个SNP位点均来源于所述预定品种的至少一种近亲品种的生物体;(b)针对所述第三SNP位点集合中的每一个SNP位点,确定预定碱基类型在所述预定品种的所述近亲品种中的近亲品种出现频率;(c)基于所述品种出现频率与所述近亲品种出现频率的差异,确定补充SNP位点集合,并将所述补充SNP位点集合并入至所述用于预定物种的纯种鉴定的SNP位点集合;在步骤(b)中,所述近亲品种出现频率是通过下述公式确定的:(特定SNP的预定碱基类型出现次数)(构成所述第三SNP位点集合的生物体数目)×2;在步骤(c)中,基于所述品种出现频率与所述近亲品种出现频率的差值绝对值,确定所述补充SNP位点集合;针对每种所述近亲品种,选择所述品种出现频率与所述近亲品种出现频率的差值绝对值最大的5个SNP位点,构建所述补充SNP位点集合;在步骤(a)中,采用与所述预定品种最接近的两种近亲品种。

全文数据:

权利要求:

百度查询: 深圳华大生命科学研究院 确定SNP位点集合的方法、装置及其应用

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。