买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于CNN和SVM的Sanger测序结果质检方法_北京诺赛基因组研究中心有限公司_202311817769.8 

申请/专利权人:北京诺赛基因组研究中心有限公司

申请日:2023-12-27

公开(公告)日:2024-01-30

公开(公告)号:CN117473444A

主分类号:G06F18/2433

分类号:G06F18/2433;G06F18/10;G06F18/2431;G06F18/2415;G06F18/25;G06F18/2411

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.02.20#实质审查的生效;2024.01.30#公开

摘要:本发明提供基于CNN和SVM的Sanger测序结果质检方法,包括解析Sanger测序仪生成的测序样本.ab1测序结果文件、测序信号完整性识别、测序信号异常识别和染料峰的测序结果判别。本发明可以用于辅助Sanger测序结果质检,大幅度提升质检的可靠性和效率,大幅提高了Sanger测序结果质检的自动化程度。

主权项:1.基于CNN和SVM的Sanger测序结果质检方法,其特征在于,所述方法包括以下步骤:步骤S1,解析Sanger测序仪生成的测序样本.ab1测序结果文件,获取所述测序结果质检所需的数据,所述数据包括Raw信号有效段的起点位Start参数和止点位Stop参数,和每个碱基峰点在Analyzed信号中的位置和每个碱基对应的QV值;步骤S2,测序信号完整性识别,包括判断所述Raw信号从所述起点位Start参数到所述止点位Stop参数是否完整覆盖所述Raw信号有效信号段;对于有效信号段不完整的测序结果,重新截取Raw信号有效段并生成包含完整信息的Analyzed信号,直至得到有效信号段完整的测序结果;对于有效信号段完整的测序结果,可以直接进入测序信号异常识别;步骤S3,在测序信号完整后,进行所述测序信号异常识别,具体包括:步骤S31,对步骤2得到的所述Raw信号和所述Analyzed信号进行预处理,其中对所述Raw信号预处理包括Raw信号标准化和统一信号长度;对所述Analyzed信号预处理包括:a.根据步骤S1中每个碱基峰点在Analyzed信号中的位置,截取Analyzed信号的50-750bp,对于不足750bp的Aanlyzed信号,截取50bp至最后一个碱基;b.根据步骤S1中每个碱基峰点位置,进行基于平均峰高的标准化;和c.对样本的Analyzed信号进行信号长度统一;步骤S32,使用两个一维CNN分别对所述测序样本的Raw信号和Analyzed信号进行分类,分类的类型包括正常和多种异常类型,并结合所述两个一维CNN的分类结果确定最终结果,若两个CNN均输出同一类型,且置信概率均大于0.9,则认为分类的类型准确,否则认为分类的类型不准确,转为人工识别,直接判断所述测序结果是否合格;和步骤4:对于分类类型准确的测序结果,如果分类为非染料峰的测序结果,根据质检规程直接判定所述测序结果是否合格;若分类为染料峰的测序结果,使用SVM1判断所述染料峰是否严重和使用SVM2判断是否存在染料峰导致的碱基错读,若SVM1判断染料峰严重,和或SVM2判断存在染料峰导致的碱基错读,则判断所述染料峰测序结果不合格,反之认为所述染料峰测序结果合格。

全文数据:

权利要求:

百度查询: 北京诺赛基因组研究中心有限公司 基于CNN和SVM的Sanger测序结果质检方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。