买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于深度学习的16S rRNA基因测序引物设计方法及系统_北京大学_202410050281.5 

申请/专利权人:北京大学

申请日:2024-01-12

公开(公告)日:2024-04-16

公开(公告)号:CN117894372A

主分类号:G16B25/20

分类号:G16B25/20;G16B30/10;G16B40/20

优先权:

专利状态码:在审-公开

法律状态:2024.04.16#公开

摘要:本发明提供一种基于深度学习的16SrRNA基因测序引物设计方法及系统,涉及引物设计技术领域。首先获取目标细菌群落相关的属列表,基于属列表得到代表性16SrRNA基因全长序列,利用预先训练的区域划分模型预测代表性全长序列的各个可变区域及保守区域,确定符合测序平台要求的候选扩增区域用于引物设计,针对每个候选扩增区域确定对应的正向引物结合区序列集和反向引物结合区序列集,基于两种序列集分别进行多序列比对得到候选特异性引物对,最后筛选得到目标细菌群落特异性引物对。本发明无需进行16SrRNA基因全长序列多序列比对,直接基于区域划分模型划分确定出候选扩增区域进行多序列比对,可有效节省运算时间和使用内存,提高引物设计流程的整体效率。

主权项:1.一种基于深度学习的16SrRNA基因测序引物设计方法,其特征在于,所述方法包括:获取目标细菌群落相关的属列表,所述属列表是通过少量其他同类宏基因组样本获得的,或者,通过目标细菌群落的先验知识获得的;从代表性全长序列数据集中确定目标细菌群落对应的属列表的代表性全长序列;基于预先训练的区域划分模型,确定每个代表性全长序列的九种可变区域和保守区域,将符合预设长度要求的可变区域组合作为候选扩增区域;所述区域划分模型是以标注了保守区域和九种可变区域的全长序列训练样本训练得到的;基于每个代表性全长序列的每个候选扩增区域确定对应的正向引物结合区序列和反向引物结合区序列,针对每个候选扩增区域:将该候选扩增区域在所有代表性全长序列上对应的正向引物结合区序列作为正向引物结合区序列集,将该候选扩增区域在所有代表性全长序列上对应的反向引物结合区序列作为反向引物结合区序列集,对每个候选扩增区域对应的正向引物结合区序列集和反向引物结合区序列集分别进行多序列比对,生成每个候选扩增区域对应的候选特异性引物对;对每个候选特异性引物对进行评估,筛选得到所述目标细菌群落对应的特异性引物对。

全文数据:

权利要求:

百度查询: 北京大学 基于深度学习的16S rRNA基因测序引物设计方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。