买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于比对方法的测序数据下采样方法及应用_杭州柏熠科技有限公司_202410138509.6 

申请/专利权人:杭州柏熠科技有限公司

申请日:2024-01-31

公开(公告)日:2024-04-26

公开(公告)号:CN117935913A

主分类号:G16B20/30

分类号:G16B20/30;G16B30/10

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本发明提供一种基于比对方法的测序数据下采样方法及应用,将每条测序数据同参考基因组序列进行比对得到每条测序数据比对到参考基因组序列的比对位置,基于比对位置按照排序规则对多条测序数据进行排序,对参考基因组序列根据设定的进程数量进行分组,根据排序后的测序数据的顺序按照累加终止规则逐条累加对应每组参考基因组序列的测序数据得到对应每组参考基因组序列的下采样数据,合并所有参考基因组序列的下采样数据得到下采样测序数据,采用同测序物种的参考基因组序列进行比对的方式进行下采样,保证了下采样过程中不会损失原有的基因组覆盖度,解决了以往下采样方法中存在的随机下采样导致病毒基因组覆盖度降低的情况。

主权项:1.一种基于比对方法的测序数据下采样方法,其特征在于,包括以下步骤:获取测序物种的参考基因组序列以及多条测序数据;将每条测序数据同参考基因组序列进行比对得到每条测序数据比对到参考基因组序列的比对位置,基于比对位置按照排序规则对多条测序数据进行排序,其中排序规则为:根据比对位置的比对起始位置同参考基因组序列的前置位碱基位置的关系自前向后依次排序测序数据,若多条测序数据的比对起始位置相同,根据测序数据的序列长度自长到短依次排序测序数据,若多条测序数据的比对起始位置相同且测序数据的序列长度相同时,根据测序数据的序列名称自前向后依次排序测序数据;对参考基因组序列根据设定的进程数量进行分组,根据排序后的测序数据的顺序按照累加终止规则逐条累加对应每组参考基因组序列的测序数据得到对应每组参考基因组序列的下采样数据,合并所有参考基因组序列的下采样数据得到下采样测序数据,其中累加终止规则为所有位点达到设定的下采样深度阈值,或者所有测序数据已遍历完毕。

全文数据:

权利要求:

百度查询: 杭州柏熠科技有限公司 基于比对方法的测序数据下采样方法及应用

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。