申请/专利权人:人和未来生物科技(长沙)有限公司
申请日:2022-11-16
公开(公告)日:2023-03-21
公开(公告)号:CN115827221A
主分类号:G06F9/50
分类号:G06F9/50;G06F16/174
优先权:
专利状态码:在审-实质审查的生效
法律状态:2023.04.07#实质审查的生效;2023.03.21#公开
摘要:本发明公开了一种BAM文件并行读取方法、系统及介质,本发明从待解析BAM文件中顺序读取压缩数据块,将上述压缩数据块按照预设规则进行分组,生成由分组压缩块组成的待解压队列;读取线程以分组压缩块为单位,并行从待解压队列中获取数据;读取线程对分组压缩块进行解压,并解析对应的BAM数据,直到将整个分组压缩块的数据解析完成生成解析数据块;合并解析数据块,完成BAM文件的读取,本发明通过多个线程同时处理分组后的数据块的解压和解析工作,提升了整个BAM文件读取的效率,同时将读取的压缩数据块按照预设规则分组,调整了解压队列中数据的大小,降低了线程调度时间占比,提升了并行效率。
主权项:1.一种BAM文件并行读取方法,其特征在于,实施步骤包括:1从待解析BAM文件中顺序读取压缩数据块,将上述压缩数据块按照预设规则进行分组,生成由分组压缩块组成的待解压队列;2多个读取线程以分组压缩块为单位,并行从待解压队列中获取数据;3读取线程对获取的分组压缩块进行解压,并解析对应的BAM数据,直到将整个分组压缩块的数据解析完成生成对应的解析数据块;4合并解析数据块,完成BAM文件的读取。
全文数据:
权利要求:
百度查询: 人和未来生物科技(长沙)有限公司 一种BAM文件并行读取方法、系统及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。