申请/专利权人:深圳市真迈生物科技有限公司
申请日:2023-12-29
公开(公告)日:2024-05-03
公开(公告)号:CN117976042A
主分类号:G16B20/30
分类号:G16B20/30;G16B40/10;G06N20/00
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.21#实质审查的生效;2024.05.03#公开
摘要:本申请提供一种确定读段质量分数的方法、测序方法及装置。该确定读段质量分数的方法包括:获取读段的特征的取值,读段是通过边合成边测序获得的;和将特征的取值输入至训练后的机器学习模型中,以获得读段的质量分数,其中,训练后的机器学习模型为关联了读段的特征和该读段被分类为指定类别读段的概率的量化方案,机器学习模型为决策树,读段的质量分数与该读段被分类为指定类别读段的概率正相关。采用该确定读段质量分数的方法,能够有效确定读段的质量分数,评估序列质量。利用该质量分数对测序数据进行筛选可以减少高错误率序列以及杂质序列对后续基于分析该些测序数据进行目标检测所造成的影响。
主权项:1.一种预测读段被分类为指定类别读段的概率的方法,其特征在于,包括:获取读段的特征的取值,所述读段是通过边合成边测序获得的;和将所述特征的取值输入至训练后的机器学习模型中,以便预测该读段被分类为指定类别读段的概率,其中,所述训练后的机器学习模型为关联了所述读段的特征和该读段被分类为指定类别读段的概率的量化方案,所述机器学习模型为决策树。
全文数据:
权利要求:
百度查询: 深圳市真迈生物科技有限公司 确定读段质量分数的方法、测序方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。