买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】噬菌体宿主属预测方法、装置、设备及存储介质_北京大学_202110819120.4 

申请/专利权人:北京大学

申请日:2021-07-20

公开(公告)日:2021-11-16

公开(公告)号:CN113658633A

主分类号:G16B5/00(20190101)

分类号:G16B5/00(20190101);G16B30/10(20190101);G16B50/00(20190101);G06K9/62(20060101)

优先权:

专利状态码:有效-授权

法律状态:2023.10.20#授权;2021.12.03#实质审查的生效;2021.11.16#公开

摘要:本申请提供了一种噬菌体宿主属预测方法、装置、设备及存储介质,涉及生物测序技术领域。能够根据噬菌体的短序列片段,直接预测噬菌体的宿主属。本申请构建了第一预设模型和第二预设模型,第一预设模型针对待检测噬菌体片段与每个候选宿主属的配输出第一得分,第一预设模型打分依据是待检测噬菌体片段的序列特征和蛋白编码特征、候选宿主属的序列特征。根据第一预设模型的打分获得多个目标候选宿主属,再将待检测噬菌体片段的密码子序列依次输入目标候选宿主属下的多个原核生物的马尔可夫链模型,根据原核生物的马尔可夫链模型输出的得分,确定每个目标候选宿主属的第三得分,根据第一得分和第三得分,确定目标宿主属。

主权项:1.一种噬菌体宿主属预测方法,其特征在于,所述方法包括:提取待检测噬菌体片段的噬菌体特征;其中,所述噬菌体特征包括第一序列特征和蛋白编码特征;将所述噬菌体特征分别与多个不同候选宿主属的第二序列特征进行配对,得到多个序列特征对;其中,所述第二序列特征是所述候选宿主属的双密码子频率和全基因组5-mer频率;将所述多个序列特征对输入第一预设模型,输出所述多个不同候选宿主属各自的第一得分;其中,第一得分用于表征所述第二序列特征与所述噬菌体特征之间的相关性;根据多个第一得分的分布情况,确定用于进行进一步检测的多个目标候选宿主属;将所述待检测噬菌体片段的第一密码子序列依次输入与每个所述目标候选属下多个原核生物对应的多个第二预设模型,得到每个第二预设模型的第二得分;其中,所述第二得分是密码子马尔可夫链模型与所述第一密码子序列的似然度得分;根据每个第二预设模型的第二得分,计算所述多个不同候选宿主属各自对应的第三得分;其中,所述第三得分是候选宿主属下分值最高的第二预设模型的第二得分;计算所述第一得分和第三得分的加权平均值,将最大加权平均值对应的候选宿主属确定为目标宿主属。

全文数据:

权利要求:

百度查询: 北京大学 噬菌体宿主属预测方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术