买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于机器学习的病毒氨基酸序列生成与筛选方法和系统_浙江大学_202211214161.1 

申请/专利权人:浙江大学

申请日:2022-09-30

公开(公告)日:2024-04-09

公开(公告)号:CN117854585A

主分类号:G16B20/20

分类号:G16B20/20;G16B30/10

优先权:

专利状态码:在审-公开

法律状态:2024.04.09#公开

摘要:本发明公开了一种基于机器学习的病毒氨基酸序列生成与筛选方法,包括以下步骤:S1从实验数据中构建用于训练模型的数据集;S2使用数据集对病毒氨基酸序列生成和筛选装置进行训练;S3使用训练完成的病毒氨基酸序列生成和筛选装置进行病毒氨基酸序列生成和筛选,S4对目标病毒氨基酸序列库中的病毒氨基酸序列进行验证。所述系统包括:云计算及超算平台、病毒载体设计与开发实验室、病毒氨基酸序列生成和筛选装置以及算法结果验证实验室共四大部分。本发明对病毒氨基酸进行编码,引入长短期记忆网络生成具有“生物语义”的离散序列信息的特点生成病毒氨基酸序列,并利用病毒氨基酸序列生产适应度对病毒氨基酸序列进行筛选,提高了生成和筛选速度。

主权项:1.一种基于机器学习的病毒氨基酸序列生成与筛选方法,其特征在于,具体步骤如下:S1,从实验数据中构建用于训练模型的数据集;S2,使用数据集对病毒氨基酸序列生成和筛选装置进行训练;包括以下步骤:S21将数据集中的氨基酸序列进行特征编码S22对特异性氨基酸序列生成模块进行训练;特异性氨基酸序列生成模块是通过学习已有可生成病毒的氨基酸序列间的逻辑结构以及语法语义特征来生成病毒氨基酸序列;S23训练病毒氨基酸序列生产适应度预测模块病毒氨基酸序列生产适应度预测模块根据病毒氨基酸序列进行病毒氨基酸序列生产适应度的预测,生产适应度越高说明氨基酸序列生成病毒的能力越强;S3使用训练完成的病毒氨基酸序列生成和筛选装置进行病毒氨基酸序列生成和筛选,具体步骤如下:S31,设定病毒氨基酸序列长度和生成数量后,将参数输入到特异性氨基酸序列生成模块;S32,特异性氨基酸序列生成模块根据随机生成的一个氨基酸生成预设数量和长度的病毒氨基酸序列;S33,病毒氨基酸序列生产适应度预测模块接收到所有生成的病毒氨基酸序列后,对每个病毒氨基酸序列进行病毒氨基酸序列生产适应度预测,得到相应的病毒氨基酸序列生产适应度和病毒氨基酸序列是否真实的判断;S34,病毒评分模块,根据预测的病毒氨基酸序列生产适应度和病毒氨基酸序列是否真实的判断对病毒氨基酸序列进行评分;S35,生成目标病毒氨基酸序列库,根据对病毒氨基酸序列的评分进行排序,选取评分值高的前P个氨基酸序列组成目标病毒氨基酸序列库,P为正整数;S4,对目标病毒氨基酸序列库中的病毒氨基酸序列进行验证;S41,对目标病毒氨基酸序列库中的病毒氨基酸序列进行实验,得到实验数据,并对实验得到的病毒氨基酸序列生产适应度与预测出来的病毒氨基酸序列生产适应度通过评价指标相比较,验证病毒氨基酸序列生成和筛选装置进行病毒氨基酸序列生成的有效性。

全文数据:

权利要求:

百度查询: 浙江大学 基于机器学习的病毒氨基酸序列生成与筛选方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。