买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】新抗原异质数据整合方法及装置、设备、存储介质_深圳新合睿恩生物医疗科技有限公司;北京新合睿恩生物医疗科技有限公司;深圳市新合生物医疗科技有限公司_202410017821.X 

申请/专利权人:深圳新合睿恩生物医疗科技有限公司;北京新合睿恩生物医疗科技有限公司;深圳市新合生物医疗科技有限公司

申请日:2024-01-05

公开(公告)日:2024-03-22

公开(公告)号:CN117524318B

主分类号:G16B40/00

分类号:G16B40/00;G06N3/0455;G06N3/0475;G06N3/094;G06F18/15

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2024.02.27#实质审查的生效;2024.02.06#公开

摘要:本发明属于生物信息学技术领域,公开了一种新抗原异质数据整合方法及装置、设备、存储介质,通过获取完整特征的样本数据预处理,并随机删除部分特征值,以及标记各个特征是否缺失特征值的真实标签,对生成对抗网络进行训练获得特征填充模型;在应用中,将未包括全部预设特征的新抗原异质数据确定为特征值缺失的待处理数据,生成目标掩码向量,输入特征填充模型进行填充,从而可以充分考虑样本特征数据中缺失特征与该样本其它完整特征的内部关联,基于生成对抗网络进行相互对抗训练以学习特征数值分布,实现对特征值缺失的样本进行填充使其成为完整的真实样本,提高样本数据量,使得填充后的样本更加真实,提升数据集整体可用的真实数据量。

主权项:1.新抗原异质数据整合方法,其特征在于,包括:获取完整特征的原始样本数据进行预处理以获得第一特征向量;随机删除所述第一特征向量中部分特征值,获得第二特征向量;标记所述第二特征向量中各个特征的真实标签,所述真实标签用于表示特征是否缺失特征值;根据所述第二特征向量和所述真实标签,对生成对抗网络进行训练获得特征填充模型;获取多个新抗原异质数据,对所述新抗原异质数据进行规范化处理,获得每个新抗原异质数据的初始特征向量;其中,各个新抗原异质数据的初始特征向量所包括的特征不完全相同;将全部新抗原异质数据所包括的特征进行合并去重,获得多个预设特征;将未包括全部预设特征的新抗原异质数据确定为特征值缺失的待处理数据,根据全部预设特征与初始特征向量,生成待处理数据的目标掩码向量;将待处理数据的初始特征向量和目标掩码向量输入所述特征填充模型,以获得待处理数据的目标特征向量;其中,根据所述第二特征向量和所述真实标签,对生成对抗网络进行训练获得特征填充模型,包括:将所述第二特征向量输入生成对抗网络的生成器,以使所述生成器根据所述真实标签对所述第二特征向量中缺失特征值的特征进行填充,以获得填充特征向量;将所述填充特征向量输入生成对抗网络的判别器,以使所述判别器预测所述填充特征向量中各个特征的预测标签;所述预测标签用于表示特征值是已知的特征值还是填充值;根据所述预测标签和所述真实标签,对所述生成器和所述判别器进行交替训练,获得特征填充模型。

全文数据:

权利要求:

百度查询: 深圳新合睿恩生物医疗科技有限公司;北京新合睿恩生物医疗科技有限公司;深圳市新合生物医疗科技有限公司 新抗原异质数据整合方法及装置、设备、存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。