申请/专利权人:厦门大学
申请日:2024-02-21
公开(公告)日:2024-03-22
公开(公告)号:CN117746995A
主分类号:G16B40/00
分类号:G16B40/00;G16B30/00;G06F16/35;G06N3/0455;G06F18/22;G06F18/2415
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.09#实质审查的生效;2024.03.22#公开
摘要:本申请的实施例提供了一种基于单细胞RNA测序数据的细胞类型识别方法、装置及设备。该方法包括:获取并预处理单细胞RNA测序训练数据集;采用与数据来源对应的文本模板生成每一细胞样本对应的文本描述;将每一细胞样本对应的基因测序数据和文本描述分别输入至RNA编码器和文本编码器,得到对应的基因嵌入和文本嵌入;构建损失函数,以进行模型优化;将待识别细胞对应的基因测序数据经过预处理后,输入至RNA编码器,并将其可能的细胞类型对应的文本描述输入至文本编码器,得到目标基因嵌入和若干待匹配文本嵌入,进而确定待识别细胞对应的细胞类型。本申请实施例的技术方案可以有效区分不同细胞之间的差异性,提高细胞类型识别结果的准确性。
主权项:1.一种基于单细胞RNA测序数据的细胞类型识别方法,其特征在于,包括:获取并预处理单细胞RNA测序训练数据集,所述单细胞RNA测序训练数据集包括若干细胞样本对应的基因测序数据;采用与所述单细胞RNA测序训练数据集的数据来源对应的文本模板,为预处理后的所述单细胞RNA测序训练数据集中的每一细胞样本生成对应的文本描述,所述数据来源包括单一数据来源和复杂数据来源;将预处理后的每一细胞样本对应的基因测序数据输入至预先构建的RNA编码器,以及将其对应的文本描述输入至预先构建的文本编码器,以使所述RNA编码器输出对应的基因嵌入,所述文本编码器输出对应的文本嵌入;根据各细胞样本对应的所述基因嵌入以及所述文本嵌入两两之间的余弦相似性,构建损失函数,以根据所述损失函数对所述RNA编码器和所述文本编码器进行优化;将待识别细胞对应的基因测序数据经过预处理后,输入至优化后的所述RNA编码器,将所述待识别细胞可能的细胞类型对应的文本描述输入至优化后的所述文本编码器,以使优化后的所述RNA编码器输出目标基因嵌入,以及优化后的所述文本编码器输出若干待匹配文本嵌入;根据所述目标基因嵌入与每一所述待匹配文本嵌入之间的余弦相似性,确定所述待识别细胞对应的细胞类型。
全文数据:
权利要求:
百度查询: 厦门大学 基于单细胞RNA测序数据的细胞类型识别方法、装置及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。