买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种单细胞转录组预测胚胎着床的方法及应用_北京大学第三医院(北京大学第三临床医学院)_202410172651.2 

申请/专利权人:北京大学第三医院(北京大学第三临床医学院)

申请日:2024-02-07

公开(公告)日:2024-05-10

公开(公告)号:CN117721222B

主分类号:C12Q1/6888

分类号:C12Q1/6888;C12Q1/6869;G16B25/10;G16B30/10

优先权:

专利状态码:有效-授权

法律状态:2024.05.10#授权;2024.04.05#实质审查的生效;2024.03.19#公开

摘要:本发明涉及医药检测领域,具体涉及一种单细胞转录组预测胚胎着床的方法及应用。所述单细胞转录组预测胚胎着床的方法,主要通过两步实现对胚胎着床潜能的预测:第一是发育潜能初步评估,即确定着床成功与着床失败的胚胎在转录组整体水平上的差异的规律,然后根据这个规律,将临床上的胚胎分为“高发育潜能组”和“低发育潜能组”;第二是发育异常的胚胎的排查,即根据染色体表达量的分布划分阈值,将染色体分为“正常表达”与“异常表达”染色体,含有“异常表达”染色体的胚胎被认为是发育异常的胚胎;可见,“高发育潜能组”中不含有“异常表达”染色体的胚胎被认为是能成功着床的胚胎。

主权项:1.一种非治疗目的和非诊断目的的通过单细胞转录组预测胚胎着床的方法,其特征在于,包括如下步骤:S1:对胚胎发育潜能初步评估;S2:对发育异常的胚胎的排查;所述S1步骤包括如下步骤:(1)获得囊胚外滋养层细胞,进行单细胞转录组测序;(2)对测序数据清洗、比对及比对后处理;(3)对测序后的样本进行筛选,并生成基因表达矩阵;(4)制作人类正常二倍体胚胎基因表达参考系;(5)制作相对表达量矩阵,(6)生成以染色体为单位的相对表达矩阵;(7)确定染色体表达量正常和染色体表达量异常的划分阈值,并识别出异常表达的染色体;(8)用移植过的临床样本来确定着床成功组与着床失败组在总表达量上的区别,再根据总表达量与染色体表达量评估胚胎发育潜能;所述S2步骤包括如下步骤:a:选取胚胎的囊胚期滋养层细胞的转录组数据为临床样本;b:生成用于计算表达参考系的基因表达矩阵;c:制作人类正常二倍体胚胎基因表达参考系;d:制作相对表达量矩阵;e:生成以染色体为单位的相对表达矩阵f:用上述S1步骤中的步骤(7)所计算的阈值,判断临床样本的染色体表达异常情况;g:将胚胎样本的整体基因表达量按照大小排序,根据总表达量上的排序,区别高发育潜能组与低发育潜能组;h:根据染色体表达情况和着床潜能评估,预测胚胎的着床结果;其中,所述步骤(2)对测序数据清洗、比对及比对后处理的具体内容:用trim_galore对数据质量进行清洗,默认参数去除二代测序接头序列、低质量碱基,保留处理后序列长度大于36bp的序列;然后用RSEM以hg38作为参考基因组进行比对,使用RSEM计算每个样本每个基因的表达水平;所述步骤(3)对测序后的样本进行筛选,并生成基因表达矩阵的具体内容:得到每个样本的基因表达水平后,对样本进行质量过滤,以RPKM1的基因数大于5000的样本为质量合格的样本;在质量合格的样本中,挑选已经被确认为没有染色体拷贝数变异的正常二倍体样本,用于制作表达量计算的参考系,剩下的样本用于训练模型,得到参数,得到每个样本的每个基因的表达量之后,制作一个列名为样本名,行名为基因名的矩阵;所述步骤(4)制作人类正常二倍体胚胎基因表达参考系的具体内容:得到基因表达矩阵后,挑选合适的样本及其适用的基因,用于建立基因表达参考系;首先,计算正常二倍体样本的表达总量的平均值: ,其中为样本量;其次,每一个样本的每个基因的表达量都同步上调下调,使得基因表达总值和基因表达总量的平均值齐平: ;再将基因表达量矫正后,删除在所有二倍体样本中表达量平均值1的基因,然后剩余基因的表达量计算变异系数,变异系数的计算如下: ,其中,CV为变异系数,SD为基因在各个样本中表达的标准差,Mean为基因的平均表达水平;根据变异系数的分布情况,由高到低排列CV值,挑选CV值位于前25%的基因并筛除,剩余基因用来计算每一个基因在二倍体标准样本中的平均表达量,与基因共同形成一个新的矩阵,该矩阵为人类正常二倍体胚胎基因表达参考系: ;所述步骤(5)制作相对表达量矩阵的具体内容:得到二倍体基因表达参考系后,根据转录本开始计算临床样本的染色体拷贝数变异;在上述步骤(4)生成的矩阵中,挑选出与参考系重合的基因,形成新的矩阵;新的矩阵中的每个基因,均除以参考系中相对应基因的平均表达量,从而生成相对表达量矩阵;所述步骤(6)生成以染色体为单位的相对表达矩阵的具体内容:得到相对表达矩阵后,接下来以染色体为单位,计算染色体基因平均相对表达量;每个染色体计算其所包含的基因的平均表达量: ,其中,n为二倍体参考系中属于N号染色体的基因数量,expgene为这些基因的相对表达量,每个染色体都做一次计算,得到一个以染色体为单位的相对表达矩阵;矩阵中的每一行即为某个样本每一条染色体的表达量,表达量矩阵: ;所述步骤(8)用移植过的临床样本来确定着床成功组与着床失败组在总表达量上的区别的具体内容:将已经进行过临床移植并且有临床结局的胚胎分为成功组和失败组,将其TE组织RNA表达量矩阵进行初步基因的筛选,将两组中不表达的基因筛除,然后以样本为单位,计算基因的表达总值;所述步骤c制作人类正常二倍体胚胎基因表达参考系的具体内容:计算表达总量的平均值,然后将每一个样本的基因表达总量都同步上调下调至平均值,删除表达量平均值RPKM1的基因,将剩下基因的表达量计算变异系数,然后根据基因的CV值的大小,挑选稳定表达的基因,用于建立基因表达参考系: ;所述步骤d制作相对表达量矩阵的具体内容:得到二倍体基因表达参考系后,用于检测临床样本的染色体表达量,先在样本的表达矩阵中,挑选出与参考系重合的7390个基因形成新的矩阵,新的矩阵中的每个基因,均除以二倍体胚胎基因表达参考系中相对应基因的平均表达量,从而生成相对表达量矩阵: ;所述步骤e生成以染色体为单位的相对表达矩阵的具体内容:得到相对表达矩阵后,接下来以染色体为单位,计算染色体基因平均相对表达量,每个染色体循环计算其所包含的基因的平均表达量,得到一个染色体相对表达矩阵: ;所述步骤g将胚胎样本的整体基因表达量按照大小排序,根据总表达量上的排序,区别高发育潜能组与低发育潜能组的具体内容:将胚胎样本的整体基因表达量按照大小排序,表达总量最高的前50%的样本被认为低发育潜能组,反之被认为高发育潜能组;所述步骤h根据染色体表达情况和着床潜能评估,预测胚胎的着床结果的具体内容:根据染色体表达情况和着床潜能评估,预测胚胎的着床结局并且不带有任何异常表达的染色体的,被预测为能成功着床的胚胎。

全文数据:

权利要求:

百度查询: 北京大学第三医院(北京大学第三临床医学院) 一种单细胞转录组预测胚胎着床的方法及应用

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。