买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于单细胞转录组测序的细胞亚群注释方法_广州华银健康医疗集团股份有限公司_202110016630.8 

申请/专利权人:广州华银健康医疗集团股份有限公司

申请日:2021-01-07

公开(公告)日:2021-11-19

公开(公告)号:CN112700820B

主分类号:G16B30/10(20190101)

分类号:G16B30/10(20190101);G16B40/00(20190101);G16B50/00(20190101)

优先权:

专利状态码:有效-授权

法律状态:2021.11.19#授权;2021.05.11#实质审查的生效;2021.04.23#公开

摘要:本发明提供一种基于单细胞转录组测序的细胞亚群注释方法,包括如下步骤:110xbarcodeUMI识别,2比对基因组,3基因表达谱,4低质量细胞过滤和数据均一化,5细胞群体聚类,6Marker基因提取,7细胞亚群注释。本发明属于生物信息分析技术领域,本发明提供的基于单细胞转录组测序的细胞亚群注释方法,解决了单细胞亚群注释的问题,使得单细胞测序数据在常规分析后,可以支持依据基因表达谱和或细胞Marker基因进行细胞注释,实现了不同注释方法的有机结合,得到细胞类型的分布情况和相关信息。

主权项:1.一种基于单细胞转录组测序的细胞亚群注释方法,其特征在于:包括如下步骤:S1.10xbarcodeUMI识别:10xgenomics平台建库的测序下机数据,为fastq序列,同一ID号的fastq序列包括3部份:barcode+UMI+mRNA序列,使用软件cellrangercount,通过barcode序列区别序列的来源细胞,通过UMI序列对基因进行表达定量,通过3’端mRNA序列用于基因的鉴定;S2.比对基因组:采用STAR算法,将测序得到的fastq序列比对参考基因组上,将测得的序列定位到相应的基因上;S3.基因表达谱构建;S4.低质量细胞过滤和数据均一化:基于细胞表达的基因数量及单个细胞中线粒体基因数目进行细胞过滤,过滤使用软件R语言的Seurat包,去除低质量细胞后,使用Seurat软件的“Normalization”函数的LogNormalize方法,进行表达量均一化;S5.细胞群体聚类:1通过主成分降维分析,减少变量然后利用均一化后的表达量值进行PCA分析,从PCA分析结果中选取前10个主成分用于后续的聚类和分群分析;2聚类和分群分析:Seurat软件使用基于图论的聚类算法对细胞进行聚类和分群;S6.Marker基因提取:Seurat通过bimod似然比统计检验对不同细胞群体差异表达基因进行分析,筛选不同细胞群体中表达上调的基因,表达量显著较其它亚群都高的基因作为该细胞亚群的Marker基因;S7.细胞注释:整合SingleR的表达量数据集、CellMarker细胞Marker基因以及文献收集的细胞Marker基因,用程序GeneMarker_Annot.umap.pl或GeneMarker_Annot.tsne.pl进行细胞亚群的注释;所述步骤S3中的基因表达谱构建包括如下步骤:1)数据的整合和数据量均一化:涉及多个文库的样本时,在进一步的分析前需进行多样本数据的整合和数据量均一化,使所有细胞所有基因拥有统一的基因UMI丰度信息;2)测序数据均一化:以测序深度较低的样本为基准,从测序深度较高的样本中随机抽取reads,直到所有样本中细胞的平均测序量相同或基本相同;3)基因表达量定量:样本整合并经过测序数据均一化后,不做细胞过滤,基于每个细胞中每个基因mapping到的UMI条数进行基因表达量定量;所述SingleR的表达量数据集整合方法包括:经过步骤S1-S5,得到细胞亚群的分群结果作为输入,用R语言进行读取,使用R语言的SingleR包,使用SingleR提供的基因表达数据,根据基因表达的模式对细胞亚群进行鉴定,然后使用Seurat的RenameIdents方法进行注释,并最终输出细胞注释的结果图;所述CellMarker细胞Marker基因以及文献收集的细胞Marker基因整合方法包括:经过步骤S1-S6,得到细胞亚群的分群结果,及各细胞亚群的分群的Marker基因,并将从CellMarker数据库或文献收录的细胞Marker基因整理的参考表格作为输入,判断每个细胞亚群的Marker基因在参考细胞的Marker基因的覆盖情况。

全文数据:

权利要求:

百度查询: 广州华银健康医疗集团股份有限公司 一种基于单细胞转录组测序的细胞亚群注释方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。