买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】用于切割靶DNA的组合物及其用途_基因工具股份有限公司_201910137869.3 

申请/专利权人:基因工具股份有限公司

申请日:2013-10-23

公开(公告)日:2024-03-19

公开(公告)号:CN110066775B

主分类号:C12N9/22

分类号:C12N9/22;C12N15/113;C12N15/82;C12N5/10

优先权:["20121023 US 61/717,324","20130320 US 61/803,599","20130620 US 61/837,481"]

专利状态码:有效-授权

法律状态:2024.03.19#授权;2019.08.23#实质审查的生效;2019.07.30#公开

摘要:本发明涉及真核细胞或生物体中的靶向基因组编辑。更具体地,本发明涉及用于在真核细胞或生物体中切割靶DNA的组合物及其用途,所述组合物包含特异于靶DNA的向导RNA和Cas蛋白质编码核酸或Cas蛋白质。

主权项:1.II型成簇的规律间隔的短回文重复序列CRISPRCRISPR-相关蛋白质9Cas9组合物,用于修饰植物细胞中的靶DNA,其中所述靶DNA是内源基因组DNA,其中所述组合物包含:用于转染原生质体的Cas9-向导RNA复合物和转染缓冲液,其中所述Cas9-向导RNA复合物包含:a带有NLS的Cas9多肽;b向导RNA,其中该向导RNA是:idual向导RNA,其包含CRISPRRNAcrRNA和反式激活crRNAtracrRNA,crRNA的一部分与靶DNA杂交,或者ii单链向导RNAsgRNA,其包含CRISPRRNAcrRNA和反式激活crRNAtracrRNA,crRNA的一部分与靶DNA杂交;和所述转染缓冲液为用于转染植物细胞的转染缓冲液,其包含聚乙二醇PEG。

全文数据:用于切割靶DNA的组合物及其用途本申请是申请人于2013年10月23日提交的题为“包含特异于靶DNA的向导RNA和CAS蛋白质编码核酸或CAS蛋白质的用于切割靶DNA的组合物及其用途”的中国专利申请201380066348.4的分案申请。技术领域本发明涉及真核细胞或生物体中的靶向基因组编辑。更具体地说,本发明涉及一种用于在真核细胞或生物体中切割靶DNA的组合物及其用途,所述组合物包括特异于靶DNA的向导RNA和Cas蛋白质编码核酸或Cas蛋白质。背景技术CRISPR成簇的规律间隔的短回文重复序列是含有多个短同向重复的基因座,其被发现存在于约40%测序细菌的基因组中和90%测序古细菌的基因组中。CRISPR作为原核的免疫系统发挥功能,其赋予对外来遗传元件例如质粒和噬菌体的抵抗性。CRISPR系统提供了一种获得性免疫形式。外源DNA的短片段称为间隔区整合在CRISPR重复序列之间的基因组中,作为过去暴露的记忆。然后CRISPR间隔区以类似于真核生物中RNAi的方式用于识别和沉默外来遗传元件。Cas9,II型CRISPRCas系统中一种重要的蛋白质成分,当与称为CRISPRRNAcrRNA和反式激活crRNAtracrRNA的两个RNA复合时,形成活性核酸内切酶,从而切断入侵噬菌体或质粒中的外源遗传元件,以保护宿主细胞。crRNA从宿主基因组中的CRISPR元件转录,其中该CRISPR元件之前自外源入侵物捕获。最近,Jinek等1证明,通过融合crRNA和tracrRNA的必要部分产生的单链嵌合RNA可以取代Cas9RNA复合体中的两个RNA以形成功能性核酸内切酶。CRISPRCas系统相对于锌指和转录激活因子样效应物DNA结合蛋白提供了优势——因为在核苷酸结合CRISPR-Cas蛋白中的位点特异性由RNA分子调控而不是DNA结合蛋白调控这在设计和合成上是更具挑战性的。然而,到现在为止,尚未开发出使用基于CRISPRCas系统的RNA向导核酸内切酶RGEN的基因组编辑方法。同时,限制性片段长度多态性RFLP是最古老,最方便,和最便宜的基因分型方法之一,其仍然广泛应用于分子生物学和遗传学,但其往往受限于缺乏适当的限制性内切酶识别位点。可以通过各种方法检测由工程化核酸酶诱导的突变,其中包括错配敏感的T7核酸内切酶IT7E1或Surveyor核酸酶测定法,RFLP,荧光PCR产物的毛细管电泳,双脱氧测序和深度测序。T7E1和Surveyor测定法广泛使用,但很繁琐。此外,这些酶倾向于低估突变频率,这是因为突变序列可彼此形成同源双链,从而不能从野生型细胞中区分纯合双等位基因突变体克隆。RFLP没有这些限制,因而是首选的方法。实际上,RFLP是检测细胞和动物中由工程化核酸酶介导的突变的最早方法之一。然而,不幸的是,RFLP受限于适当限制性位点的可得性。在所关注的靶位点有可能没有限制性位点。发明内容技术问题到现在为止,尚未开发使用基于CRISPRCas系统的RNA向导核酸内切酶RGEN进行基因组编辑和基因分型的方法。在这种情况下,本发明人进行了大量努力来开发基于CRISPRCas系统的基因组编辑方法,最终建立了一个可程序化的RNA向导核酸内切酶,该RNA向导核酸内切酶可以在真核细胞和生物体中以靶向方式切割DNA。另外,本发明人进行了大量努力,开发一种新的在RFLP分析中利用RNA向导核酸内切酶RGEN的方法。其利用RGEN,对癌症中发现的以及细胞和生物体中由工程化核酸酶包括RGEN自身诱导的频发突变进行基因分型,从而完成了本发明。技术方案本发明的一个目的是提供一种在真核细胞或生物体中切割靶DNA的组合物,其包括特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种在真核细胞或生物体中诱导靶向诱变的组合物,其包括特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种在真核细胞或生物体中切割靶DNA的试剂盒,其包括特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种在真核细胞或生物体中诱导靶向诱变的试剂盒,其包括特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的再一目的是提供一种制备含有Cas蛋白质和向导RNA的真核细胞或生物体的方法,所述方法包括用Cas蛋白质编码核酸或Cas蛋白质以及向导RNA或编码向导RNA的DNA共转染或顺序转染真核细胞或生物体的步骤。本发明的另一个目的是提供一种真核细胞或生物体,其含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种在真核细胞或生物体中切割靶DNA的方法,所述方法包括步骤:用组合物转染含有靶DNA的真核细胞或生物体,所述组合物含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种在真核细胞或生物体中诱导靶向诱变的方法,所述方法包括步骤:用组合物处理真核细胞或生物体,其中所述组合物含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的再一个目的是提供胚胎、基因组修饰的动物或基因组修饰的植物,其包括由组合物编辑的基因组,所述组合物含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种制备基因组修饰的动物的方法,所述方法包括步骤:将含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质的组合物,引入动物胚胎中;和将胚胎转移到假孕代母的输卵管中,以产生基因组修饰的动物。本发明的另一个目的是提供一种组合物,其用于在分离的生物样品中基因分型突变或变异,所述组合物包含特异于靶DNA序列的向导RNA和Cas蛋白质。本发明的另一个目的是提供一种使用RNA向导核酸内切酶RGEN对细胞中由工程化的核酸酶诱导的突变或天然存在的突变或变异进行基因分型的方法,其中所述RGEN包含特异于靶DNA的向导RNA和Cas蛋白质。本发明的另一个目的是提供对细胞中由工程化的核酸酶诱导的突变或天然存在的突变或变异进行基因分型的试剂盒,所述试剂盒含有RNA向导核酸内切酶RGEN,其中所述RGEN含有特异于靶DNA的向导RNA和Cas蛋白质。本发明的一个目的是提供在真核细胞或生物体中切割靶DNA的组合物,所述组合物含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供在真核细胞或生物体中诱导靶向诱变的组合物,所述组合物含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供在真核细胞或生物体中切割靶DNA的试剂盒,所述试剂盒含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供在真核细胞或生物体中诱导靶向诱变的试剂盒,所述试剂盒含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一目的是提供制备含有Cas蛋白质和向导RNA的真核细胞或生物体的方法,所述方法包括用Cas蛋白质编码核酸或Cas蛋白质以及向导RNA或编码向导RNA的DNA共转染或顺序转染真核细胞或生物体的步骤。本发明的另一个目的是提供一种真核细胞或生物体,其含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种在真核细胞或生物体中切割靶DNA的方法,所述方法包括用组合物转染含有靶DNA的真核细胞或生物体的步骤,所述组合物含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种在真核细胞或生物体中诱导靶向诱变的方法,所述方法包括用组合物处理真核细胞或生物体的步骤,所述组合物含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供胚胎、基因组修饰的动物、或基因组修饰的植物,其包含由组合物编辑的基因组,所述组合物含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的另一个目的是提供一种制备基因组修饰的动物的方法,所述方法包括步骤:将含有特异于靶DNA的向导RNA或编码向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质的组合物,引入动物胚胎中;和将胚胎转移到假孕代母的输卵管,以产生基因组修饰的动物。本发明的另一个目的是提供在分离的生物样品中基因分型突变或变异的组合物,所述组合物含有特异于靶DNA序列的向导RNA和Cas蛋白质。本发明的另一个目的是提供在分离的生物样品中对病原微生物的核酸序列进行基因分型的组合物,所述组合物含有特异于靶DNA序列的向导RNA和Cas蛋白质。本发明的另一个目的是提供一种在分离的生物样品中基因分型突变或变异的试剂盒,所述试剂盒含有组合物,特别地含有RNA向导核酸内切酶RGEN,其中,所述RGEN包含特异于靶DNA的向导RNA和Cas蛋白质。本发明的另一个目的是提供在分离的生物样品中基因分型突变或变异的方法,该方法使用组合物,特别地所述组合物包含RNA向导核酸内切酶RGEN,其中,所述RGEN包含特异于靶DNA的向导RNA和Cas蛋白质。有益效果包含特异于靶DNA的向导RNA和Cas蛋白质编码核酸或Cas蛋白质的用于在真核细胞或生物体中切割靶DNA或诱导靶向诱变的本发明组合物、包含所述组合物的本发明试剂盒、以及诱导靶向诱变的本发明方法,提供了新的方便的基因组编辑工具。另外,因为可以设计定制RGEN以靶向任何DNA序列,所以几乎任何单核苷酸多态性或小的插入缺失indel均可以通过RGEN介导的RFLP进行分析,因此,本发明的组合物和方法可以用于检测和切割天然存在的变异和突变。附图简述图1显示Cas9催化的体外质粒DNA切割。a靶DNA和嵌合RNA序列的示意图。红色三角指示切割位点。Cas9识别的PAM序列以粗体显示。向导RNA中源自crRNA和tracrRNA的序列分别以框和下划线显示。bCas9体外切割质粒DNA。完整的环状质粒或ApaLI消化的质粒与Cas9和向导RNA孵育。图2显示Cas9在附加体episomal靶位点诱导的诱变。a使用RFP-GFP报告分子的基于细胞测定法的概略示意图。因为GFP序列在读框外融合至RFP序列,故GFP不从该报告分子表达。只有当两个序列之间的靶位点被位点特异性核酸酶切割后,RFP-GFP融合蛋白才表达。b转染了Cas9的细胞的流式细胞术。显示表达RFP-GFP融合蛋白的细胞的百分比。图3显示在内源染色体位点上由RGEN驱动的突变。aCCR5基因座。bC4BPB基因座。顶部使用T7E1测定法检测RGEN驱动的突变。箭头指示由T7E1切割的DNA条带的预期位置。通过测量条带强度,计算突变频率Indel%。底部CCR5和C4BPB野生型WT和突变克隆的DNA序列。互补于向导RNA的靶序列区域示于框中inboc。PAM序列以粗体显示。三角形指示切割位点。对应于微同源性microhomologies的碱基加下划线。右手列显示插入或缺失碱基的数目。图4显示不能检测到RGEN驱动的脱靶off-target突变。a标靶On-target序列和潜在的脱靶序列。在硅片上搜索人类基因组,以寻找潜在的脱靶位点。鉴定了四个位点,其中每个携带3个碱基的与CCR5标靶位点的错配。错配碱基加下划线。b使用T7E1测定法调查这些位点是否在转染Cas9RNA复合体的细胞中发生突变。在这些位点没有检测到突变。NA不适用,基因间位点。cCas9没有诱导脱靶相关的染色体缺失。在人细胞中表达CCR5特异的RGEN和ZFN。使用PCR检测在这些细胞中15-kb染色体缺失的诱导。图5显示小鼠中RGEN诱导的Foxn1基因打靶。a描绘了特异于小鼠Foxn1基因外显子2的sgRNA的示意图。外显子2中的PAM表示为红色,sgRNA中互补于外显子2的序列加下划线。三角形指示切割位点。b代表性的T7E1测定,表明通过胞质内注射而递送至一细胞阶段的小鼠胚胎中的Cas9mRNA+Foxn1特异性sgRNA的基因打靶效率。数字指示由最高剂量产生的独立建立者小鼠。箭头指示由T7E1切割的条带。cb中鉴定的三个Foxn1突变建立者小鼠中观察到的突变等位基因的DNA序列。发生数显示在括号中。d对Foxn1建立者小鼠#108和野生型FVBNTac杂交产生的F1后代进行的PCR基因分型。注意,存在于Foxn1建立者小鼠#108中的突变等位基因在后代中分离。图6显示通过胞质内注射Cas9mRNA和Foxn1-sgRNA在小鼠胚胎中的Foxn1基因打靶。a代表性T7E1测定的结果,其监测注射最高剂量后的突变率。箭头指示由T7E1切割的条带。bT7E1检测结果总结。显示在胞质内注射所示剂量RGEN后获得的体外培养胚胎中的突变体分数。c从T7E1阳性突变胚胎子集鉴定的Foxn1突变等位基因的DNA序列。野生型等位基因的靶序列表示在框内。图7显示使用重组Cas9蛋白质:Foxn1-sgRNA复合体在小鼠胚胎中的Foxn1基因打靶。a和b是代表性T7E1测定结果和其总结。胚胎进行原核a或胞质内注射b后体外培养。红色数字表示T7E1阳性突变建立者小鼠。c从体外培养的胚胎鉴定的Foxn1突变等位基因的DNA序列,该胚胎通过以最高剂量原核注射重组Cas9蛋白质:Foxn1-sgRNA复合体获得。野生型等位基因的靶序列表示在框内。图8显示在Foxn1突变建立者#12中发现的突变等位基因的种系传播。afPCR分析。bPCR基因分型野生型FVBNTac、建立者小鼠和他们的F1后代。图9显示通过杂交Prkdc突变建立者小鼠产生的胚胎的基因型。Prkdc突变建立者小鼠♂25和♀15杂交并分离E13.5胚胎。afPCR分析野生型,建立者小鼠♂25,建立者小鼠♀15。需要注意的是,由于fPCR分析的技术局限性,这些结果显示出与突变等位基因的精确序列有微小差别;例如,从序列分析,在建立者小鼠♂25和♀15中分别鉴定了Δ269Δ61WT和Δ5+1+7+12WT。b产生的胚胎的基因型。图10显示Cas9蛋白质sgRNA复合体诱导的靶向突变。图11表示重组Cas9蛋白质在拟南芥原生质体中诱导的突变。图12表示重组Cas9蛋白质在拟南芥BRI1基因中诱导的突变序列。图13显示T7E1测定,其表明在293细胞中通过Cas9-mal-9R4L和sgRNAC9R4LC复合体处理破坏内源性CCR5基因。图14a,b显示Fu等2013报道的RGEN在标靶位点和脱靶位点上的突变频率。T7E1测定分析了来自K562细胞的基因组DNA,所述K562细胞顺序转染了20μgCas9编码质粒和分别为60μg和120μg的体外转录的GX19crRNA和tracrRNA1×106个细胞R,或共转染了1μgCas9编码质粒和1μgGX19sgRNA表达质粒2×105个细胞D。图15a,b显示向导RNA结构的比较。使用T7E1测定法,测量了标靶和脱靶位点上的Fu等2013报道的RGEN的突变频率。K562细胞共转染了Cas9编码质粒和编码GX19sgRNA或GGX20sgRNA的质粒。脱靶位点OT1-3等如Fu等2013中标记。图16显示Cas9切口酶在体外DNA切割。aCas9核酸酶和配对的Cas9切口酶的示意图概略。PAM序列和切割位点显示在框中。b人类AAVS1基因座中的靶位点。每个靶位点的位置以三角形表示。cDNA切割反应的示意图概略。FAM染料示于框内连接至DNA底物的两个5'末端。d使用荧光毛细管电泳分析DSB和SSB。荧光标记的DNA底物在电泳前与Cas9核酸酶或切口酶孵育。图17显示Cas9核酸酶和切口酶的行为比较。a与Cas9核酸酶WT、切口酶D10A、和配对切口酶相关的标靶突变频率。显示产生5'突出端或3'突出端的配对切口酶。bCas9核酸酶和配对切口酶的脱靶效应分析。分析了三个sgRNA的总共7个潜在的脱靶位点。图18显示在其他内源性人基因座测试的配对Cas9切口酶。a,c在人CCR5和BRCA2基因座上的sgRNA靶位点。PAM序列显示为红色。b,d通过T7E1测定法检测每个靶位点上的基因组编辑活性。产生5'突出端的两个缺口的修复比产生3'突出端的两个缺口的修复导致了频繁得多的indel形成。图19显示配对Cas9切口酶介导同源重组。a检测同源重组的策略。供体DNA包括两个同源臂之间的XbaI限制性酶切位点,而内源性靶位点缺乏这个限制性酶切位点。PCR测定法用来检测已经进行同源重组的序列。为了防止污染供体DNA的扩增,使用对基因组DNA特异的引物。b同源重组的效率。只有发生了同源重组的区域的扩增子可以用XbaI消化;切割条带的强度被用来测量该方法的效率。图20显示由配对Cas9切口酶诱导的DNA拼接。a人AAVS1基因座中配对切口酶的靶位点。示出了AS2位点和其他各位点之间的距离。箭头指示PCR引物。b用PCR检测基因组缺失。星号表示缺失特异的PCR产物。c使用AS2和L1sgRNA获得的缺失特异性PCR产物的DNA序列。靶位点PAM序列显示在框内,sgRNA匹配序列以大写字母表示。完整的sgRNA匹配序列带下划线。d配对Cas9切口酶介导的染色体缺失的示意模型。新合成的DNA链示于框中。图21显示配对Cas9切口酶不诱导易位。a标靶位点和脱靶位点之间染色体易位的示意图概略。bPCR扩增以检测染色体易位。c由Cas9核酸酶而不是由切口酶对诱导的易位。图22显示T7E1和RFLP测定法的概念图。a二倍体细胞中工程化的核酸酶处理后四个可能的情况中测定切割反应的比较:A野生型,B单等位基因突变,C不同的双等位基因突变杂合,和D相同的双等位基因突变纯合。黑线代表源自每个等位基因的PCR产物;短虚线框和点框指示由NHEJ产生的插入缺失突变。b由电泳解析的T7E1和RGEN消化物的预期结果。图23示出含有C4BPB靶位点带有indel的线性化质粒的体外切割测定。各质粒底物的DNA序列上图。PAM序列加下划线。插入碱基显示在框中。箭头下图指示用野生型特异的RGEN切割的DNA条带在电泳后的预期位置。图24显示通过RGEN介导的RFLP对细胞中由工程化的核酸酶诱导的突变进行的基因分型。aC4BPB突变体K562细胞克隆的基因型。b比较错配敏感性T7E1测定法与RGEN介导的RFLP分析。黑色箭头指示通过T7E1酶或RGEN处理的切割产物。图25显示通过RGEN-RFLP技术基因分型RGEN诱导的突变。a使用RGEN-RFLP和T7E1测定法分析C4BPB破坏的克隆。箭头指示RGEN或T7E1切割的DNA条带的预期位置。b定量比较RGEN-RFLP分析与T7E1测定法。以不同比例混合来自野生型和C4BPB破坏的K562细胞的基因组DNA样品,并进行PCR扩增。c用RFLP和T7E1测定法对HeLa细胞中HLA-B基因中RGEN诱导的突变进行的基因分型。图26显示通过RGEN介导的RFLP对生物体中由工程化的核酸酶诱导的突变进行的基因分型。aPibf1突变体建立者小鼠的基因型。b比较错配敏感性T7E1测定法与RGEN介导的RFLP分析。黑色箭头指示T7E1酶或RGEN处理的切割产物。图27显示对ZFN诱导的突变进行RGEN介导的基因分型。ZFN靶位点示于框中。黑色箭头指示由T7E1切割的DNA条带。图28显示在人HLA-B基因区域中的多态性位点。包围RGEN靶位点的序列,是来自HeLa细胞的PCR扩增子的序列。多态性位置显示在框中。RGEN靶位点和PAM序列分别示于虚线框和粗体框中。引物序列加下划线。图29显示通过RGEN-RFLP分析致癌突变的基因分型。a通过RGEN检测HCT116细胞中人CTNNB1基因中的频发突变TCT的c.133-135缺失。HeLa细胞用作阴性对照。b用包含错配向导RNA的RGEN在A549癌细胞系中基因分型KRAS取代突变c.34GA。错配的核苷酸示于框中。HeLa细胞用作阴性对照。箭头表示RGEN切割的DNA条带。示出通过Sanger测序证实的DNA序列。图30显示通过RGEN-RFLP分析在HEK293T细胞中基因分型CCR5delta32等位基因。a细胞系的RGEN-RFLP测定。K562,SKBR3和HeLa细胞被用作野生型对照。箭头指示RGEN切割的DNA条带。b野生型和delta32CCR5等位基因的DNA序列。在RFLP分析中使用的RGEN的标靶和脱靶位点加下划线。两个位点之间的单核苷酸错配显示在框中。PAM序列加下划线。c使用野生型特异的RGEN在体外切割携带WT或del32CCR5等位基因的质粒。d确认在CCR5基因座上存在CCR5-delta32特异的RGEN的脱靶位点。使用各种量的del32特异的RGEN对带有标靶序列或脱靶序列的质粒进行体外切割测定。图31显示KRAS点突变c.34GA的基因分型。a癌细胞系中KRAS突变c.34GA的RGEN-RFLP分析。用具有特异于野生型序列或突变序列的完美匹配的crRNA的RGEN,消化来自HeLa细胞用作野生型对照或A549细胞点突变纯合的PCR产物。在这些细胞中KRAS基因型通过Sanger测序证实。b使用带有完美匹配的crRNA或减弱的单碱基错配的crRNA的RGEN消化质粒其携带野生型或突变的KRAS序列。被选择用于基因分型的减弱的crRNA在凝胶上方的框中标出。图32显示PIK3CA点突变c.3140AG基因分型。a癌细胞系中PIK3CA突变c.3140AG的RGEN-RFLP分析。用具有特异于野生型序列或突变序列的完美匹配的crRNA的RGEN,消化来自HeLa细胞用作野生型对照或HCT116细胞杂合点突变的PCR产物。在这些细胞中PIK3CA基因型通过Sanger测序证实。b使用带有完美匹配的crRNA或减弱的单碱基错配的crRNA的RGEN,消化携带野生型或突变PIK3CA序列的质粒。被选择用于基因分型的减弱的crRNA在凝胶上方的框中标出。图33显示在癌细胞系中频发点突变的基因分型。RGEN-RFLP测定在aIDHc.394cT,bPIK3CAc.3140AG,cNRASc.181CA,和dBRAF基因c.1799TA中的频发致癌点突变。显示用Sanger测序证实的每个细胞系的基因型。错配核苷酸示于框中。黑色箭头指示由RGEN切割的DNA条带。优选实施方式根据本发明的一个方面,本发明提供了用于在真核细胞或生物体中切割靶DNA的组合物,其包括特异于靶DNA的向导RNA或编码该向导RNA的DNA、和Cas蛋白质编码核酸或Cas蛋白质。另外,本发明提供该组合物用于在真核细胞或生物体中切割靶DNA的用途,所述组合物包括特异于靶DNA的向导RNA或编码该向导RNA的DNA、和Cas蛋白质编码核酸或Cas蛋白质。在本发明中,该组合物也被称为RNA向导核酸内切酶RGEN组合物。ZFN和TALEN能够在哺乳动物细胞,模式生物,植物和家畜中实现靶向诱变,但用各核酸酶得到的突变频率彼此大不相同。此外,一些ZFN和TALEN不显示任何基因组编辑活性。DNA甲基化可能会限制这些工程化的核酸酶与靶位点结合。此外,产生定制核酸酶在技术上是富于挑战且费时的。本发明人已开发了基于Cas蛋白质的新的RNA向导核酸内切酶组合物,以克服ZFN和TALEN的缺点。在本发明之前,Cas蛋白质的核酸内切酶活性是已知的。然而,由于真核基因组的复杂性,并不知道Cas蛋白质的核酸内切酶活性是否会在真核细胞中起作用。此外,到现在为止,还没有开发在真核细胞或生物体中切割靶DNA的包含Cas蛋白质或Cas蛋白编码核酸和特异于靶DNA的向导RNA的组合物。相比ZFN和TALEN,基于Cas蛋白质的本发明RGEN组合物可以更容易地定制,这是因为:为产生新的基因组编辑核酸酶,可以仅替换合成的向导RNA成分。不涉及亚克隆步骤来产生定制RNA向导核酸内切酶。此外,与一对TALEN基因~6kbp相比,Cas基因相对小的尺寸例如,Cas9为4.2kbp在一些应用如病毒介导的基因递送中为该RNA向导核酸内切酶组合物提供了优点。另外,该RNA向导核酸内切酶没有脱靶效应,因此不引起不需要的突变、缺失、倒位和重复。这些特性使本发明的RNA向导核酸内切酶组合物成为在真核细胞和生物体中进行基因组工程化的一种可扩展的通用方便工具。另外,RGEN可以设计成靶向任何DNA序列,几乎任何单核苷酸多态性或小的插入缺失indel均可以通过RGEN介导的RFLP进行分析。RGEN的特异性由RNA成分和Cas9蛋白质决定,其中所述RNA成分与长度不超过20个碱基对bp的靶DNA序列杂交,所述Cas9蛋白质识别原间隔区邻近基序protospacer-adjacentmotifPAM。通过替换RNA成分可以容易地重新编程RGEN。因此,RGEN提供了一个将简单稳靠的RFLP分析用于各种序列变异的平台。靶DNA可以是内源性DNA或人工DNA,优选内源性DNA。如本文所用,术语“Cas蛋白”指CRISPRCAS系统中的必要蛋白质成分,当与称为CRISPRRNAcrRNA和反式激活crRNAtracrRNA的2个RNA复合时Cas蛋白形成活性核酸内切酶或切口酶。Cas基因和蛋白质的信息可从美国国家生物技术信息中心NCBI的GenBank中获得,没有限制。编码Cas蛋白质的CRISPR相关cas基因通常与CRISPR重复序列-间隔区阵列相关。已经描述了多于四十个不同的Cas蛋白质家族。在这些蛋白质家族中,Cas1似乎遍布各种不同的CRISPRCAS系统中。有三种类型CRISPR-Cas系统。其中,涉及Cas9蛋白质和crRNA和tracrRNA的II型CRISPRCas系统是代表性的,是众所周知的。cas基因和重复结构的特定组合被用来定义8种CRISPR亚型Ecoli,Ypest,Nmeni,Dvulg,Tneap,Hmari,Apern和Mtube。Cas蛋白质可以连接到蛋白质转导结构域。蛋白质转导结构域可以是聚精氨酸或源自HIV的TAT蛋白,但不限于此。本发明组合物可包含蛋白质形式或编码Cas蛋白质的核酸形式的Cas成分。在本发明中,Cas蛋白质可以是任何Cas蛋白质,只要当其与向导RNA复合时具有核酸内切酶或切口酶活性即可。优选地,Cas蛋白质是Cas9蛋白质或其变体。Cas9蛋白质的变体可以是Cas9的突变体形式,其中催化性天冬氨酸残基改变为任何其它氨基酸。优选地,所述其它氨基酸可以是丙氨酸,但不限于此。此外,Cas蛋白质可以是从生物体如链球菌属物种Streptococcussp.,优选化脓性链球菌Streptococcuspyogens中分离的蛋白质、或重组蛋白质,但并不限于此。源自化脓性链球菌的Cas蛋白质可识别NGG三核苷酸。Cas蛋白质可包括SEQIDNO:109的氨基酸序列,但不限于此。术语“重组”,当用于例如细胞、核酸、蛋白质或载体时,表示该细胞、核酸、蛋白质或载体已通过引入异源核酸或蛋白质、或改变天然核酸或蛋白质而被修饰,或该细胞源自此修饰的细胞。因此,例如,可以通过使用人密码子表重构Cas蛋白质编码序列而产生重组Cas蛋白质。就本发明而言,Cas蛋白质编码核酸可以是载体形式,如包含在启动子如CMV或CAG下的Cas编码序列的质粒。当Cas蛋白质是Cas9时,Cas9编码序列可源自链球菌属,优选源自化脓性链球菌。例如,Cas9编码核酸可以包含SEQIDNO:1的核苷酸序列。此外,Cas9编码核酸可包含与SEQIDNO:1的序列具有至少50%同源性的核苷酸序列,优选与SEQIDNO:1具有至少60,70,80,90,95,97,98,或99%的同源性,但不限于此。Cas9编码核酸可以包含SEQIDNOs.108、110,106或107的核苷酸序列。如本文所用,术语“向导RNA”指的是特异于靶DNA的RNA,其可以与Cas蛋白质形成复合体并把Cas蛋白质带至靶DNA。在本发明中,向导RNA可以由两个RNA,即CRISPRRNAcrRNA和反式激活crRNAtracrRNA组成,或者向导RNA可以是通过融合crRNA和tracrRNA的必要部分而产生的单链RNAsgRNA。向导RNA可以是包含crRNA和tracrRNA的双重RNAdualRNA。如果向导RNA包含crRNA和tracrRNA的必要部分和互补于靶的部分,则任何向导RNA都可以在本发明中使用。所述crRNA可与靶DNA杂交。RGEN可由Cas蛋白质和dualRNA不变的tracrRNA和靶特异性crRNA组成,或由Cas蛋白质和sgRNA不变的tracrRNA和靶特异性crRNA的必要部分的融合物组成,并且可以通过替换crRNA而容易地重新编程。向导RNA可以在单链向导RNA或dualRNA的crRNA的5'末端还包含一个或多个附加的核苷酸。优选,向导RNA可以在单链向导RNA或dualRNA的crRNA的5'末端还包含2个附加的鸟嘌呤核苷酸。向导RNA可以以编码该向导RNA的RNA或DNA的形式转移到细胞或生物体中。向导RNA可以是分离的RNA、并入病毒载体的RNA的形式、或者在载体中编码。优选地,载体可以是病毒载体、质粒载体、或农杆菌载体,但不限于此。编码向导RNA的DNA可以是包含编码向导RNA序列的载体。例如,可以通过用分离的向导RNA或包含编码向导RNA的序列和启动子的质粒DNA转染细胞或生物体,将向导RNA转染到细胞或生物体。可替代地,可以使用病毒介导的基因递送,将向导RNA转移到细胞或生物体。当向导RNA以分离RNA的形式转染细胞或生物体时,可使用本领域中已知的任何体外转录系统通过体外转录来制备向导RNA。向导RNA优选以分离RNA的形式,而不是以包含向导RNA的编码序列的质粒的形式,转移到细胞。如本文所用,术语“分离RNA”可与“裸露的RNA”互换使用。因为不需要克隆步骤,这能节省成本和时间。然而,不排除使用质粒DNA或病毒介导的基因传递来转染向导RNA。由于向导RNA对靶的特异性和Cas蛋白质的核酸内切酶或切口酶活性,本发明的包含Cas蛋白质或Cas蛋白质编码核酸和向导RNA的RGEN组合物可特异地切割靶DNA。如本文所用,术语“切割”是指核苷酸分子共价骨架的断裂。在本发明中,向导RNA可以制备为特异于任何待切割的靶。因此,本发明的RGEN组合物可以通过操作或基因分型向导RNA的靶特异性部分,切割任何靶DNA。向导RNA和Cas蛋白质可以以对子pair发挥作用。如本文所用,术语“配对Cas切口酶”可以指以对子发挥作用的向导RNA和Cas蛋白质。该对子pair包括两个向导RNA。向导RNA和Cas蛋白质可以以对子发挥作用,在不同DNA链上诱导两个缺口。这两个缺口可以分开至少100个bps,但不限于此。在实施例中,本发明人证实,配对Cas切口酶允许在人类细胞中实现靶向诱变和高达1-kbp的染色体片段的大缺失。重要的是,配对切口酶不在脱靶位点诱导indel,而其相应的核酸酶在脱靶位点处诱导突变。此外,不同于核酸酶,配对切口酶不促进与脱靶DNA切割相关的不需要的易位。原则上,配对切口酶使Cas9介导的诱变的特异性加倍,可以扩大RNA向导酶在需要精确基因组编辑的应用如基因和细胞治疗中的用途。在本发明中,组合物可用于体外对真核细胞或生物体的基因组作基因分型。在一个具体的实施方案中,向导RNA可以包含SEQID.No.1的核苷酸序列,其中的核苷酸位置3~22的部分为靶特异性部分,因此,该部分的序列可以根据靶而改变。如本文所使用的,没有限制地,真核细胞或生物体可以是酵母、真菌、原生动物、植物、高等植物、和昆虫、或两栖动物细胞、或哺乳动物细胞例如CHO、HeLa、HEK293和COS-1,例如,培养的细胞体外、移植细胞和原代细胞培养物体外和离体、和体内细胞,以及本领域中通常使用的哺乳动物细胞,包括人类细胞。在一个具体的实施方案中,发现Cas9蛋白质单链向导RNA可以在体外和在哺乳动物细胞中产生位点特异性DNA双链断裂,其自发修复以高频率诱导靶向基因组突变。此外,发现,可通过向一细胞阶段的胚胎注射Cas9蛋白质向导RNA复合体或Cas9mRNA向导RNA诱导基因敲除小鼠,并可以通过Cas9向导RNA系统生成种系可传递的突变。使用Cas蛋白质而不是编码Cas蛋白质的核酸诱导靶向诱变是有利的,这是因为不向生物体中引入外源DNA。因此,包括Cas蛋白质和向导RNA的组合物可以用于开发治疗剂或增值农作物、家畜、家禽、鱼、宠物等。根据本发明的另一个方面,本发明提供用于在真核细胞或生物体中诱导定向诱变的组合物,其包括特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。另外,本发明提供组合物用于在真核细胞或生物体中诱导靶向诱变的用途,所述组合物包含特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。向导RNA、Cas蛋白质编码核酸或Cas蛋白质在以上描述。根据本发明的另一个方面,本发明提供用于在真核细胞或生物体中切割靶DNA或诱导靶向诱变的试剂盒,其包括特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白编码核酸或Cas蛋白质。向导RNA,Cas蛋白质编码核酸或Cas蛋白质在以上描述。所述试剂盒可包括作为分开成分或作为一种组合物的向导RNA和Cas蛋白质编码核酸或Cas蛋白质。本发明的试剂盒可以包含将向导RNA和Cas成分转移至细胞或生物体所必需的一些其它成分。例如,试剂盒可包括注射缓冲液如DEPC处理的注射缓冲液、以及分析靶DNA突变所必需的物质,但不限于此。根据另一个方面,本发明提供制备包含Cas蛋白质和向导RNA的真核细胞或生物体的方法,所述方法包括用Cas蛋白质编码核酸或Cas蛋白质和向导RNA或编码所述向导RNA的DNA共转染或顺序转染真核细胞或生物体的步骤。向导RNA,Cas蛋白质编码核酸或Cas蛋白质在以上描述。在本发明中,Cas蛋白质编码核酸或Cas蛋白质和向导RNA或编码该向导RNA的DNA,可以通过本领域中已知的各种方法转移到细胞中,如微注射、电穿孔、DEAE-葡聚糖处理、脂转染、纳米颗粒介导的转染、蛋白质转导结构域介导的转导、病毒介导的基因递送、和PEG介导的原生质体转染,等等,但不限于此。另外,Cas蛋白质编码核酸或Cas蛋白质和向导RNA可通过本领域中已知的各种施用基因或蛋白质的方法如注射而转移到生物体。Cas蛋白质编码核酸或Cas蛋白质可以以与向导RNA复合体的形式,或单独地,被转移到细胞中。融合至蛋白质转导结构域如Tat的Cas蛋白质也可以被有效地递送到细胞中。优选地,真核细胞或生物体被Cas9蛋白质和向导RNA共转染或顺序转染。顺序转染可通过如下进行:用Cas蛋白质编码核酸进行第一转染,接着用裸向导RNA进行第二转染。优选地,第二转染在3,6,12,18,24小时之后,但并不限于此。根据另一个方面,本发明提供真核细胞或生物体,其包含特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。可以通过将组合物转移至细胞或生物体中制备真核细胞或生物体,所述组合物包含特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。真核细胞可以是酵母、真菌、原生动物、高等植物、昆虫、或两栖动物细胞或哺乳动物细胞,例如CHO、HeLa、HEK293和COS-1,例如,培养的细胞体外、移植细胞和原代细胞培养物在体外和离体、和体内细胞,也可以是在本领域中通常使用的哺乳动物细胞,包括人类细胞,等等,没有限制。进一步地生物体可以是酵母、真菌、原生动物、植物、高等植物、昆虫、两栖动物、或哺乳动物。根据本发明的另一个方面,本发明提供一种用于在真核细胞或生物体中切割靶DNA或诱导靶向诱变的方法,所述方法包括用组合物处理含有靶DNA的细胞或生物体的步骤,所述组合物包含特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。用组合物处理细胞或生物体的步骤可通过将本发明的组合物转移到细胞或生物体中进行,所述组合物包含特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白。如上述,这种转移可以通过微注射、转染、电穿孔等等来进行。根据本发明的另一个方面,本发明提供包含通过本发明RGEN组合物编辑的基因组的胚胎,所述RGEN组合物包含特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质。任何胚胎均可以在本发明中使用,对于本发明,胚胎可以是小鼠胚胎。胚胎可通过如下产生:向4~7周雌性小鼠注射PMSG孕母马血清促性腺激素和hCG人绒毛膜促性腺激素,可以将超排卵雌性小鼠与雄性小鼠交配,并可从输卵管收集受精的胚胎。引入胚胎的本发明RGEN组合物可通过Cas蛋白质作用来切割与向导RNA互补的靶DNA,引起靶DNA中的突变。因此,引入了本发明RGEN组合物的胚胎具有编辑的基因组。在一个具体实施方案中,已发现,本发明RGEN组合物可导致小鼠胚胎突变,所述突变可以被传递给后代。将RGEN组合物引入胚胎的方法可以是本领域已知的任何方法,如微注射、干细胞插入、逆转录病毒插入等等。优选,可使用微注射技术。根据另一个方面,本发明提供通过将胚胎转移至动物输卵管而获得的基因组修饰动物,其中所述胚胎包含由本发明RGEN组合物编辑的基因组。在本发明中,术语“基因组修饰动物”是指其基因组在胚胎阶段已被本发明RGEN组合物修饰的动物,动物的种类没有限制。基因组修饰的动物具有通过基于本发明RGEN组合物的靶向诱变引起的突变。所述突变可以是缺失、插入、易位、倒位中的任一种。突变的位点取决于RGEN组合物的向导RNA序列。具有基因突变的基因组修饰动物可用于确定该基因的功能。根据本发明的另一个方面,本发明提供了制备基因组修饰动物的方法,所述方法包括将本发明RGEN组合物其包含特异于靶DNA的向导RNA或编码该向导RNA的DNA和Cas蛋白质编码核酸或Cas蛋白质引入动物胚胎的步骤;和将胚胎转移到假孕代母输卵管的步骤,以产生基因组修饰动物。引入本发明RGEN组合物的步骤可通过本领域中已知的任何方法来完成,例如微注射、干细胞插入、逆转录病毒插入等等。根据本发明的另一个方面,本发明提供从基因组修饰的原生质体再生的植物,所述原生质体通过用于产生含有RGEN组合物的真核细胞的方法制备。根据本发明的另一个方面,本发明提供用于在分离的生物样品中基因分型突变或变异的组合物,所述组合物含有特异于靶DNA序列的向导RNA和Cas蛋白。另外,本发明提供用于在分离的生物样品中基因分型病原微生物的核酸序列的组合物,所述组合物包含特异于靶DNA序列的向导RNA和Cas蛋白质。向导RNA、Cas蛋白质编码核酸或Cas蛋白质在以上描述。本文所用术语“基因分型”指的是“限制性片段长度多态性RFLP分析”。RFLP可用于1检测由工程化的核酸酶诱导的细胞或生物体中的indel,2对细胞或生物体中天然存在的突变或变异进行基因分型,或3对感染的病原微生物包括病毒或细菌等的DNA进行基因分型。可通过工程化的核酸酶在细胞中诱导突变或变异。工程化的核酸酶可以是锌指核酸酶ZFN、转录激活因子样效应物核酸酶TALEN、或RGEN,但不限于此。如本文所用术语“生物样品”包括进行分析的样品,如组织、细胞、全血、SEMM、血浆、唾液、痰、脑脊液或尿液,但并不限于此。突变或变异可以是天然存在的突变或变异。突变或变异由病原微生物引起。即,突变或变异由于病原微生物的感染而发生,当检测病原微生物时,该生物样品被鉴定为受感染。病原微生物可以是病毒或细菌,但不限于此。工程化核酸酶诱导的突变可通过各种方法检测,其中包括错配敏感的Surveyor或T7内切核酸酶IT7E1测定法、RFLP分析、荧光PCR、DNA熔解分析和Sanger和深度测序deepsequencing。T7E1和Surveyor测定法广泛使用,但往往低估突变频率,因为这些测定法可以检测异源双链由突变体和野生型序列杂交形成或由两个不同突变体序列杂交形成;但它们无法检测由两个相同突变体序列杂交形成的同源双链。因此,这些测定法不能从野生型细胞中区分纯合双等位基因突变体克隆,也不能从杂合单等位基因突变体中区分杂合双等位基因突变体图22。此外,核酸酶靶位点附近的序列多态性可以造成混淆的结果,因为所述酶可切割由这些不同野生型等位基因杂交形成的异源双链。RFLP分析没有这些限制,并因此是首选的方法。实际上,RFLP分析是最早用于检测工程化核酸酶介导的突变的方法之一。然而不幸的是,其受到适当限制性位点可得性的限制。根据本发明的另一个方面,本发明提供用于在分离的生物样品中基因分型突变或变异的试剂盒,所述试剂盒包括用于在分离的生物样品中基因分型突变或变异的组合物。另外,本发明提供用于在分离的生物样品中基因分型病原微生物中的核酸序列的试剂盒,所述试剂盒包括特异于靶DNA序列的向导RNA和Cas蛋白质。向导RNA,Cas蛋白质编码核酸或Cas蛋白质在以上描述。根据本发明的另一个方面,本发明提供了在分离的生物样品中基因分型突变或变异的方法,该方法使用组合物用于在分离的生物样品中基因分型突变或变异。另外,本发明提供在分离的生物样品中基因分型病原微生物中的核酸序列的方法,其包括特异于靶DNA序列的向导RNA和Cas蛋白质。向导RNA,Cas蛋白质编码核酸或Cas蛋白质在以上描述。发明具体实施方式以下,参照实施例对本发明进行更详细地描述。然而,这些实施例仅用于举例说明的目的,且本发明不意图受这些实施例的限制。实施例1:基因组编辑测定1-1.Cas9蛋白质的DNA切割活性首先,测试了在体外在存在或不存在嵌合的向导RNA时源自化脓性链球菌的Cas9的DNA切割活性。为此,使用在大肠杆菌中表达并纯化的重组Cas9蛋白质切割预先消化的或环状质粒DNA,所述质粒DNA包含23个碱基对bp的人CCR5靶序列。Cas9靶序列由互补于crRNA或嵌合向导RNA的20-bpDNA序列和Cas9本身识别的三核苷酸5'-NGG-3'原间隔区邻近基序PAM组成图1A。具体地,源自化脓性链球菌菌株M1GASNC_002737.1的Cas9编码序列4104bp使用人类密码子使用表重构,并使用寡核苷酸合成。首先,使用重叠的~35mer寡核苷酸和Phusion聚合酶NewEnglandBiolabs组装1-kbDNA片段,并克隆到T-载体SolGent。通过重叠PCR,使用四个1-kbp的DNA片段,组装全长Cas9序列。所述Cas9编码DNA片段亚克隆到p3s,所述p3s来自pcDNA3.1Invitrogen。在此载体中,包含HA表位和核定位信号NLS的肽标签NH2-GGSGPPKKKRKVYPYDVPDYA-COOH,SEQIDNO:2加至Cas9的C末端。通过蛋白印迹,使用抗HA抗体SantaCruz,确认HEK293T细胞中Cas9蛋白质的表达和核定位。序列表SEQIDNO:106然后,将Cas9盒亚克隆到pET28-b+,并转化到BL21DE3。使用0.5mMIPTG在25℃下诱导Cas9表达4小时。使用Ni-NTA琼脂糖树脂Qiagen纯化在C末端含有His6标签的Cas9蛋白质,并在20mMHEPESpH值7.5,150mMKCl,1mMDTT和10%甘油中透析1。纯化的Cas950nM与超螺旋或预先消化的质粒DNA300ng及嵌合RNA50nM在20微升反应体积中在NEB缓冲液3中在37℃下孵育1小时。用0.8%琼脂糖凝胶电泳,分析消化的DNA。只有在合成的RNA存在时Cas9才在预期位置有效地切割质粒DNA,但不切割缺乏靶序列的对照质粒图1B。1-2.Cas9向导RNA复合体在人类细胞中切割DNARFP-GFP报告分子用来研究Cas9向导RNA复合体是否能在哺乳动物细胞中切割在RFP和GFP序列之间引入的靶序列。在该报告分子中,将GFP序列与RFP序列在读框外融合2。只有当靶序列被位点特异性核酸酶切割,通过双链断裂DSB的易错非同源末端连接NHEJ修复在靶序列周围造成移码小插入或缺失indel,活性GFP才表达图2。在本研究中使用的RFP-GFP报告分子质粒如前所述构建2。合成对应于靶位点的寡核苷酸表1Macrogen并退火。将退火的寡核苷酸连接至用EcoRI和BamHI消化的报告分子载体。用Cas9编码质粒0.8μg和RFP-GFP报告分子质粒0.2μg在24孔板中使用Lipofectamine2000Invitrogen共转染HEK293T细胞。同时,如下制备体外转录的嵌合RNA。根据制造商的手册,使用MEGAshortscriptT7试剂盒Ambion,使用Runoff反应,体外转录RNA。通过退火两个互补的单链DNA或通过PCR扩增,生成用于RNA体外转录的模板表1。转录的RNA在8%变性尿素PAGE凝胶中分离。切出含RNA的凝胶切片并转移至探针洗脱缓冲液。回收RNA于无核酸酶的水中,然后用苯酚:氯仿提取,氯仿提取和乙醇沉淀。由光谱法定量纯化的RNA。在转染后第12小时,将体外转录制备的嵌合RNA1μg用Lipofectamine2000转染。在转染后第3天,对转染的细胞进行流式细胞分析,对同时表达RFP和GFP的细胞进行计数。结果发现,只有当首先用Cas9质粒转染、然后12小时后用向导RNA转染细胞,才获得了表达GFP的细胞图2,表明RGEN可以在培养的人细胞中识别并切割靶DNA序列。由此,表达GFP的细胞通过Cas9质粒和向导RNA的顺序转染获得而不是通过共转染获得。表11-3.通过RGEN靶向破坏哺乳动物细胞中的内源基因为了测试RGEN是否可用于靶向破坏哺乳动物细胞中的内源基因,使用T7内切核酸酶IT7E1一种错配敏感的内切核酸酶,其特异性识别并切割由野生型和突变体DNA序列杂交形成的异源双链分析了分离自转染细胞的基因组DNA3。为了使用RGEN在哺乳动物细胞中引入DSB,根据生产商的方案,使用4D-Nucleofector,SF细胞系4D-NucleofectorX试剂盒,ProgramFF-120Lonza,用20μgCas9编码质粒转染2×106K562细胞。对于本实验,K562ATCC,CCL-243细胞在含有10%FBS和青霉素链霉素混合物分别为100Uml和100μgml的RPMI-1640上培养。24小时后,将10-40μg体外转录的嵌合RNA核感染至1×106K562细胞。如在实施例1-2中描述的制备体外转录的嵌合RNA。RNA转染后两天收集细胞,分离基因组DNA。包括靶位点的区域使用表1所述的引物进行PCR扩增。如前所述3,对扩增子进行T7E1测定。为了测序分析,纯化对应于基因组修饰的PCR产物并使用T-平端PCR克隆试剂盒SolGent克隆至T-平端载体。克隆产物用M13引物测序。结果发现,只有用Cas9编码质粒、然后用向导RNA顺序转染细胞时,才诱导了突变图3。从相对DNA条带强度估计的突变频率图3A中indel%是RNA剂量依赖的,范围从1.3%到5.1%。PCR扩增子的DNA测序分析证实了在内源性位点处诱导了RGEN介导的突变。在靶位点观察到易错NHEJ特征性的indel和微同源性。通过直接测序检测的突变频率为7.3%=7突变克隆96个克隆,与使用锌指核酸酶ZFN或转录激活因子样效应物核酸酶TALENS所获得的突变频率相媲美。需要顺序转染Cas9质粒和向导RNA以诱导细胞中的突变。但是,当质粒编码向导RNA时,顺序转染则不是必要的,细胞可用Cas9质粒和向导RNA编码质粒共转染。已成功地开发了ZFN和TALEN来破坏人CCR5基因3-6,该基因编码G蛋白偶联趋化因子受体——HIV感染的一个主要的共受体。目前CCR5特异性ZFN在美国正处于艾滋病治疗的临床研究阶段7。然而,这些ZFN和TALEN具有脱靶效应,在序列与标靶序列同源的位点上诱导局部突变6,8-10并诱导基因组重排其起因于对标靶和脱靶位点上诱导的两个并行DSB的修复11-12。与这些CCR5特异性工程化核酸酶相关的最显着的脱靶位点位于CCR2基因座中,CCR2是CCR5的密切同源物,位于CCR5上游15kbp。为避免CCR2基因上的脱靶突变和不需要的CCR5标靶和CCR2脱靶位点之间15-kbp染色体片段的缺失、倒位,和复制,本发明人有意选择我们的CCR5特异性RGEN的靶位点来识别CCR5序列中的区域,该区域与CCR2序列没有明显的同源性。本发明人研究了CCR5特异性RGEN是否有脱靶效应。为此,通过鉴定与预定23-bp靶序列最同源的位点,搜索了人类基因组中潜在的脱靶位点。正如预期的那样,在CCR2基因中没有发现这样的位点。但发现了四个位点,其中每一个均携带与标靶位点的3个碱基错配图4A。T7E1分析表明,在这些位点中没有检测到突变检测灵敏度,~0.5%,这表明RGEN极高的特异性图4B。此外,用PCR检测了细胞中染色体缺失的诱导,所述细胞分开转染了编码ZFN的质粒和CCR5特异性RGEN。ZFN诱导缺失,而RGEN不诱导缺失图4C。接着,通过用设计以靶向人C4BPB基因的新合成RNA代替CCR5特异性向导RNA来重新编程RGEN,所述人C4BPB基因编码C4b结合蛋白一种转录因子的β链。该RGEN在K562细胞中以高频率诱导了染色体靶位点上的突变图3B。由T7E1测定法和直接测序测得的突变频率分别为14%和8.3%=4突变克隆48克隆。在四个突变序列中,两个克隆精确地在切割位点含有单碱基或两碱基插入,该模式也在CCR5靶位点上观察到。这些结果表明,RGEN在细胞中于预期位置切割染色体靶DNA。实施例2:蛋白质性RGEN介导的基因组编辑RGEN可以以多种不同形式递送到细胞。RGEN由Cas9蛋白、crRNA和tracrRNA组成。两个RNA可以融合形成单链向导RNAsgRNA。在启动子如CMV或CAG下编码Cas9的质粒可以被转染到细胞中。crRNA,tracrRNA,或sgRNA也可以使用编码这些RNA的质粒在细胞中表达。但是,使用质粒经常导致质粒全部或部分整合在宿主基因组中。掺入质粒DNA中的细菌序列可能在体内引起不希望的免疫应答。用于细胞治疗的质粒转染的细胞或源自DNA转染细胞的动物和植物在大多数发达国家在市场批准之前必须经过一个昂贵且冗长的管理程序。此外,质粒DNA能在转染后数天存在于细胞中,从而加重RGEN的脱靶效应。这里,我们使用与体外转录的向导RNA复合的重组Cas9蛋白质,以诱导人细胞内源基因的靶向破坏。融合六个组氨酸标签的重组Cas9蛋白质在大肠杆菌中表达,并使用标准镍离子亲和层析和凝胶过滤从大肠杆菌纯化。纯化的重组Cas9蛋白在存储缓冲液20mMHEPESpH7.5,150mMKCl,1mMDTT和10%甘油中浓缩。Cas9蛋白质sgRNA复合体通过核转染直接导入K562细胞:使用4D-Nucleofector,SF细胞系4D-NucleofectorX试剂盒,ProgramFF-120Lonza,根据制造商的方案,使用100μl溶液中与100ug29μM体外转录的sgRNA或40ugcrRNA和80ugtracrRNA混合的22.5-2251.4-14μMCas9蛋白质,转染1×106个K562细胞。核转染nucleofection后,将细胞置于6孔板的生长培养基中温育48小时。当使用15按比例下调的方案转染2×105个K562细胞时,使用4.5-45μgCas9蛋白质和6-60ug体外转录的sgRNA或8μgcrRNA和16μgtracrRNA的混合物,在20μl溶液中进行核转染。然后将核转染的细胞置于48孔板的生长培养基中。48小时后,收集细胞并分离基因组DNA。PCR扩增跨靶位点的基因组DNA区域,并进行T7E1测定。如图10所示,Cas9蛋白质sgRNA复合体在CCR5基因座上诱导了靶向突变,诱变频率以sgRNA或Cas9蛋白质剂量依赖性方式从4.8至38%,该频率与Cas9质粒转染所获得的频率相当45%。Cas9蛋白质crRNAtracrRNA复合体能够以9.4%频率诱导突变。Cas9蛋白质单独不能诱导突变。当使用15按比例下调的Cas9蛋白质和sgRNA剂量转染2×105个细胞时,CCR5基因座上的突变频率以剂量依赖性方式为2.7至57%,大于共转染Cas9质粒和sgRNA质粒获得的频率32%。我们还测试了靶向ABCC11基因的Cas9蛋白质sgRNA复合体,发现该复合体以35%的频率诱导Indel,这表明该方法的普遍适用性。[表2]向导RNA序列实施例3:小鼠中RNA指导的基因组编辑为了检验在原核PN阶段小鼠胚胎中RGEN的基因靶向潜力,使用了叉头框N1Foxn1基因其对胸腺发育和角质细胞分化是重要的Nehls等,1996和蛋白激酶的DNA激活的催化多肽Prkdc基因其编码对DNADSB修复和重组重要的酶Taccioli等,1998。为了评估Foxn1-RGEN的基因组编辑活性,我们将Cas9mRNA10ngμl溶液与各种剂量的sgRNA注射到PN-阶段小鼠胚胎的细胞质中图5a,并使用从体外培养的胚胎获得的基因组DNA进行了T7内切核酸酶T7E1测定Kim等人,2009年图6a。可替代地,我们直接将RGEN以重组Cas9蛋白质0.3至30ngμl与2倍摩尔过量的Foxn1特异性sgRNA0.14至14ngμl的复合物形式注射到一细胞小鼠胚胎的细胞质或原核中,并使用体外培养的胚胎分析了Foxn1基因中的突变图7。具体地说,分别使用mMESSAGEmMACHINET7Ultra试剂盒Ambion和MEGAshortscriptT7试剂盒Ambion,根据制造商的说明,从线性DNA模板体外合成了Cas9mRNA和sgRNA,并用合适量的焦碳酸二乙酯DEPC,Sigma处理的注射缓冲液0.25mMEDTA,10mMTris,pH7.4进行稀释。使用表3所列的寡核苷酸产生用于sgRNA合成的模板。重组Cas9蛋白质从ToolGen,Inc.获得。[表3]表3所有动物实验均按照韩国食品和药物管理局KFDA的指导方针进行。实验方案被延世大学实验动物研究中心的动物护理和使用委员会IACUC审查并批准许可证编号:2013-0099。所有小鼠维持在延世实验动物研究中心的无特定病原体的设施中。FVBNTacTaconic和ICR小鼠品系分别被用作胚胎供体和代母。雌性FVBNTac小鼠7-8周龄通过以48小时间隔腹膜内注射5IU孕马血清促性腺激素PMSG,Sigma和5IU人绒毛膜促性腺激素hCG,Sigma而超排卵。超排卵雌性小鼠与FVBNtac雄性小鼠种畜交配,从输卵管收集受精胚胎。利用压电驱动的微操作机PrimeTech将M2培养基Sigma中的Cas9mRNA和sgRNA注射到具有清楚辨认的原核的受精卵的细胞质中。在注射重组Cas9蛋白质的情况下,所述重组Cas9蛋白质:Foxn1-sgRNA复合体用DEPC处理的注射缓冲液0.25mMEDTA,10mMTris,pH7.4稀释,并用TransferManNK2微操作机和FemtoJet微注射器Eppendorf注射到雄性原核中。将操作的胚胎移入假孕代母的输卵管中以产生活的动物,或在体外培养用于进一步分析。为了筛选具有RGEN诱发的突变的F0小鼠和体外培养的小鼠胚胎,如前所述Cho等,2013,使用来自尾活检物的基因组DNA样品和全胚胎裂解物进行T7E1测定法。简言之,PCR扩增包含RGEN靶位点的基因组区域、解链、并再退火以形成异源双链DNA,用T7内切核酸酶1NewEnglandBiolabs处理,然后通过琼脂糖凝胶电泳分析。通过bowtie0.12.9搜索鉴定了潜在的脱靶位点,这些位点也类似地通过T7E1测定法监测。在这些测定中使用的引物对列于表4和5。[表4]用于T7E1测定中的引物[表5]用于扩增脱靶位点的引物T7E1测定法鉴定的突变体建立者小鼠通过fPCR进一步分析。基因组DNA的合适区域如前所述Sung等,2013进行测序。对于F1后代的常规PCR基因分型,以下引物对用于野生型和突变体等位基因:5'-CTACTCCCTCCGCAGTCTGA-3'SEQIDNO:69和5'-CCAGGCCTAGGTTCCAGGTA-3'SEQIDNO:70用于Foxn1基因,5'-CCCCAGCATTGCAGATTTCC-3'SEQIDNO:71和5'-AGGGCTTCTTCTCTACAATCACG-3'SEQIDNO:72用于Prkdc基因。在注射Cas9mRNA的情况下,突变体分数突变体胚胎数总胚胎数是剂量依赖性的,范围从33%1ngμlsgRNA至91%100ngμl图6b。序列分析证实了Foxn1基因中的突变;大多数突变是小缺失图6c,让人联想起ZFN和TALENS诱导的那些Kim等,2013。在注射Cas9蛋白质的情况下,这些注射剂量和方法极小地影响体外小鼠胚胎的生存和发育:在两个实验中70%以上注射RGEN的胚胎正常孵化。再次,用Cas9蛋白质注射所得突变体的分数是剂量依赖性的,通过原核注射在最高剂量下达到多达88%,通过胞质内注射达到多达71%图7a和7b。与Cas9mRNA加sgRNA诱导的突变模式类似图6c,Cas9蛋白质-sgRNA复合体诱导的突变大多是小缺失图7c。这些结果清楚地表明,RGEN在小鼠胚胎中具有高的基因靶向活性。受到RGEN诱发的高突变频率和低毒性的鼓舞,我们将小鼠胚胎移至假孕代母的输卵管中产生了活的动物。值得注意的是,出生率非常高,从58%至73%,并且没有受到增加的Foxn1-sgRNA剂量的影响表6。[表6]在FVBNTac小鼠中RGEN介导的基因靶向在147只新生小鼠中,我们获得99只突变建立者小鼠。与在培养的胚胎中观察到的结果一致图6c,突变体分数与Foxn1-sgRNA剂量成比例,最多达93%100ngμlFoxn1-sgRNA表6和7,图5b。[表7]从T7E1阳性突变体建立者小鼠子集鉴定的Foxn1突变体等位基因的DNA序列为了产生Prkdc靶向小鼠,我们采用了浓度高5倍的Cas9mRNA50ngμl和递增剂量的Prkdc-sgRNA50、100和250ngμl。再次,出生率是非常高的,范围从51%至60%,足以产生足够数量的新生小鼠用于分析表6。在最大剂量的Prkdc-sgRNA时突变体分数为57%37只新生小鼠中21只突变体建立者小鼠。由RGEN获得的这些出生率比我们以前研究报道的由TALEN获得的出生率高约2至10倍Sung等,2013。这些结果表明,RGEN是有效的基因靶向试剂,具有极小的毒性。为了测试突变体等位基因的种系传递,我们使Foxn1突变体建立者小鼠#108具有四个不同等位基因的嵌合体图5c和表8与野生型小鼠杂交,并监测F1后代的基因型。[表8]Foxn1突变体小鼠的基因型下划线的等位基因进行了测序。红色的等位基因通过测序检测,但没有进行fPCR。*只测序了一个克隆。**没有通过fPCR检测。如预期的,所有的后代都是具有野生型等位基因和一个突变体等位基因的杂合突变体图5d。我们还证实了在独立的Foxn1图8和Prkdc图9建立者小鼠中的种系传递。根据我们所知,这些结果提供了RGEN诱导的突变体等位基因在动物中稳定地传递到F1后代的第一证据。实施例4:在植物中RNA引导的基因组编辑4-1.Cas9蛋白质的生产源自化脓性链球菌菌株M1GASNC_002737.1的Cas9编码序列4104bps克隆到pET28-b+质粒。在蛋白质N末端包括核靶向序列NLS,以确保将蛋白质定位至细胞核。含有Cas9ORF的pET28-b+质粒转化到BL21DE3中。然后在18℃用0.2mMIPTG诱导Cas9进行16小时,并使用Ni-NTA琼脂糖珠Qiagen按照制造商的说明纯化。使用Ultracel100KMillipore浓缩纯化的Cas9蛋白质。4-2.向导RNA的生产筛选编码BRI1的拟南芥基因的基因组序列,检查外显子中NGG基序的存在,所述基序,即所谓的原间隔区邻近基序PAM,是Cas9靶向所必需的。为了破坏拟南芥中的BRI1基因,我们在包含NGG基序的外显子中鉴定了2个RGEN靶位点。用模板DNA体外生成sgRNA。每个模板DNA通过两个部分重叠的寡核苷酸Macrogen,表X1和Phusion聚合酶ThermoScientific,通过延伸而产生,其中使用了以下条件:-98℃30sec{98℃10sec,54℃20sec,72℃2min}x20,72℃5min。[表9]制备用于体外转录的模板DNA的寡核苷酸纯化延伸的DNA,并用作模板,使用MEGAshortscriptT7试剂盒LifeTechnologies体外生产向导RNA。然后通过苯酚氯仿提取和乙醇沉淀,纯化向导RNA。为了制备Cas9sgRNA复合体,10ul纯化的Cas9蛋白质12μgμl和两个sgRNA11μgμl各4ul混合于20μlNEB3缓冲液NewEnglandBiolabs中,并在37℃下孵育10分钟。4-3.Cas9sgRNA复合体转染原生质体在培养皿中无菌生长的4周龄拟南芥幼苗的叶子,在酶溶液1%纤维素R10,0.5%离析酶R10,450mM甘露醇,20mMMESpH5.7和CPW盐中,25℃暗处以40rpm振荡,消化8~16小时。过滤酶原生质体溶液,并在100×g下离心3~5分钟。在显微镜X100下使用血细胞计数器计数细胞后,将原生质体再悬浮在CPW溶液中。最后,原生质体以1×106ml再悬浮于MMG溶液4mMHEPESpH5.7,400mM甘露醇和15mMMgCl2中。为了用Cas9sgRNA复合体转染原生质体,将200μL原生质体悬浮液200,000原生质体与3.3或10μLCas9sgRNA复合体[Cas9蛋白质6μgμL和两个sgRNA各2.2μgμL]和200ul40%聚乙二醇转染缓冲液40%PEG4000,200mM甘露糖醇和100mMCaCl2在2ml管中轻轻混合。在室温下孵育5~20分钟后,通过加入含有W5溶液2mMMESpH5.7,154mMNaCl,125mMCaCl2和5mMKCl的洗涤缓冲液,终止转染。然后通过在100×g下离心5分钟收集原生质体,用1mlW5溶液洗涤,在100×g下再离心5分钟。将原生质体的密度调节至1×105ml并将其培养在含400mM葡萄糖的修饰的KM8p液体培养基中。4-4.拟南芥原生质体和植物中突变的检测转染后24小时或72小时后,收集原生质体并分离基因组DNA。对跨越两个靶位点的基因组DNA区域进行PCR扩增,并进行T7E1测定。如图11所示,RGEN以高频率诱导indel,频率从50%至70%。令人惊奇的是,在转染后24小时诱导了突变。显然,Cas9蛋白质在转染后立即发挥功能。纯化PCR产物,并克隆到T平端PCR克隆试剂盒Solgent。纯化质粒并用M13F引物进行Sanger测序。一个突变体序列在一个位点具有7-bp缺失图12。其他三个突变体序列在两个RGEN位点之间具有~220-bp的DNA片段缺失。实施例5:使用细胞穿透肽或蛋白质转导结构域转导Cas9蛋白质5-1.His-Cas9编码质粒的构建使用先前描述的Cas9质粒{Cho,2013#166}作为模板,通过PCR扩增,制备在C末端具有半胱氨酸的Cas9,并克隆到pET28-a载体Novagen,MerkMillipore,Germany中,在N-末端含有His-标签。5-2.细胞培养293T人胚肾细胞系和HeLa人卵巢癌细胞系生长在补充有10%FBS和1%青霉素和链霉素的DMEMGIBCO-BRLRockville中。5-3.Cas9蛋白质的表达和纯化为了表达Cas9蛋白质,用编码Cas9的pET28-a载体转染大肠杆菌BL21细胞,铺板至含有50μgmL卡那霉素的Luria-BertaniLB琼脂培养基Amresco,Solon,OH。第二天,挑取单菌落并在含有50μgmL卡那霉素的LB肉汤中在37℃过夜培养。第二天,将0.1OD600的起子培养物接种到含有50μgmL卡那霉素的Luria肉汤中,在37℃培养2小时,直到OD600达到0.6-0.8。为了诱导Cas9蛋白质表达,加入异丙基β-D-硫代半乳糖苷IPTGPromega,Madison,WI至终浓度0.5mM后,将细胞在30℃过夜培养。通过在4000rpm离心15-20分钟收集细胞,再悬浮于裂解缓冲液20mMTris-ClpH8.0,300mMNaCl,20mM咪唑,1X蛋白酶抑制剂混合物,1mgml溶菌酶,并通过超声处理裂解40%占空duty,10秒脉冲,30秒间歇,放置于冰上10分钟。在4℃在15000rpm下离心20分钟后分离作为上清液的可溶级分。使用含Ni-NTA琼脂糖树脂的柱QIAGEN和AKTAprime仪器AKTAprime,GEHealthcare,UK,在4℃下纯化Cas9蛋白质。在层析步骤期间,可溶性蛋白质级分以1mLmin的流速上样到Ni-NTA琼脂糖树脂柱GEHealthcare,UK。将柱用洗涤缓冲液20mMTris-ClpH8.0,300mMNaCl,20mM咪唑,1X蛋白酶抑制剂混合物洗涤,结合的蛋白质以0.5mlmin的流速用洗脱缓冲液20mMTris-ClpH8.0,300mMNaCl,250mM咪唑,1X蛋白酶抑制剂混合物洗脱。将合并的洗脱级分浓缩并相对于存储缓冲液50mMTris-HCl,pH8.0,200mMKCl,0.1mMEDTA,1mMDTT,0.5mMPMSF,20%甘油透析。通过Bradford测定法Biorad,Hercules,CA进行蛋白质浓度定量,使用牛血清白蛋白作为对照,通过SDS-PAGE分析纯度。5-4.Cas9与9R4L的缀合使用转子在室温下2小时并在4℃下过夜,轻轻混合以浓度1mgmL稀释在PBS中的1mgCas9蛋白质和25μLDW50中的50μg马来酰亚胺-9R4L肽Peptron,Korea。为了除去未结合的马来酰亚胺-9R4L,将样品用50kDa分子量截断膜对DPBSpH7.4在4℃下进行24小时透析。从透析膜收集Cas9-9R4L蛋白质并用Bradford测定法测定蛋白质量。5-5.sgRNA-9R4L的制备sgRNA1μg轻轻加入到100μlDPBSpH7.4中的各种量C9R4LC肽从1至40的重量比中。将该混合物在室温下孵育30分钟,使用无RNA酶的去离子水稀释10倍。用动态光散射Zetasizer-nanoanalyzerZS;Malverninstruments,Worcestershire,UK,测定所形成的纳米粒子的流体动力学直径和z电位。5-6.Cas9蛋白质和sgRNA处理如下所述用Cas9-9R4L和sgRNA-C9R4LC处理细胞:将1μgsgRNA和15μgC9R4LC肽加入到250mLOPTIMEM培养基中,并在室温下孵育30分钟。在接种后24小时,用OPTIMEM培养基洗涤细胞并用sgRNA-C9R4LC复合体在37℃下处理4小时。将细胞用OPTIMEM培养基再次洗涤并用Cas9-9R4L在37℃下处理2小时。处理后,培养基用含血清的完全培养基取代,并在下一次处理前在37℃下孵育24小时。连续3天以相同的程序实施Cas9和sgRNA的多次处理。5-7.Cas9-9R4L和sgRNA-9R4L能编辑培养的哺乳动物细胞中的内源基因而不使用额外的递送工具为了确定Cas9-9R4L和sgRNA-9R4L在不使用额外的递送工具时是否可以编辑培养的哺乳动物细胞中的内源基因,我们用Cas9-9R4L和靶向CCR5基因的sgRNA-9R4L处理了293个细胞,并分析了基因组DNA。T7E1测定表明,在以Cas9-9R4L和sgRNA-9R4L两者处理的细胞中9%的CCR5基因被破坏,而在对照细胞包括未经处理的细胞,用Cas9-9R或sgRNA-9R4L处理的细胞,或用未修饰的Cas9和sgRNA两者处理的细胞图13中没有观察到CCR5基因的破坏,这表明,用Cas9-9R4L蛋白质和与9R4L缀合的sgRNA而不是未修饰的Cas9和sgRNA处理可以导致哺乳动物细胞中高效的基因组编辑。实施例6:根据向导RNA结构控制脱靶突变最近,三个小组报道了RGEN在人细胞中具有脱靶效应。出乎我们意料的是,RGEN在与标靶位点相差3至5个核苷酸的脱靶位点有效地诱导了突变。然而,我们注意到,我们所使用的RGEN和其他人使用的RGEN有一些差异。首先,我们用dualRNA——其是crRNA加tracrRNA,而不是由crRNA和tracrRNA的必要部分组成的单向导RNAsgRNA。第二,我们用合成的crRNA而非crRNA编码质粒转染K562细胞而不是HeLa细胞。用crRNA编码质粒转染HeLa细胞。其他小组使用sgRNA编码质粒。第三,我们的向导RNA在5'末端有两个附加的鸟嘌呤核苷酸,这对于T7聚合酶的体外有效转录是必需的。在其他人使用的sgRNA中没有包括这样的额外核苷酸。因此,我们的向导RNA的RNA序列可以表示为5'-GGX20,而5'-GX19代表其他人使用的序列,其中X20或GX19对应于20-bp靶序列。第一个鸟嘌呤核苷酸是细胞中由RNA聚合酶转录所需的。为了测试脱靶RGEN效应是否可归因于这些差异,我们选择了在人类细胞中以高频率诱导脱靶突变的4个RGEN13。首先,我们在K562细胞中比较了使用体外转录dualRNA的我们的方法与转染sgRNA编码质粒的方法,通过T7E1测定法测定了在标靶和脱靶位点的突变频率。三个RGEN显示了在标靶和脱靶位点可比较的突变频率,与向导RNA组成无关。有趣的是,当使用合成的dualRNA时,一个RGENVEFGA位点1在一个验证的脱靶位点上没有诱导Indel,该脱靶位点与标靶位点有三个核苷酸不同称为OT1-11,图14。但合成的dualRNA没有辨别出其它验证的脱靶位点OT1-3,所述脱靶位点与标靶位点有两个核苷酸不同。下一步,通过比较5'-GGX20或5'-GGGX19sgRNA与5'-GX19sgRNA,我们测试了在sgRNA的5'末端添加两个鸟嘌呤核苷酸是否可以使RGEN更特异。四个复合Cas9的GX19sgRNA同等有效地在标靶和脱靶位点诱导了Indel,容忍多达四个碱基错配。与之形成鲜明对比,GGX20sgRNA有效区别脱靶位点。事实上,当我们使用四个GGX20sgRNA时,T7E1测定在七个验证的脱靶位点的六个中几乎没有检测到RGEN诱导的indel图15。然而,我们注意到,两个GGX20sgRNAVEGFA位点1和3在标靶位点的活性比对应的GX19sgRNA的活性低。这些结果表明,或许通过改变向导RNA的稳定性、浓度或二级结构,在5'端的额外核苷酸可以影响在标靶和脱靶位点的突变频率。这些结果表明,三个因素——使用合成的向导RNA而不是向导RNA编码质粒,使用dualRNA而非sgRNA,以及使用GGX20sgRNA而非GX19sgRNA——在脱靶位点的辨别上有累积效应。实施例7:配对的Cas9切口酶原则上,单链断裂SSB不能被易错NHEJ修复,但仍引发高保真同源定向修复HDR或碱基切除修复。但通过HDR的切口酶诱导的定向诱变比核酸酶诱导的诱变效率低得多。我们推理,配对Cas9切口酶可以产生复合DSB,其触发通过NHEJ或HDR的DNA修复,导致有效的诱变图16A。此外,配对切口酶使基于Cas9的基因组编辑的特异性增倍。我们首先通过荧光毛细管电泳在体外测试了几种设计为靶向AAVS1基因座中靶位点的Cas9核酸酶和切口酶图16B。与Cas9核酸酶其切割DNA底物的两条链不同,Cas9切口酶由向导RNA和Cas9的突变体形式组成,在所述Cas9突变体中催化性天冬氨酸残基改变为丙氨酸D10ACas9,该Cas9切口酶仅切割一条链,产生位点特异性缺口图16C,D。然而,有趣的是,一些切口酶在图17A中的AS1,AS2,AS3,和S6在人类细胞中在靶位点诱导了Indel,这表明缺口可以体内转化为DSB,尽管低效。在相对的DNA链上产生两个相邻缺口的配对Cas9切口酶以从14%至91%的频率产生Indel,相当于配对核酸酶图17A的效应。在三个基因组基因座上,产生5'突出端的两个切口的修复,比产生3'突出端的两个切口的修复,以更高频率地导致Indel形成图17A和图18。此外,配对切口酶比单一切口酶能够更高效地通过同源定向修复进行靶向基因组编辑图19。接下来,我们使用深度测序测定了脱靶位点上配对切口酶与核酸酶的突变频率。与三个sgRNA复合的Cas9核酸酶在六个位点诱导了脱靶突变,所述位点与其相应的标靶位点相差一个或两个核苷酸,突变频率范围从0.5%至10%图17B。与此相反,配对Cas9切口酶在六个脱靶位点的任何一个上均未产生0.1%检测限以上的Indel。S2Off-1位点其与其标靶位点在PAM的第一位置即,NGG中的N上相差一个核苷酸可以被认为是另一个标靶位点。正如所料,与S2sgRNA复合的Cas9核酸酶在该位点和标靶位点上具有相同的效率。与之形成鲜明对比,与S2和AS2sgRNA复合的D10ACas9以270倍的因数区分该位点和标靶位点。该配对切口酶还分别以160倍和990倍的因数区分AS2脱靶位点图17B中的Off-1和Off-9和靶位点。实施例8:配对Cas9切口酶诱导的染色体DNA剪接已经报道,由工程化的核酸酶ZFN和TALEN产生的两个并行DSB能促进介于中间的染色体片段的大缺失。我们测试了由配对Cas9切口酶诱导的两个SSB是否也能在人细胞中产生缺失。我们使用PCR检测缺失事件,发现7个配对切口酶与配对Cas9核酸酶以同样效率诱导了高达1.1-kbp染色体片段的缺失图20A,B。PCR产物的DNA序列证实了该缺失事件图20C。有趣的是,在七个缺失特异性PCR扩增子的两个中sgRNA匹配序列保持完整20C中下划线所示。与此相反,Cas9核酸酶对没有产生含有完整靶位点的序列。这一发现表明,远离的两个缺口没有转化为两个分开的DSB以促进居间染色体片段的缺失。此外,因为解链温度非常高,不可能相隔100bp以上的两个切口在生理条件下造成具有大突出端的复合DSB。我们提出,两个远离的缺口通过头对头方向的链置换而被修复,导致在中间形成DSB,其通过NHEJ的修复引起小的缺失图20D。因为在这个过程中两个靶位点保持完整,切口酶能再次诱导SSB,反复触发循环,直到靶位点缺失。这一机制解释了为什么产生5'突出端的两个并列缺口但不是产生3'突出端的两个并列缺口在三个基因座有效诱导了Indel。然后我们调查了Cas9核酸酶和切口酶是否能诱发由于标靶和脱靶DNA切割的NHEJ修复而导致的不希望的染色体易位图21A。使用PCR,我们能够检测到Cas9核酸酶诱导的易位图21B,C。使用分离自转染了编码AS2+S3Cas9切口酶对的质粒的细胞的基因组DNA,没有扩增出这样的PCR产物。这一结果与以下事实一致,即,不同于其相应的核酸酶,AS2和S3切口酶在脱靶位点不产生Indel图17B。这些结果表明,配对Cas9切口酶允许在人类细胞中的靶向诱变和高达1-kbp染色体片段的大缺失。重要的是,配对切口酶在脱靶位点没有引起Indel,而在该脱靶位点处其相应的核酸酶诱发突变。此外,与核酸酶不同,配对切口酶不促进与脱靶DNA切割相关的不想要的易位。原则上,配对切口酶使Cas9介导的诱变的特异性加倍,这将扩大RNA向导酶在需要精确基因组编辑应用如基因和细胞治疗中的效用。这种方法的一个附加说明是,需要两个高活性sgRNA构成有效的切口酶对,这限制了可靶向的位点。如该研究和其他研究所示,并非所有sgRNA都具有同样活性。当单克隆而不是细胞群被用于进一步的研究或应用时,代表基因组中独特序列的向导RNA的选择以及优化的向导RNA的使用将足以避免与Cas9核酸酶相关的脱靶突变。我们提出,Cas9核酸酶和配对切口酶均为有利于细胞和生物体中精确基因组编辑的强大选项。实施例9:用CRISPRCas衍生的RNA向导核酸内切酶的基因分型接着,我们推定RGEN可代替常规的限制酶用于限制性片段长度多态性RFLP分析中。当由核酸酶引起的DSB由易错非同源末端连接NHEJ系统修复时,包括RGEN的工程化核酸酶将在靶位点诱导Indel。被设计识别靶序列的RGEN不能切割带有indel的突变序列,但能有效地切割野生型靶序列。9-1.RGEN成分使用MEGAshortcriptT7试剂盒Ambion,根据制造商的说明书,通过体外转录制备crRNA和tracrRNA。转录的RNA在8%变性尿素PAGE凝胶上分离。切出含RNA的凝胶片,并转移到洗脱缓冲液。将RNA回收至无核酸酶水中,然后用苯酚:氯仿提取,氯仿提取和乙醇沉淀。用光谱法定量纯化的RNA。通过退火序列如下所示的寡核苷酸和其互补寡核苷酸,制备crRNA的模板:5'-GAAATTAATACGACTCACTATAGGX20GTTTTAGAGCTATGCTGTTTTG-3'SEQIDNO:76,其中X20是靶序列。使用Phusion聚合酶NewEnglandBiolabs,通过正向和反向寡核苷酸的延伸,合成了tracrRNA模板:5'-GAAATTAATACGACTCACTATAGGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCG-3'SEQIDNO:77和5'-AAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATG-3'SEQIDNO:78。9-2.重组Cas9蛋白质纯化在我们以前的实施例中使用的Cas9DNA构建体其编码在C末端融合His6标签的Cas9插入至pET-28a表达载体。重组Cas9蛋白质表达于大肠杆菌菌株BL21DE3,用1mMIPTG诱导后在25℃培养在LB培养基中4小时。收获细胞,并再悬浮于包含20mMTrisPH8.0,500mMNaCl,5mM咪唑和1mMPMSF的缓冲液中。将细胞在液氮中冷冻,在4℃解冻,并超声处理。离心后,将裂解物中的Cas9蛋白质结合至Ni-NTA琼脂糖树脂Qiagen上,用含有20mMTrispH8.0,500mMNaCl和20mM咪唑的缓冲液洗涤,并用包含20mMTrispH8.0,500mMNaCl和250mM咪唑的缓冲液洗脱。纯化的Cas9蛋白质对20mMHEPESpH7.5,150mMKCl,1mMDTT和10%甘油进行透析,并通过SDS-PAGE分析。9-3.T7内切核酸酶I测定T7E1测定如下进行。简要地说,用基因组DNA扩增的PCR产物在95℃变性,在16℃退火,并在37℃与5单位T7内切核酸酶INewEnglandBioLabs孵育20分钟。将反应产物用2%至2.5%的琼脂糖凝胶电泳分离。9-4.RGEN-RFLP分析PCR产物100-150ng在37℃下与优化浓度表10的Cas9蛋白质、tracrRNA,crRNA在10μlNEB缓冲液31X中孵育60分钟。切割反应后,加入RNA酶A4μg,并将反应混合物在37℃孵育30分钟,以除去RNA。用含有30%甘油,1.2%SDS和100mMEDTA的6X终止溶液缓冲液终止反应。产物用1-2.5%琼脂糖凝胶电泳分离,并用EtBr染色以显现。[表10]RFLP测定中RGEN成分的浓度[表11]引物基因位点方向序列5’至3’9-5.质粒切割测定限制性内切酶处理的线性化质粒100ng在37℃下与Cas9蛋白质0.1μg、tracrRNA60ng和crRNA25ng在10μgNEB3缓冲液1X中孵育60分钟。用含有30%甘油,1.2%SDS和100mMEDTA的6X终止溶液终止反应。产物用1%琼脂糖凝胶电泳分离,并用EtBr染色而显现。9-6.RFLP策略具有所需DNA特异性的新RGEN可以通过替换crRNA而容易地创建;一旦获得重组Cas9蛋白质,则不需要从头纯化定制蛋白质。当核酸酶引起的DSB通过易错非同源末端连接NHEJ修复时,包括RGEN的工程化核酸酶在靶位点诱发小的插入或缺失indel。设计成识别靶序列的RGEN有效切割野生型序列,但不切割具有indel的突变序列图22。我们首先测试RGEN能否差异地切割包含野生型或修饰C4BPB靶序列其在切割位点具有1至3个碱基Indel的质粒。具有这些Indel的六个质粒中没有一个被靶特异性crRNA、tracrRNA和重组Cas9蛋白质组成的C4BPB特异性RGEN5切割图23。与此相反,具有完整靶序列的质粒被该RGEN有效切割。9-7.使用RGEN介导的RFLP检测由同一RGEN诱导的突变接下来,为了测试RGEN介导的RFLP检测由同一RGEN诱导的突变的可行性,我们利用了通过RGEN靶向C4BPB基因建立的基因修饰的K562人癌细胞克隆表12。[表12]在这项研究中使用的RGEN的靶序列本研究中使用的C4BPB突变体克隆具有范围从94bp缺失至67bp插入的各种突变图24A。重要的是,发生在突变体克隆中的所有突变均导致了RGEN靶位点的丧失。在分析的6个C4BPB克隆中,4个克隆具有野生型和突变体等位基因+-,2个克隆仅具有突变体等位基因--。用靶特异性crRNA、tracrRNA和从大肠杆菌表达和纯化的重组蛋白Cas9组成的RGEN,完全消化从野生型K562基因组DNA扩增的跨RGEN靶位点的PCR产物图24B第1道。当使用RGEN对C4BPB突变体克隆进行RFLP分析时,含有野生型和突变体等位基因的+-克隆的PCR扩增子被部分消化,不含有野生型等位基因的--克隆的扩增子根本不被消化,不产生对应于野生型序列的切割产物图24B。甚至在靶位点的单碱基插入也阻碍C4BPBRGEN对扩增的突变体等位基因的消化#12和#28克隆,表明RGEN介导的RFLP的高特异性。我们对PCR扩增子平行地进行错配敏感的T7E1测定图24B。值得注意的是,T7E1测定无法区分--克隆和+-克隆。更糟的是,T7E1测定不能区分含有相同突变序列的纯合突变体克隆和野生型克隆,原因是相同突变序列的退火将形成同源双链体。因此,RGEN介导的RFLP比常规的错配敏感的核酸酶测定法在分析工程化核酸酶包括ZFN,TALEN和RGEN诱导的突变体克隆方面更优越。9-8.RGEN-RFLP分析的定量测定我们还调查了RGEN-RFLP分析是否是一个定量的方法。从C4BPB无效克隆和野生型细胞中分离的基因组DNA样品以各种比例混合,并用于PCR扩增。对PCR产物平行进行RGEN基因分型和T7E1测定图25b。正如所料,由RGEN切割的DNA与野生型对突变的比率成比例。与此相反,T7E1测定结果与从该比率推断的突变频率具有很差的相关性,特别是在高突变%——互补突变序列可相互杂交形成同源双链的情形——是不准确的。9-9.使用RGEN介导的RFLP基因分型分析突变体建立者小鼠我们还应用RGEN介导的RFLP基因分型简称RGEN基因分型,进行了突变体建立者小鼠的分析,该小鼠通过向小鼠一细胞胚胎中注射TALEN而建立图26A。我们设计并使用了识别Pibf1基因中的TALEN靶位点的RGEN表10。从野生型小鼠和突变体小鼠中分离基因组DNA,在PCR扩增后进行RGEN基因分型。RGEN基因分型成功地检测了各种突变,从1至27-bp的缺失图26B。不同于T7E1测定法,RGEN基因分型能够差异检测+-与--建立者。9-10.使用RGEN检测CCR5特异性ZFN在人细胞中诱导的突变此外,我们使用RGEN检测CCR5特异性ZFN代表另一类工程化的核酸酶在人细胞中诱导的突变图27。这些结果表明,RGEN可检测由RGEN自身外的其它核酸酶诱导的突变。事实上,我们预期RGEN可被设计为检测由大多数即使不是全部的话工程化核酸酶诱导的突变。在RGEN基因分型测定的设计中唯一的限制是:要求在Cas9蛋白质识别的PAM序列中有GG或AG互补链上为CC或CT二核苷酸,其平均每4bp出现一次。预期,在crRNA和PAM核苷酸中在几个碱基的种子区域内的任何位置处诱导的Indel都将破坏RGEN催化的DNA切割。事实上,我们在大多数98%ZFN和TALEN位点鉴定到至少一个RGEN位点。9-11.使用RGEN检测多态性或变异接下来,我们设计并测试了靶向高度多态性基因座HLA-B其编码人白细胞抗原B又名MHCI类蛋白的新RGEN图28。用RGEN质粒转染HeLa细胞,对基因组DNA平行进行T7E1和RGEN-RFLP分析。T7E1产生了假阳性条带,这些条带由于靶位点附近的序列多态性而导致图25c。但是,正如预期的,用于基因破坏的相同RGEN完全切割来自野生型细胞的PCR产物,但部分切割来自RGEN转染细胞的PCR产物,表明在靶位点存在RGEN诱导的Indel。这一结果表明,RGEN-RFLP分析比T7E1测定法有着明显的优势,特别是当不知道在所感兴趣的细胞中靶基因是否具有多态性或变异时。9-12.通过RGEN-RFLP分析检测在癌症中的频发突变和天然存在的多态性RGEN-RFLP分析的应用超出基因分型工程化核酸酶诱导的突变。我们试图利用RGEN基因分型检测癌症中的频发突变和天然存在的多态性。我们选择了人类结直肠癌细胞系HCT116,其在编码β-联蛋白的致癌基因CTNNB1上带有功能获得型3bp缺失。从HCT116基因组DNA扩增的PCR产物被野生型特异性和突变体特异性的RGEN部分切割,与HCT116细胞中的杂合基因型相符图29A。与之形成鲜明对比,从仅带有野生型等位基因的HeLa细胞的DNA扩增的PCR产物完全被野生型特异性RGEN消化,而根本不被突变特异性RGEN切割。我们还注意到,HEK293细胞在CCR5基因中具有32bp缺失del32,CCR5基因编码重要的HIV感染共受体:纯合的del32CCR5携带者对HIV感染具免疫性。我们设计了一个特异于del32等位基因的RGEN和特异于野生型等位基因的另一RGEN。正如预期的,野生型特异性RGEN完全切割来自K562,SKBR3或HeLa细胞用作野生型对照的PCR产物,但是部分切割来自HEK293细胞的PCR产物图30a,证实了在HEK293细胞中存在不可切割的del32等位基因。然而,出乎意料的是,del32特异性RGEN同样有效地切割来自野生型细胞的PCR产物和来自HEK293细胞的PCR产物。有趣的是,该RGEN在标靶位点的紧下游具有一个带有单碱基错配的脱靶位点图30。这些结果表明,RGEN可以用来检测天然存在的Indel,但由于其脱靶效应而不能区分具有单核苷酸多态性或点突变的序列。为了使用RGEN基因分型致癌的单核苷酸变异,我们通过采用单碱基错配向导RNA代替完全匹配的RNA来减弱RGEN活性。含有特异于野生型序列或突变体序列的完全匹配的向导RNA的RGEN切割两个序列图31a和32a。与此相反,含有单碱基错配的向导RNA的RGEN区分了两个序列,从而能够对人癌细胞系中KRAS、PIK3CA和IDH1基因中的三个频发致癌点突变进行基因分型图29b和图33a,b。此外,使用识别NAGPAM序列的RGEN,我们能够检测BRAF和NRAS基因中的点突变图33c,d。我们相信,我们能够使用RGEN-RFLP对几乎所有如果不是全部的话的人和其他基因组中的突变或多态性进行基因分型。上述数据提出,RGEN可以提供一个使用简单且稳健的RFLP分析用于各种序列变异的平台。在重编程靶序列方面具有高度灵活性,RGEN可用于检测各种遗传变异单核苷酸变异,小的插入缺失,结构变异,如疾病相关的复发突变、药物反应相关的患者基因型、以及由工程化的核酸酶在细胞中诱导的突变。这里,我们使用RGEN基因分型检测了由工程化的核酸酶在细胞和动物中诱导的突变。原则上,也可以使用RGEN特异性地检测和切割天然存在的变体和突变。根据上面的描述,本领域技术人员应当理解,在实施本发明时可使用本文所述实施方案的各种变体方案,而不偏离权利要求中限定的本发明的技术构思或者基本特征。在这方面,上述实施例仅用于举例说明的目的,并且本发明不旨在受这些实施例的限制。本发明的范围应被理解为包括在权利要求或者其等同构思的含义和范围上衍生的所有修改或修饰形式。[参考文献]1.M.Jinek等,Science337,816Aug17,2012.2.H.Kim,E.Um,S.R.Cho,C.Jung,J.S.Kim,NatMethods8,941Nov,2011.3.H.J.Kim,H.J.Lee,H.Kim,S.W.Cho,J.S.Kim,GenomeRes19,1279Jul,2009.4.E.E.Perez等,NatBiotechnol26,808Jul,2008.5.J.C.Miller等,NatBiotechnol29,143Feb,2011.6.C.Mussolino等,NucleicAcidsRes39,9283Nov,2011.7.J.Cohen,Science332,784May13,2011.8.V.Pattanayak,C.L.Ramirez,J.K.Joung,D.R.Liu,NatMethods8,765Sep,2011.9.R.Gabriel等,NatBiotechnol29,816Sep,2011.10.E.Kim等,GenomeRes,Apr20,2012.11.H.J.Lee,J.Kweon,E.Kim,S.Kim,J.S.Kim,GenomeRes22,539Mar,2012.12.H.J.Lee,E.Kim,J.S.Kim,GenomeRes20,81Jan,2010.13.FuY,FodenJA,KhayterC,MaederML,ReyonD,JoungJK,SanderJD.High-frequencyoff-targetmutagenesisinducedbyCRISPR-Casnucleasesinhumancells.NatBiotechadvanceonlinepublication2013.序列表基因工具股份有限公司TOOLGENINCORPORATED包含特异于靶DNA的向导RNA和CAS蛋白质编码核酸或CAS蛋白质的用于切割靶DNA的组合物及其用途OPA13141PCTUS61717,3242012-10-23US61803,5992013-03-20US61837,4812013-06-20111KopatentIn2.014107DNA人工序列Cas9-编码序列1atggacaagaagtacagcatcggcctggacatcggtaccaacagcgtgggctgggccgtg60atcaccgacgagtacaaggtgcccagcaagaagttcaaggtgctgggcaacaccgaccgc120cacagcatcaagaagaacctgatcggcgccctgctgttcgacagcggcgagaccgccgag180gccacccgcctgaagcgcaccgcccgccgccgctacacccgccgcaagaaccgcatctgc240tacctgcaggagatcttcagcaacgagatggccaaggtggacgacagcttcttccaccgc300ctggaggagagcttcctggtggaggaggacaagaagcacgagcgccaccccatcttcggc360aacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgcgcaag420aagctggtggacagcaccgacaaggccgacctgcgcctgatctacctggccctggcccac480atgatcaagttccgcggccacttcctgatcgagggcgacctgaaccccgacaacagcgac540gtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggagaacccc600atcaacgccagcggcgtggacgccaaggccatcctgagcgcccgcctgagcaagagccgc660cgcctggagaacctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaac720ctgatcgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgag780gacgccaagctgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcc840cagatcggcgaccagtacgccgacctgttcctggccgccaagaacctgagcgacgccatc900ctgctgagcgacatcctgcgcgtgaacaccgagatcaccaaggcccccctgagcgccagc960atgatcaagcgctacgacgagcaccaccaggacctgaccctgctgaaggccctggtgcgc1020cagcagctgcccgagaagtacaaggagatcttcttcgaccagagcaagaacggctacgcc1080ggctacatcgacggcggcgccagccaggaggagttctacaagttcatcaagcccatcctg1140gagaagatggacggcaccgaggagctgctggtgaagctgaaccgcgaggacctgctgcgc1200aagcagcgcaccttcgacaacggcagcatcccccaccagatccacctgggcgagctgcac1260gccatcctgcgccgccaggaggacttctaccccttcctgaaggacaaccgcgagaagatc1320gagaagatcctgaccttccgcatcccctactacgtgggccccctggcccgcggcaacagc1380cgcttcgcctggatgacccgcaagagcgaggagaccatcaccccctggaacttcgaggag1440gtggtggacaagggcgccagcgcccagagcttcatcgagcgcatgaccaacttcgacaag1500aacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtg1560tacaacgagctgaccaaggtgaagtacgtgaccgagggcatgcgcaagcccgccttcctg1620agcggcgagcagaagaaggccatcgtggacctgctgttcaagaccaaccgcaaggtgacc1680gtgaagcagctgaaggaggactacttcaagaagatcgagtgcttcgacagcgtggagatc1740agcggcgtggaggaccgcttcaacgccagcctgggcacctaccacgacctgctgaagatc1800atcaaggacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtg1860ctgaccctgaccctgttcgaggaccgcgagatgatcgaggagcgcctgaagacctacgcc1920cacctgttcgacgacaaggtgatgaagcagctgaagcgccgccgctacaccggctggggc1980cgcctgagccgcaagcttatcaacggcatccgcgacaagcagagcggcaagaccatcctg2040gacttcctgaagagcgacggcttcgccaaccgcaacttcatgcagctgatccacgacgac2100agcctgaccttcaaggaggacatccagaaggcccaggtgagcggccagggcgacagcctg2160cacgagcacatcgccaacctggccggcagccccgccatcaagaagggcatcctgcagacc2220gtgaaggtggtggacgagctggtgaaggtgatgggccgccacaagcccgagaacatcgtg2280atcgagatggcccgcgagaaccagaccacccagaagggccagaagaacagccgcgagcgc2340atgaagcgcatcgaggagggcatcaaggagctgggcagccagatcctgaaggagcacccc2400gtggagaacacccagctgcagaacgagaagctgtacctgtactacctgcagaacggccgc2460gacatgtacgtggaccaggagctggacatcaaccgcctgagcgactacgacgtggaccac2520atcgtgccccagagcttcctgaaggacgacagcatcgacaacaaggtgctgacccgcagc2580gacaagaaccgcggcaagagcgacaacgtgcccagcgaggaggtggtgaagaagatgaag2640aactactggcgccagctgctgaacgccaagctgatcacccagcgcaagttcgacaacctg2700accaaggccgagcgcggcggcctgagcgagctggacaaggccggcttcatcaagcgccag2760ctggtggagacccgccagatcaccaagcacgtggcccagatcctggacagccgcatgaac2820accaagtacgacgagaacgacaagctgatccgcgaggtgaaggtgatcaccctgaagagc2880aagctggtgagcgacttccgcaaggacttccagttctacaaggtgcgcgagatcaacaac2940taccaccacgcccacgacgcctacctgaacgccgtggtgggcaccgccctgatcaagaag3000taccccaagctggagagcgagttcgtgtacggcgactacaaggtgtacgacgtgcgcaag3060atgatcgccaagagcgagcaggagatcggcaaggccaccgccaagtacttcttctacagc3120aacatcatgaacttcttcaagaccgagatcaccctggccaacggcgagatccgcaagcgc3180cccctgatcgagaccaacggcgagaccggcgagatcgtgtgggacaagggccgcgacttc3240gccaccgtgcgcaaggtgctgagcatgccccaggtgaacatcgtgaagaagaccgaggtg3300cagaccggcggcttcagcaaggagagcatcctgcccaagcgcaacagcgacaagctgatc3360gcccgcaagaaggactgggaccccaagaagtacggcggcttcgacagccccaccgtggcc3420tacagcgtgctggtggtggccaaggtggagaagggcaagagcaagaagctgaagagcgtg3480aaggagctgctgggcatcaccatcatggagcgcagcagcttcgagaagaaccccatcgac3540ttcctggaggccaagggctacaaggaggtgaagaaggacctgatcatcaagctgcccaag3600tacagcctgttcgagctggagaacggccgcaagcgcatgctggccagcgccggcgagctg3660cagaagggcaacgagctggccctgcccagcaagtacgtgaacttcctgtacctggccagc3720cactacgagaagctgaagggcagccccgaggacaacgagcagaagcagctgttcgtggag3780cagcacaagcactacctggacgagatcatcgagcagatcagcgagttcagcaagcgcgtg3840atcctggccgacgccaacctggacaaggtgctgagcgcctacaacaagcaccgcgacaag3900cccatccgcgagcaggccgagaacatcatccacctgttcaccctgaccaacctgggcgcc3960cccgccgccttcaagtacttcgacaccaccatcgaccgcaagcgctacaccagcaccaag4020gaggtgctggacgccaccctgatccaccagagcatcaccggtctgtacgagacccgcatc4080gacctgagccagctgggcggcgactaa4107221PRT人工序列肽标签2GlyGlySerGlyProProLysLysLysArgLysValTyrProTyrAsp151015ValProAspTyrAla20334DNA人工序列F引物用于CCR53aattcatgacatcaattattatacatcggaggag34434DNA人工序列R引物用于CCR54gatcctcctccgatgtataataattgatgtcatg34520DNA人工序列F1引物用于CCR55ctccatggtgctatagagca20621DNA人工序列F2引物用于CCR56gagccaagctctccatctagt21720DNA人工序列R引物用于CCR57gccctgtcaagagttgacac20820DNA人工序列F1引物用于C4BPB8tatttggctggttgaaaggg20924DNA人工序列R1引物用于C4BPB9aaagtcatgaaataaacacaccca241024DNA人工序列F2引物用于C4BPB10ctgcattgatatggtagtaccatg241121DNA人工序列R2引物用于C4BPB11gctgttcattgcaatggaatg211220DNA人工序列F1引物用于ADCY512gctcccaccttagtgctctg201320DNA人工序列R1引物用于ADCY513ggtggcaggaacctgtatgt201421DNA人工序列F2引物用于ADCY514gtcattggccagagatgtgga211520DNA人工序列R2引物用于ADCY515gtcccatgacaggcgtgtat201620DNA人工序列F引物用于KCNJ616gcctggccaagtttcagtta201720DNA人工序列R1引物用于KCNJ617tggagccattggtttgcatc201822DNA人工序列R2引物用于KCNJ618ccagaactaagccgtttctgac221920DNA人工序列F1引物用于CNTNAP219atcaccgacaaccagtttcc202020DNA人工序列F2引物用于CNTNAP220tgcagtgcagactctttcca202120DNA人工序列R引物用于CNTNAP221aaggacacagggcaactgaa202220DNA人工序列F1引物用于NAChr.522tgtggaacgagtggtgacag202322DNA人工序列R1引物用于NAChr.523gctggattaggaggcaggattc222422DNA人工序列F2引物用于NAChr.524gtgctgagaacgcttcatagag222523DNA人工序列R2引物用于NAChr.525ggaccaaaccacattcttctcac232620DNA人工序列F引物用于缺失26ccacatctcgttctcggttt202720DNA人工序列R引物用于缺失27tcacaagcccacagatattt2028105RNA人工序列sgRNA用于CCR528ggugacaucaauuauuauacauguuuuagagcuagaaauagcaaguuaaaauaaggcuag60uccguuaucaacuugaaaaaguggcaccgagucggugcuuuuuuu1052944RNA人工序列crRNA用于CCR529ggugacaucaauuauuauacauguuuuagagcuaugcuguuuug443086RNA人工序列tracrRNA用于CCR530ggaaccauucaaaacagcauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaa60aguggcaccgagucggugcuuuuuuu863186DNA人工序列Foxn1#1sgRNA31gaaattaatacgactcactataggcagtctgacgtcacacttccgttttagagctagaaa60tagcaagttaaaataaggctagtccg863286DNA人工序列Foxn1#2sgRNA32gaaattaatacgactcactataggacttccaggctccacccgacgttttagagctagaaa60tagcaagttaaaataaggctagtccg863386DNA人工序列Foxn1#3sgRNA33gaaattaatacgactcactataggccaggctccacccgactggagttttagagctagaaa60tagcaagttaaaataaggctagtccg863486DNA人工序列Foxn1#4sgRNA34gaaattaatacgactcactataggactggagggcgaaccccaaggttttagagctagaaa60tagcaagttaaaataaggctagtccg863586DNA人工序列Foxn1#5sgRNA35gaaattaatacgactcactataggaccccaaggggacctcatgcgttttagagctagaaa60tagcaagttaaaataaggctagtccg863686DNA人工序列Prkdc#1sgRNA36gaaattaatacgactcactataggttagttttttccagagacttgttttagagctagaaa60tagcaagttaaaataaggctagtccg863786DNA人工序列Prkdc#2sgRNA37gaaattaatacgactcactataggttggtttgcttgtgtttatcgttttagagctagaaa60tagcaagttaaaataaggctagtccg863886DNA人工序列Prkdc#3sgRNA38gaaattaatacgactcactataggcacaagcaaaccaaagtctcgttttagagctagaaa60tagcaagttaaaataaggctagtccg863986DNA人工序列Prkdc#4sgRNA39gaaattaatacgactcactataggcctcaatgctaagcgacttcgttttagagctagaaa60tagcaagttaaaataaggctagtccg864029DNA人工序列F1引物用于Foxn140gtctgtctatcatctcttcccttctctcc294125DNA人工序列F2引物用于Foxn141tccctaatccgatggctagctccag254223DNA人工序列R1引物用于Foxn142acgagcagctgaagttagcatgc234332DNA人工序列R2引物用于Foxn143ctactcaatgctcttagagctaccaggcttgc324420DNA人工序列F引物用于Prkdc44gactgttgtggggagggccg204524DNA人工序列F2引物用于Prkdc45gggagggccgaaagtcttattttg244628DNA人工序列R1引物用于Prkdc46cctgaagactgaagttggcagaagtgag284727DNA人工序列R2引物用于Prkdc47ctttagggcttcttctctacaatcacg274838DNA人工序列F引物用于Foxn148ctcggtgtgtagccctgacctcggtgtgtagccctgac384921DNA人工序列R引物用于Foxn149agactggcctggaactcacag215023DNA人工序列F引物用于Foxn150cactaaagcctgtcaggaagccg235121DNA人工序列R引物用于Foxn151ctgtggagagcacacagcagc215219DNA人工序列F引物用于Foxn152gctgcgacctgagaccatg195326DNA人工序列R引物用于Foxn153cttcaatggcttcctgcttaggctac265423DNA人工序列F引物用于Foxn154ggttcagatgaggccatcctttc235524DNA人工序列R引物用于Foxn155cctgatctgcaggcttaacccttg245622DNA人工序列F引物用于Prkdc56ctcacctgcacatcacatgtgg225720DNA人工序列R引物用于Prkdc57ggcatccaccctatggggtc205825DNA人工序列F引物用于Prkdc58gccttgacctagagcttaaagagcc255925DNA人工序列R引物用于Prkdc59ggtcttgttagcaggaaggacactg256027DNA人工序列F引物用于Prkdc60aaaactctgcttgatgggatatgtggg276126DNA人工序列R引物用于Prkdc61ctctcactggttatctgtgctccttc266223DNA人工序列F引物用于Prkdc62ggatcaataggtggtgggggatg236327DNA人工序列R引物用于Prkdc63gtgaatgacacaatgtgacagcttcag276428DNA人工序列F引物用于Prkdc64cacaagacagacctctcaacattcagtc286532DNA人工序列R引物用于Prkdc65gtgcatgcatataatccattctgattgctctc326617DNA人工序列F1引物用于Prkdc66gggaggcagaggcaggt176723DNA人工序列F2引物用于Prkdc67ggatctctgtgagtttgaggcca236824DNA人工序列R1引物用于Prkdc68gctccagaactcactcttaggctc246920DNA人工序列引物用于Foxn169ctactccctccgcagtctga207020DNA人工序列引物用于Foxn170ccaggcctaggttccaggta207120DNA人工序列引物用于Prkdc71ccccagcattgcagatttcc207223DNA人工序列引物用于Prkdc72agggcttcttctctacaatcacg237386DNA人工序列BRI1靶173gaaattaatacgactcactataggtttgaaagatggaagcgcgggttttagagctagaaa60tagcaagttaaaataaggctagtccg867486DNA人工序列BRI1靶274gaaattaatacgactcactataggtgaaactaaactggtccacagttttagagctagaaa60tagcaagttaaaataaggctagtccg867564DNA人工序列通用75aaaaaagcaccgactcggtgccactttttcaagttgataacggactagccttattttaac60ttgc647665DNA人工序列用于crRNA的模板76gaaattaatacgactcactataggnnnnnnnnnnnnnnnnnnnngttttagagctatgct60gtttt657767DNA人工序列tracrRNA77gaaattaatacgactcactataggaaccattcaaaacagcatagcaagttaaaataaggc60tagtccg677869DNA人工序列tracrRNA78aaaaaaagcaccgactcggtgccactttttcaagttgataacggactagccttattttaa60cttgctatg697920DNA人工序列引物79ctccatggtgctatagagca208021DNA人工序列引物80gagccaagctctccatctagt218120DNA人工序列引物81gccctgtcaagagttgacac208222DNA人工序列引物82gcacagggtggaacaagatgga228324DNA人工序列引物83gccaggtacctatcgattgtcagg248421DNA人工序列引物84gagccaagctctccatctagt218520DNA人工序列引物85actctgactgggtcaccagc208620DNA人工序列引物86tatttggctggttgaaaggg208724DNA人工序列引物87aaagtcatgaaataaacacaccca248824DNA人工序列引物88ctgcattgatatggtagtaccatg248921DNA人工序列引物89gctgttcattgcaatggaatg219022DNA人工序列引物90atggagttggacatggccatgg229128DNA人工序列引物91actcactatccacagttcagcatttacc289223DNA人工序列引物92tggagatagctgtcagcaacttt239329DNA人工序列引物93caacaaagcaaaggtaaagttggtaatag299425DNA人工序列引物94ggtttcaggagatgtgttacaaggc259527DNA人工序列引物95gattgtgcaattcctatgcaatcggtc279625DNA人工序列引物96cactgggtacttaatctgtagcctc259723DNA人工序列引物97ggttccaagtcattcccagtagc239830DNA人工序列引物98catcactgcagttgtaggttataactatcc309926DNA人工序列引物99ttgaaaaccacagatctggttgaacc2610022DNA人工序列引物100ggagtgccaagagaatatctgg2210132DNA人工序列引物101ctgaaactggtttcaaaatattcgttttaagg3210222DNA人工序列引物102gctctgtatgccctgtagtagg2210322DNA人工序列引物103tttgcatctgaccttacctttg2210423DNA人工序列RGEN的靶序列104aatgaccactacatcctcaaggg2310523DNA人工序列RGEN的靶序列105agatgatgtctcatcatcagagg231064170DNA人工序列Cas9-编码序列在p3s-Cas9HC中人源化的,C-末端加标签,人细胞实验106atggacaagaagtacagcatcggcctggacatcggtaccaacagcgtgggctgggccgtg60atcaccgacgagtacaaggtgcccagcaagaagttcaaggtgctgggcaacaccgaccgc120cacagcatcaagaagaacctgatcggcgccctgctgttcgacagcggcgagaccgccgag180gccacccgcctgaagcgcaccgcccgccgccgctacacccgccgcaagaaccgcatctgc240tacctgcaggagatcttcagcaacgagatggccaaggtggacgacagcttcttccaccgc300ctggaggagagcttcctggtggaggaggacaagaagcacgagcgccaccccatcttcggc360aacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgcgcaag420aagctggtggacagcaccgacaaggccgacctgcgcctgatctacctggccctggcccac480atgatcaagttccgcggccacttcctgatcgagggcgacctgaaccccgacaacagcgac540gtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggagaacccc600atcaacgccagcggcgtggacgccaaggccatcctgagcgcccgcctgagcaagagccgc660cgcctggagaacctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaac720ctgatcgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgag780gacgccaagctgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcc840cagatcggcgaccagtacgccgacctgttcctggccgccaagaacctgagcgacgccatc900ctgctgagcgacatcctgcgcgtgaacaccgagatcaccaaggcccccctgagcgccagc960atgatcaagcgctacgacgagcaccaccaggacctgaccctgctgaaggccctggtgcgc1020cagcagctgcccgagaagtacaaggagatcttcttcgaccagagcaagaacggctacgcc1080ggctacatcgacggcggcgccagccaggaggagttctacaagttcatcaagcccatcctg1140gagaagatggacggcaccgaggagctgctggtgaagctgaaccgcgaggacctgctgcgc1200aagcagcgcaccttcgacaacggcagcatcccccaccagatccacctgggcgagctgcac1260gccatcctgcgccgccaggaggacttctaccccttcctgaaggacaaccgcgagaagatc1320gagaagatcctgaccttccgcatcccctactacgtgggccccctggcccgcggcaacagc1380cgcttcgcctggatgacccgcaagagcgaggagaccatcaccccctggaacttcgaggag1440gtggtggacaagggcgccagcgcccagagcttcatcgagcgcatgaccaacttcgacaag1500aacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtg1560tacaacgagctgaccaaggtgaagtacgtgaccgagggcatgcgcaagcccgccttcctg1620agcggcgagcagaagaaggccatcgtggacctgctgttcaagaccaaccgcaaggtgacc1680gtgaagcagctgaaggaggactacttcaagaagatcgagtgcttcgacagcgtggagatc1740agcggcgtggaggaccgcttcaacgccagcctgggcacctaccacgacctgctgaagatc1800atcaaggacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtg1860ctgaccctgaccctgttcgaggaccgcgagatgatcgaggagcgcctgaagacctacgcc1920cacctgttcgacgacaaggtgatgaagcagctgaagcgccgccgctacaccggctggggc1980cgcctgagccgcaagcttatcaacggcatccgcgacaagcagagcggcaagaccatcctg2040gacttcctgaagagcgacggcttcgccaaccgcaacttcatgcagctgatccacgacgac2100agcctgaccttcaaggaggacatccagaaggcccaggtgagcggccagggcgacagcctg2160cacgagcacatcgccaacctggccggcagccccgccatcaagaagggcatcctgcagacc2220gtgaaggtggtggacgagctggtgaaggtgatgggccgccacaagcccgagaacatcgtg2280atcgagatggcccgcgagaaccagaccacccagaagggccagaagaacagccgcgagcgc2340atgaagcgcatcgaggagggcatcaaggagctgggcagccagatcctgaaggagcacccc2400gtggagaacacccagctgcagaacgagaagctgtacctgtactacctgcagaacggccgc2460gacatgtacgtggaccaggagctggacatcaaccgcctgagcgactacgacgtggaccac2520atcgtgccccagagcttcctgaaggacgacagcatcgacaacaaggtgctgacccgcagc2580gacaagaaccgcggcaagagcgacaacgtgcccagcgaggaggtggtgaagaagatgaag2640aactactggcgccagctgctgaacgccaagctgatcacccagcgcaagttcgacaacctg2700accaaggccgagcgcggcggcctgagcgagctggacaaggccggcttcatcaagcgccag2760ctggtggagacccgccagatcaccaagcacgtggcccagatcctggacagccgcatgaac2820accaagtacgacgagaacgacaagctgatccgcgaggtgaaggtgatcaccctgaagagc2880aagctggtgagcgacttccgcaaggacttccagttctacaaggtgcgcgagatcaacaac2940taccaccacgcccacgacgcctacctgaacgccgtggtgggcaccgccctgatcaagaag3000taccccaagctggagagcgagttcgtgtacggcgactacaaggtgtacgacgtgcgcaag3060atgatcgccaagagcgagcaggagatcggcaaggccaccgccaagtacttcttctacagc3120aacatcatgaacttcttcaagaccgagatcaccctggccaacggcgagatccgcaagcgc3180cccctgatcgagaccaacggcgagaccggcgagatcgtgtgggacaagggccgcgacttc3240gccaccgtgcgcaaggtgctgagcatgccccaggtgaacatcgtgaagaagaccgaggtg3300cagaccggcggcttcagcaaggagagcatcctgcccaagcgcaacagcgacaagctgatc3360gcccgcaagaaggactgggaccccaagaagtacggcggcttcgacagccccaccgtggcc3420tacagcgtgctggtggtggccaaggtggagaagggcaagagcaagaagctgaagagcgtg3480aaggagctgctgggcatcaccatcatggagcgcagcagcttcgagaagaaccccatcgac3540ttcctggaggccaagggctacaaggaggtgaagaaggacctgatcatcaagctgcccaag3600tacagcctgttcgagctggagaacggccgcaagcgcatgctggccagcgccggcgagctg3660cagaagggcaacgagctggccctgcccagcaagtacgtgaacttcctgtacctggccagc3720cactacgagaagctgaagggcagccccgaggacaacgagcagaagcagctgttcgtggag3780cagcacaagcactacctggacgagatcatcgagcagatcagcgagttcagcaagcgcgtg3840atcctggccgacgccaacctggacaaggtgctgagcgcctacaacaagcaccgcgacaag3900cccatccgcgagcaggccgagaacatcatccacctgttcaccctgaccaacctgggcgcc3960cccgccgccttcaagtacttcgacaccaccatcgaccgcaagcgctacaccagcaccaag4020gaggtgctggacgccaccctgatccaccagagcatcaccggtctgtacgagacccgcatc4080gacctgagccagctgggcggcgacggcggctccggacctccaaagaaaaagagaaaagta4140tacccctacgacgtgcccgactacgcctaa41701074194DNA人工序列Cas9编码序列在p3s-Cas9HN中人源化的密码子,N-端加标签下划线,人细胞实验107atggtgtacccctacgacgtgcccgactacgccgaattgcctccaaaaaagaagagaaag60gtagggatccgaattcccggggaaaaaccggacaagaagtacagcatcggcctggacatc120ggtaccaacagcgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaag180ttcaaggtgctgggcaacaccgaccgccacagcatcaagaagaacctgatcggcgccctg240ctgttcgacagcggcgagaccgccgaggccacccgcctgaagcgcaccgcccgccgccgc300tacacccgccgcaagaaccgcatctgctacctgcaggagatcttcagcaacgagatggcc360aaggtggacgacagcttcttccaccgcctggaggagagcttcctggtggaggaggacaag420aagcacgagcgccaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaag480taccccaccatctaccacctgcgcaagaagctggtggacagcaccgacaaggccgacctg540cgcctgatctacctggccctggcccacatgatcaagttccgcggccacttcctgatcgag600ggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacc660tacaaccagctgttcgaggagaaccccatcaacgccagcggcgtggacgccaaggccatc720ctgagcgcccgcctgagcaagagccgccgcctggagaacctgatcgcccagctgcccggc780gagaagaagaacggcctgttcggcaacctgatcgccctgagcctgggcctgacccccaac840ttcaagagcaacttcgacctggccgaggacgccaagctgcagctgagcaaggacacctac900gacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgttcctg960gccgccaagaacctgagcgacgccatcctgctgagcgacatcctgcgcgtgaacaccgag1020atcaccaaggcccccctgagcgccagcatgatcaagcgctacgacgagcaccaccaggac1080ctgaccctgctgaaggccctggtgcgccagcagctgcccgagaagtacaaggagatcttc1140ttcgaccagagcaagaacggctacgccggctacatcgacggcggcgccagccaggaggag1200ttctacaagttcatcaagcccatcctggagaagatggacggcaccgaggagctgctggtg1260aagctgaaccgcgaggacctgctgcgcaagcagcgcaccttcgacaacggcagcatcccc1320caccagatccacctgggcgagctgcacgccatcctgcgccgccaggaggacttctacccc1380ttcctgaaggacaaccgcgagaagatcgagaagatcctgaccttccgcatcccctactac1440gtgggccccctggcccgcggcaacagccgcttcgcctggatgacccgcaagagcgaggag1500accatcaccccctggaacttcgaggaggtggtggacaagggcgccagcgcccagagcttc1560atcgagcgcatgaccaacttcgacaagaacctgcccaacgagaaggtgctgcccaagcac1620agcctgctgtacgagtacttcaccgtgtacaacgagctgaccaaggtgaagtacgtgacc1680gagggcatgcgcaagcccgccttcctgagcggcgagcagaagaaggccatcgtggacctg1740ctgttcaagaccaaccgcaaggtgaccgtgaagcagctgaaggaggactacttcaagaag1800atcgagtgcttcgacagcgtggagatcagcggcgtggaggaccgcttcaacgccagcctg1860ggcacctaccacgacctgctgaagatcatcaaggacaaggacttcctggacaacgaggag1920aacgaggacatcctggaggacatcgtgctgaccctgaccctgttcgaggaccgcgagatg1980atcgaggagcgcctgaagacctacgcccacctgttcgacgacaaggtgatgaagcagctg2040aagcgccgccgctacaccggctggggccgcctgagccgcaagcttatcaacggcatccgc2100gacaagcagagcggcaagaccatcctggacttcctgaagagcgacggcttcgccaaccgc2160aacttcatgcagctgatccacgacgacagcctgaccttcaaggaggacatccagaaggcc2220caggtgagcggccagggcgacagcctgcacgagcacatcgccaacctggccggcagcccc2280gccatcaagaagggcatcctgcagaccgtgaaggtggtggacgagctggtgaaggtgatg2340ggccgccacaagcccgagaacatcgtgatcgagatggcccgcgagaaccagaccacccag2400aagggccagaagaacagccgcgagcgcatgaagcgcatcgaggagggcatcaaggagctg2460ggcagccagatcctgaaggagcaccccgtggagaacacccagctgcagaacgagaagctg2520tacctgtactacctgcagaacggccgcgacatgtacgtggaccaggagctggacatcaac2580cgcctgagcgactacgacgtggaccacatcgtgccccagagcttcctgaaggacgacagc2640atcgacaacaaggtgctgacccgcagcgacaagaaccgcggcaagagcgacaacgtgccc2700agcgaggaggtggtgaagaagatgaagaactactggcgccagctgctgaacgccaagctg2760atcacccagcgcaagttcgacaacctgaccaaggccgagcgcggcggcctgagcgagctg2820gacaaggccggcttcatcaagcgccagctggtggagacccgccagatcaccaagcacgtg2880gcccagatcctggacagccgcatgaacaccaagtacgacgagaacgacaagctgatccgc2940gaggtgaaggtgatcaccctgaagagcaagctggtgagcgacttccgcaaggacttccag3000ttctacaaggtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgcc3060gtggtgggcaccgccctgatcaagaagtaccccaagctggagagcgagttcgtgtacggc3120gactacaaggtgtacgacgtgcgcaagatgatcgccaagagcgagcaggagatcggcaag3180gccaccgccaagtacttcttctacagcaacatcatgaacttcttcaagaccgagatcacc3240ctggccaacggcgagatccgcaagcgccccctgatcgagaccaacggcgagaccggcgag3300atcgtgtgggacaagggccgcgacttcgccaccgtgcgcaaggtgctgagcatgccccag3360gtgaacatcgtgaagaagaccgaggtgcagaccggcggcttcagcaaggagagcatcctg3420cccaagcgcaacagcgacaagctgatcgcccgcaagaaggactgggaccccaagaagtac3480ggcggcttcgacagccccaccgtggcctacagcgtgctggtggtggccaaggtggagaag3540ggcaagagcaagaagctgaagagcgtgaaggagctgctgggcatcaccatcatggagcgc3600agcagcttcgagaagaaccccatcgacttcctggaggccaagggctacaaggaggtgaag3660aaggacctgatcatcaagctgcccaagtacagcctgttcgagctggagaacggccgcaag3720cgcatgctggccagcgccggcgagctgcagaagggcaacgagctggccctgcccagcaag3780tacgtgaacttcctgtacctggccagccactacgagaagctgaagggcagccccgaggac3840aacgagcagaagcagctgttcgtggagcagcacaagcactacctggacgagatcatcgag3900cagatcagcgagttcagcaagcgcgtgatcctggccgacgccaacctggacaaggtgctg3960agcgcctacaacaagcaccgcgacaagcccatccgcgagcaggccgagaacatcatccac4020ctgttcaccctgaccaacctgggcgcccccgccgccttcaagtacttcgacaccaccatc4080gaccgcaagcgctacaccagcaccaaggaggtgctggacgccaccctgatccaccagagc4140atcaccggtctgtacgagacccgcatcgacctgagccagctgggcggcgactaa41941084107DNA人工序列化脓性链球菌的Cas9-编码序列108atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtg60atcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgc120cacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaa180gcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgt240tatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcga300cttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttgga360aatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaa420aaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcat480atgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgat540gtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccct600attaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaaga660cgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaat720ctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaa780gatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcg840caaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctatt900ttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttca960atgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcga1020caacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgca1080ggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaatttta1140gaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgc1200aagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcat1260gctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagatt1320gaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagt1380cgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaa1440gttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaa1500aatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtt1560tataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctt1620tcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaacc1680gttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatt1740tcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaatt1800attaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgtt1860ttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgct1920cacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttgggga1980cgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatatta2040gattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgat2100agtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagttta2160catgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagact2220gtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgtt2280attgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgt2340atgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcct2400gttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaaga2460gacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcac2520attgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttct2580gataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaa2640aactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataattta2700acgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaa2760ttggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaat2820actaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatct2880aaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaat2940taccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaa3000tatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaa3060atgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactct3120aatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgc3180cctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagatttt3240gccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagta3300cagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttatt3360gctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagct3420tattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgtt3480aaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgac3540tttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaa3600tatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaatta3660caaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagt3720cattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggag3780cagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgtt3840attttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaa3900ccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagct3960cccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaa4020gaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcatt4080gatttgagtcagctaggaggtgactaa41071091368PRT人工序列来自化脓性链球菌的Cas9的氨基酸序列109MetAspLysLysTyrSerIleGlyLeuAspIleGlyThrAsnSerVal151015GlyTrpAlaValIleThrAspGluTyrLysValProSerLysLysPhe202530LysValLeuGlyAsnThrAspArgHisSerIleLysLysAsnLeuIle354045GlyAlaLeuLeuPheAspSerGlyGluThrAlaGluAlaThrArgLeu505560LysArgThrAlaArgArgArgTyrThrArgArgLysAsnArgIleCys65707580TyrLeuGlnGluIlePheSerAsnGluMetAlaLysValAspAspSer859095PhePheHisArgLeuGluGluSerPheLeuValGluGluAspLysLys100105110HisGluArgHisProIlePheGlyAsnIleValAspGluValAlaTyr115120125HisGluLysTyrProThrIleTyrHisLeuArgLysLysLeuValAsp130135140SerThrAspLysAlaAspLeuArgLeuIleTyrLeuAlaLeuAlaHis145150155160MetIleLysPheArgGlyHisPheLeuIleGluGlyAspLeuAsnPro165170175AspAsnSerAspValAspLysLeuPheIleGlnLeuValGlnThrTyr180185190AsnGlnLeuPheGluGluAsnProIleAsnAlaSerGlyValAspAla195200205LysAlaIleLeuSerAlaArgLeuSerLysSerArgArgLeuGluAsn210215220LeuIleAlaGlnLeuProGlyGluLysLysAsnGlyLeuPheGlyAsn225230235240LeuIleAlaLeuSerLeuGlyLeuThrProAsnPheLysSerAsnPhe245250255AspLeuAlaGluAspAlaLysLeuGlnLeuSerLysAspThrTyrAsp260265270AspAspLeuAspAsnLeuLeuAlaGlnIleGlyAspGlnTyrAlaAsp275280285LeuPheLeuAlaAlaLysAsnLeuSerAspAlaIleLeuLeuSerAsp290295300IleLeuArgValAsnThrGluIleThrLysAlaProLeuSerAlaSer305310315320MetIleLysArgTyrAspGluHisHisGlnAspLeuThrLeuLeuLys325330335AlaLeuValArgGlnGlnLeuProGluLysTyrLysGluIlePhePhe340345350AspGlnSerLysAsnGlyTyrAlaGlyTyrIleAspGlyGlyAlaSer355360365GlnGluGluPheTyrLysPheIleLysProIleLeuGluLysMetAsp370375380GlyThrGluGluLeuLeuValLysLeuAsnArgGluAspLeuLeuArg385390395400LysGlnArgThrPheAspAsnGlySerIleProHisGlnIleHisLeu405410415GlyGluLeuHisAlaIleLeuArgArgGlnGluAspPheTyrProPhe420425430LeuLysAspAsnArgGluLysIleGluLysIleLeuThrPheArgIle435440445ProTyrTyrValGlyProLeuAlaArgGlyAsnSerArgPheAlaTrp450455460MetThrArgLysSerGluGluThrIleThrProTrpAsnPheGluGlu465470475480ValValAspLysGlyAlaSerAlaGlnSerPheIleGluArgMetThr485490495AsnPheAspLysAsnLeuProAsnGluLysValLeuProLysHisSer500505510LeuLeuTyrGluTyrPheThrValTyrAsnGluLeuThrLysValLys515520525TyrValThrGluGlyMetArgLysProAlaPheLeuSerGlyGluGln530535540LysLysAlaIleValAspLeuLeuPheLysThrAsnArgLysValThr545550555560ValLysGlnLeuLysGluAspTyrPheLysLysIleGluCysPheAsp565570575SerValGluIleSerGlyValGluAspArgPheAsnAlaSerLeuGly580585590ThrTyrHisAspLeuLeuLysIleIleLysAspLysAspPheLeuAsp595600605AsnGluGluAsnGluAspIleLeuGluAspIleValLeuThrLeuThr610615620LeuPheGluAspArgGluMetIleGluGluArgLeuLysThrTyrAla625630635640HisLeuPheAspAspLysValMetLysGlnLeuLysArgArgArgTyr645650655ThrGlyTrpGlyArgLeuSerArgLysLeuIleAsnGlyIleArgAsp660665670LysGlnSerGlyLysThrIleLeuAspPheLeuLysSerAspGlyPhe675680685AlaAsnArgAsnPheMetGlnLeuIleHisAspAspSerLeuThrPhe690695700LysGluAspIleGlnLysAlaGlnValSerGlyGlnGlyAspSerLeu705710715720HisGluHisIleAlaAsnLeuAlaGlySerProAlaIleLysLysGly725730735IleLeuGlnThrValLysValValAspGluLeuValLysValMetGly740745750ArgHisLysProGluAsnIleValIleGluMetAlaArgGluAsnGln755760765ThrThrGlnLysGlyGlnLysAsnSerArgGluArgMetLysArgIle770775780GluGluGlyIleLysGluLeuGlySerGlnIleLeuLysGluHisPro785790795800ValGluAsnThrGlnLeuGlnAsnGluLysLeuTyrLeuTyrTyrLeu805810815GlnAsnGlyArgAspMetTyrValAspGlnGluLeuAspIleAsnArg820825830LeuSerAspTyrAspValAspHisIleValProGlnSerPheLeuLys835840845AspAspSerIleAspAsnLysValLeuThrArgSerAspLysAsnArg850855860GlyLysSerAspAsnValProSerGluGluValValLysLysMetLys865870875880AsnTyrTrpArgGlnLeuLeuAsnAlaLysLeuIleThrGlnArgLys885890895PheAspAsnLeuThrLysAlaGluArgGlyGlyLeuSerGluLeuAsp900905910LysAlaGlyPheIleLysArgGlnLeuValGluThrArgGlnIleThr915920925LysHisValAlaGlnIleLeuAspSerArgMetAsnThrLysTyrAsp930935940GluAsnAspLysLeuIleArgGluValLysValIleThrLeuLysSer945950955960LysLeuValSerAspPheArgLysAspPheGlnPheTyrLysValArg965970975GluIleAsnAsnTyrHisHisAlaHisAspAlaTyrLeuAsnAlaVal980985990ValGlyThrAlaLeuIleLysLysTyrProLysLeuGluSerGluPhe99510001005ValTyrGlyAspTyrLysValTyrAspValArgLysMetIleAlaLys101010151020SerGluGlnGluIleGlyLysAlaThrAlaLysTyrPhePheTyrSer1025103010351040AsnIleMetAsnPhePheLysThrGluIleThrLeuAlaAsnGlyGlu104510501055IleArgLysArgProLeuIleGluThrAsnGlyGluThrGlyGluIle106010651070ValTrpAspLysGlyArgAspPheAlaThrValArgLysValLeuSer107510801085MetProGlnValAsnIleValLysLysThrGluValGlnThrGlyGly109010951100PheSerLysGluSerIleLeuProLysArgAsnSerAspLysLeuIle1105111011151120AlaArgLysLysAspTrpAspProLysLysTyrGlyGlyPheAspSer112511301135ProThrValAlaTyrSerValLeuValValAlaLysValGluLysGly114011451150LysSerLysLysLeuLysSerValLysGluLeuLeuGlyIleThrIle115511601165MetGluArgSerSerPheGluLysAsnProIleAspPheLeuGluAla117011751180LysGlyTyrLysGluValLysLysAspLeuIleIleLysLeuProLys1185119011951200TyrSerLeuPheGluLeuGluAsnGlyArgLysArgMetLeuAlaSer120512101215AlaGlyGluLeuGlnLysGlyAsnGluLeuAlaLeuProSerLysTyr122012251230ValAsnPheLeuTyrLeuAlaSerHisTyrGluLysLeuLysGlySer123512401245ProGluAspAsnGluGlnLysGlnLeuPheValGluGlnHisLysHis125012551260TyrLeuAspGluIleIleGluGlnIleSerGluPheSerLysArgVal1265127012751280IleLeuAlaAspAlaAsnLeuAspLysValLeuSerAlaTyrAsnLys128512901295HisArgAspLysProIleArgGluGlnAlaGluAsnIleIleHisLeu130013051310PheThrLeuThrAsnLeuGlyAlaProAlaAlaPheLysTyrPheAsp131513201325ThrThrIleAspArgLysArgTyrThrSerThrLysGluValLeuAsp133013351340AlaThrLeuIleHisGlnSerIleThrGlyLeuTyrGluThrArgIle1345135013551360AspLeuSerGlnLeuGlyGlyAsp13651104221DNA人工序列Cas9-编码序列在pET-Cas9N3T中,用于在大肠杆菌中产生重组Cas9蛋白人源化的密码子;六His标签和细胞核定位信号在N末端110atgggcagcagccatcatcatcatcatcatgtgtacccctacgacgtgcccgactacgcc60gaattgcctccaaaaaagaagagaaaggtagggatcgagaacctgtacttccagggcgac120aagaagtacagcatcggcctggacatcggtaccaacagcgtgggctgggccgtgatcacc180gacgagtacaaggtgcccagcaagaagttcaaggtgctgggcaacaccgaccgccacagc240atcaagaagaacctgatcggcgccctgctgttcgacagcggcgagaccgccgaggccacc300cgcctgaagcgcaccgcccgccgccgctacacccgccgcaagaaccgcatctgctacctg360caggagatcttcagcaacgagatggccaaggtggacgacagcttcttccaccgcctggag420gagagcttcctggtggaggaggacaagaagcacgagcgccaccccatcttcggcaacatc480gtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgcgcaagaagctg540gtggacagcaccgacaaggccgacctgcgcctgatctacctggccctggcccacatgatc600aagttccgcggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggac660aagctgttcatccagctggtgcagacctacaaccagctgttcgaggagaaccccatcaac720gccagcggcgtggacgccaaggccatcctgagcgcccgcctgagcaagagccgccgcctg780gagaacctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaacctgatc840gccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggacgcc900aagctgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatc960ggcgaccagtacgccgacctgttcctggccgccaagaacctgagcgacgccatcctgctg1020agcgacatcctgcgcgtgaacaccgagatcaccaaggcccccctgagcgccagcatgatc1080aagcgctacgacgagcaccaccaggacctgaccctgctgaaggccctggtgcgccagcag1140ctgcccgagaagtacaaggagatcttcttcgaccagagcaagaacggctacgccggctac1200atcgacggcggcgccagccaggaggagttctacaagttcatcaagcccatcctggagaag1260atggacggcaccgaggagctgctggtgaagctgaaccgcgaggacctgctgcgcaagcag1320cgcaccttcgacaacggcagcatcccccaccagatccacctgggcgagctgcacgccatc1380ctgcgccgccaggaggacttctaccccttcctgaaggacaaccgcgagaagatcgagaag1440atcctgaccttccgcatcccctactacgtgggccccctggcccgcggcaacagccgcttc1500gcctggatgacccgcaagagcgaggagaccatcaccccctggaacttcgaggaggtggtg1560gacaagggcgccagcgcccagagcttcatcgagcgcatgaccaacttcgacaagaacctg1620cccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtacaac1680gagctgaccaaggtgaagtacgtgaccgagggcatgcgcaagcccgccttcctgagcggc1740gagcagaagaaggccatcgtggacctgctgttcaagaccaaccgcaaggtgaccgtgaag1800cagctgaaggaggactacttcaagaagatcgagtgcttcgacagcgtggagatcagcggc1860gtggaggaccgcttcaacgccagcctgggcacctaccacgacctgctgaagatcatcaag1920gacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtgctgacc1980ctgaccctgttcgaggaccgcgagatgatcgaggagcgcctgaagacctacgcccacctg2040ttcgacgacaaggtgatgaagcagctgaagcgccgccgctacaccggctggggccgcctg2100agccgcaagcttatcaacggcatccgcgacaagcagagcggcaagaccatcctggacttc2160ctgaagagcgacggcttcgccaaccgcaacttcatgcagctgatccacgacgacagcctg2220accttcaaggaggacatccagaaggcccaggtgagcggccagggcgacagcctgcacgag2280cacatcgccaacctggccggcagccccgccatcaagaagggcatcctgcagaccgtgaag2340gtggtggacgagctggtgaaggtgatgggccgccacaagcccgagaacatcgtgatcgag2400atggcccgcgagaaccagaccacccagaagggccagaagaacagccgcgagcgcatgaag2460cgcatcgaggagggcatcaaggagctgggcagccagatcctgaaggagcaccccgtggag2520aacacccagctgcagaacgagaagctgtacctgtactacctgcagaacggccgcgacatg2580tacgtggaccaggagctggacatcaaccgcctgagcgactacgacgtggaccacatcgtg2640ccccagagcttcctgaaggacgacagcatcgacaacaaggtgctgacccgcagcgacaag2700aaccgcggcaagagcgacaacgtgcccagcgaggaggtggtgaagaagatgaagaactac2760tggcgccagctgctgaacgccaagctgatcacccagcgcaagttcgacaacctgaccaag2820gccgagcgcggcggcctgagcgagctggacaaggccggcttcatcaagcgccagctggtg2880gagacccgccagatcaccaagcacgtggcccagatcctggacagccgcatgaacaccaag2940tacgacgagaacgacaagctgatccgcgaggtgaaggtgatcaccctgaagagcaagctg3000gtgagcgacttccgcaaggacttccagttctacaaggtgcgcgagatcaacaactaccac3060cacgcccacgacgcctacctgaacgccgtggtgggcaccgccctgatcaagaagtacccc3120aagctggagagcgagttcgtgtacggcgactacaaggtgtacgacgtgcgcaagatgatc3180gccaagagcgagcaggagatcggcaaggccaccgccaagtacttcttctacagcaacatc3240atgaacttcttcaagaccgagatcaccctggccaacggcgagatccgcaagcgccccctg3300atcgagaccaacggcgagaccggcgagatcgtgtgggacaagggccgcgacttcgccacc3360gtgcgcaaggtgctgagcatgccccaggtgaacatcgtgaagaagaccgaggtgcagacc3420ggcggcttcagcaaggagagcatcctgcccaagcgcaacagcgacaagctgatcgcccgc3480aagaaggactgggaccccaagaagtacggcggcttcgacagccccaccgtggcctacagc3540gtgctggtggtggccaaggtggagaagggcaagagcaagaagctgaagagcgtgaaggag3600ctgctgggcatcaccatcatggagcgcagcagcttcgagaagaaccccatcgacttcctg3660gaggccaagggctacaaggaggtgaagaaggacctgatcatcaagctgcccaagtacagc3720ctgttcgagctggagaacggccgcaagcgcatgctggccagcgccggcgagctgcagaag3780ggcaacgagctggccctgcccagcaagtacgtgaacttcctgtacctggccagccactac3840gagaagctgaagggcagccccgaggacaacgagcagaagcagctgttcgtggagcagcac3900aagcactacctggacgagatcatcgagcagatcagcgagttcagcaagcgcgtgatcctg3960gccgacgccaacctggacaaggtgctgagcgcctacaacaagcaccgcgacaagcccatc4020cgcgagcaggccgagaacatcatccacctgttcaccctgaccaacctgggcgcccccgcc4080gccttcaagtacttcgacaccaccatcgaccgcaagcgctacaccagcaccaaggaggtg4140ctggacgccaccctgatccaccagagcatcaccggtctgtacgagacccgcatcgacctg4200agccagctgggcggcgactaa42211111406PRT人工序列Cas9pET-Cas9N3T的氨基酸序列111MetGlySerSerHisHisHisHisHisHisValTyrProTyrAspVal151015ProAspTyrAlaGluLeuProProLysLysLysArgLysValGlyIle202530GluAsnLeuTyrPheGlnGlyAspLysLysTyrSerIleGlyLeuAsp354045IleGlyThrAsnSerValGlyTrpAlaValIleThrAspGluTyrLys505560ValProSerLysLysPheLysValLeuGlyAsnThrAspArgHisSer65707580IleLysLysAsnLeuIleGlyAlaLeuLeuPheAspSerGlyGluThr859095AlaGluAlaThrArgLeuLysArgThrAlaArgArgArgTyrThrArg100105110ArgLysAsnArgIleCysTyrLeuGlnGluIlePheSerAsnGluMet115120125AlaLysValAspAspSerPhePheHisArgLeuGluGluSerPheLeu130135140ValGluGluAspLysLysHisGluArgHisProIlePheGlyAsnIle145150155160ValAspGluValAlaTyrHisGluLysTyrProThrIleTyrHisLeu165170175ArgLysLysLeuValAspSerThrAspLysAlaAspLeuArgLeuIle180185190TyrLeuAlaLeuAlaHisMetIleLysPheArgGlyHisPheLeuIle195200205GluGlyAspLeuAsnProAspAsnSerAspValAspLysLeuPheIle210215220GlnLeuValGlnThrTyrAsnGlnLeuPheGluGluAsnProIleAsn225230235240AlaSerGlyValAspAlaLysAlaIleLeuSerAlaArgLeuSerLys245250255SerArgArgLeuGluAsnLeuIleAlaGlnLeuProGlyGluLysLys260265270AsnGlyLeuPheGlyAsnLeuIleAlaLeuSerLeuGlyLeuThrPro275280285AsnPheLysSerAsnPheAspLeuAlaGluAspAlaLysLeuGlnLeu290295300SerLysAspThrTyrAspAspAspLeuAspAsnLeuLeuAlaGlnIle305310315320GlyAspGlnTyrAlaAspLeuPheLeuAlaAlaLysAsnLeuSerAsp325330335AlaIleLeuLeuSerAspIleLeuArgValAsnThrGluIleThrLys340345350AlaProLeuSerAlaSerMetIleLysArgTyrAspGluHisHisGln355360365AspLeuThrLeuLeuLysAlaLeuValArgGlnGlnLeuProGluLys370375380TyrLysGluIlePhePheAspGlnSerLysAsnGlyTyrAlaGlyTyr385390395400IleAspGlyGlyAlaSerGlnGluGluPheTyrLysPheIleLysPro405410415IleLeuGluLysMetAspGlyThrGluGluLeuLeuValLysLeuAsn420425430ArgGluAspLeuLeuArgLysGlnArgThrPheAspAsnGlySerIle435440445ProHisGlnIleHisLeuGlyGluLeuHisAlaIleLeuArgArgGln450455460GluAspPheTyrProPheLeuLysAspAsnArgGluLysIleGluLys465470475480IleLeuThrPheArgIleProTyrTyrValGlyProLeuAlaArgGly485490495AsnSerArgPheAlaTrpMetThrArgLysSerGluGluThrIleThr500505510ProTrpAsnPheGluGluValValAspLysGlyAlaSerAlaGlnSer515520525PheIleGluArgMetThrAsnPheAspLysAsnLeuProAsnGluLys530535540ValLeuProLysHisSerLeuLeuTyrGluTyrPheThrValTyrAsn545550555560GluLeuThrLysValLysTyrValThrGluGlyMetArgLysProAla565570575PheLeuSerGlyGluGlnLysLysAlaIleValAspLeuLeuPheLys580585590ThrAsnArgLysValThrValLysGlnLeuLysGluAspTyrPheLys595600605LysIleGluCysPheAspSerValGluIleSerGlyValGluAspArg610615620PheAsnAlaSerLeuGlyThrTyrHisAspLeuLeuLysIleIleLys625630635640AspLysAspPheLeuAspAsnGluGluAsnGluAspIleLeuGluAsp645650655IleValLeuThrLeuThrLeuPheGluAspArgGluMetIleGluGlu660665670ArgLeuLysThrTyrAlaHisLeuPheAspAspLysValMetLysGln675680685LeuLysArgArgArgTyrThrGlyTrpGlyArgLeuSerArgLysLeu690695700IleAsnGlyIleArgAspLysGlnSerGlyLysThrIleLeuAspPhe705710715720LeuLysSerAspGlyPheAlaAsnArgAsnPheMetGlnLeuIleHis725730735AspAspSerLeuThrPheLysGluAspIleGlnLysAlaGlnValSer740745750GlyGlnGlyAspSerLeuHisGluHisIleAlaAsnLeuAlaGlySer755760765ProAlaIleLysLysGlyIleLeuGlnThrValLysValValAspGlu770775780LeuValLysValMetGlyArgHisLysProGluAsnIleValIleGlu785790795800MetAlaArgGluAsnGlnThrThrGlnLysGlyGlnLysAsnSerArg805810815GluArgMetLysArgIleGluGluGlyIleLysGluLeuGlySerGln820825830IleLeuLysGluHisProValGluAsnThrGlnLeuGlnAsnGluLys835840845LeuTyrLeuTyrTyrLeuGlnAsnGlyArgAspMetTyrValAspGln850855860GluLeuAspIleAsnArgLeuSerAspTyrAspValAspHisIleVal865870875880ProGlnSerPheLeuLysAspAspSerIleAspAsnLysValLeuThr885890895ArgSerAspLysAsnArgGlyLysSerAspAsnValProSerGluGlu900905910ValValLysLysMetLysAsnTyrTrpArgGlnLeuLeuAsnAlaLys915920925LeuIleThrGlnArgLysPheAspAsnLeuThrLysAlaGluArgGly930935940GlyLeuSerGluLeuAspLysAlaGlyPheIleLysArgGlnLeuVal945950955960GluThrArgGlnIleThrLysHisValAlaGlnIleLeuAspSerArg965970975MetAsnThrLysTyrAspGluAsnAspLysLeuIleArgGluValLys980985990ValIleThrLeuLysSerLysLeuValSerAspPheArgLysAspPhe99510001005GlnPheTyrLysValArgGluIleAsnAsnTyrHisHisAlaHisAsp101010151020AlaTyrLeuAsnAlaValValGlyThrAlaLeuIleLysLysTyrPro1025103010351040LysLeuGluSerGluPheValTyrGlyAspTyrLysValTyrAspVal104510501055ArgLysMetIleAlaLysSerGluGlnGluIleGlyLysAlaThrAla106010651070LysTyrPhePheTyrSerAsnIleMetAsnPhePheLysThrGluIle107510801085ThrLeuAlaAsnGlyGluIleArgLysArgProLeuIleGluThrAsn109010951100GlyGluThrGlyGluIleValTrpAspLysGlyArgAspPheAlaThr1105111011151120ValArgLysValLeuSerMetProGlnValAsnIleValLysLysThr112511301135GluValGlnThrGlyGlyPheSerLysGluSerIleLeuProLysArg114011451150AsnSerAspLysLeuIleAlaArgLysLysAspTrpAspProLysLys115511601165TyrGlyGlyPheAspSerProThrValAlaTyrSerValLeuValVal117011751180AlaLysValGluLysGlyLysSerLysLysLeuLysSerValLysGlu1185119011951200LeuLeuGlyIleThrIleMetGluArgSerSerPheGluLysAsnPro120512101215IleAspPheLeuGluAlaLysGlyTyrLysGluValLysLysAspLeu122012251230IleIleLysLeuProLysTyrSerLeuPheGluLeuGluAsnGlyArg123512401245LysArgMetLeuAlaSerAlaGlyGluLeuGlnLysGlyAsnGluLeu125012551260AlaLeuProSerLysTyrValAsnPheLeuTyrLeuAlaSerHisTyr1265127012751280GluLysLeuLysGlySerProGluAspAsnGluGlnLysGlnLeuPhe128512901295ValGluGlnHisLysHisTyrLeuAspGluIleIleGluGlnIleSer130013051310GluPheSerLysArgValIleLeuAlaAspAlaAsnLeuAspLysVal131513201325LeuSerAlaTyrAsnLysHisArgAspLysProIleArgGluGlnAla133013351340GluAsnIleIleHisLeuPheThrLeuThrAsnLeuGlyAlaProAla1345135013551360AlaPheLysTyrPheAspThrThrIleAspArgLysArgTyrThrSer136513701375ThrLysGluValLeuAspAlaThrLeuIleHisGlnSerIleThrGly138013851390LeuTyrGluThrArgIleAspLeuSerGlnLeuGlyGlyAsp139514001405

权利要求:1.II型成簇的规律间隔的短回文重复序列CRISPRCas9组合物,用于修饰植物细胞中的靶DNA,其中靶DNA是内源基因组DNA,其中所述组合物包含:Cas9-向导RNA复合物,其包括:a编码Cas9多肽和核定位信号NLS的核酸,或其上连接有NLS的Cas9多肽;b向导RNA,其中向导RNA是:idual向导RNA,其包含CRISPRRNAcrRNA和反式激活crRNAtracrRNA,crRNA的一部分与靶DNA杂交,其中crRNA和tracrRNA彼此不融合,或者ii单链向导RNAsgRNA,其包含CRISPRRNAcrRNA和反式激活crRNAtracrRNA,crRNA的一部分与靶DNA杂交,其中crRNA和tracrRNA彼此融合;和c用于转染植物细胞的转染缓冲液。2.权利要求1的组合物,其中转染包含聚乙二醇PEG。3.权利要求2的组合物,其中转染缓冲液是40%PEG转染缓冲液。4.权利要求3的组合物,其中40%PEG转染缓冲液包含40%PEG4000,200mM甘露糖醇和100mMCaCl2。5.权利要求1-4中任一项的组合物,其中所述组合物不包含DNA。6.权利要求1-4中任一项的组合物,其中所述组合物不包含外源DNA。7.权利要求1-6中任一项的组合物,其中靶DNA的修饰是在靶DNA中诱导indel。8.权利要求1-7中任一项的组合物,其中Cas9多肽是化脓性链球菌StreptococcuspyogensCas9多肽。9.一种修饰植物细胞中靶DNA的方法,其中靶DNA是内源基因组DNA,所述方法包括:I制备包含Cas9-向导RNA复合物的组合物,其包含:a编码Cas9多肽和核定位信号NLS的核酸,或其上连接有NLS的Cas9多肽,和b向导RNA,其中向导RNA是:idualRNA,其包含CRISPRRNAcrRNA和反式激活crRNAtracrRNA,crRNA的一部分与靶DNA杂交,其中crRNA和tracrRNA彼此不融合,或者ii单链向导RNAsgRNA,其包含CRISPRRNAcrRNA和反式激活crRNAtracrRNA,crRNA的一部分与靶DNA杂交,,其中crRNA和tracrRNA彼此融合;和II使用转染缓冲液将组合物引入植物细胞中以转染植物细胞。10.一种在植物细胞中在靶DNA的不同链中引入两个切口的方法,其中靶DNA是内源基因组DNA,所述方法包括将以下引入植物细胞中:a编码Cas9多肽和核定位信号NLS的核酸,或其上连接有NLS的Cas9多肽,其中Cas9多肽是Cas9切口酶,和b两种向导RNA,其中两种向导RNA中的每一种的一部分与靶DNA的一条链杂交,并且其中向导RNA是:i双向导RNA,其包含CRISPRRNAcrRNA和反式激活crRNAtracrRNA,crRNA的一部分与靶DNA杂交,其中crRNA和tracrRNA彼此不融合,或者ii单链向导RNAsgRNA,其包含CRISPRRNAcrRNA和反式激活crRNAtracrRNA,crRNA的一部分与靶DNA杂交,其中crRNA和tracrRNA彼此融合。

百度查询: 基因工具股份有限公司 用于切割靶DNA的组合物及其用途

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。