买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】热稳定的Cas9核酸酶_瓦赫宁根大学;科学技术基金会_201780086541.2 

申请/专利权人:瓦赫宁根大学;科学技术基金会

申请日:2017-08-16

公开(公告)日:2024-04-09

公开(公告)号:CN110352241B

主分类号:C12N9/22

分类号:C12N9/22;C12N15/113

优先权:["20161214 EP PCT/EP2016/081077"]

专利状态码:有效-授权

法律状态:2024.04.09#授权;2019.11.12#实质审查的生效;2019.10.18#公开

摘要:本发明涉及遗传工程领域,并且更特别地涉及核酸编辑和基因组修饰。本发明提供了一种分离的Cas蛋白或其多肽片段,所述分离的Cas蛋白或其多肽片段具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列。Cas蛋白或多肽能够在20℃和100℃的范围中包括端点的温度结合、裂解、标记或修饰双链靶多核苷酸。本发明还提供了编码所述Cas9核酸酶的分离的核酸分子、表达载体和宿主细胞。本发明还提供了被Cas蛋白或多肽识别的PAM序列。本文所公开的Cas9核酸酶提供了通常用于特别地,在升高的温度进行遗传工程的新型工具。

主权项:1.至少一种靶向RNA分子和Cas蛋白用于结合、裂解、标记或修饰包含靶核酸序列的双链靶多核苷酸的用途,其中:所述双链靶多核苷酸包含靶核酸链和非靶核酸链,所述靶核酸链包含所述靶核酸序列,所述非靶核酸链包含与所述靶核酸序列互补的前间区核酸序列;所述Cas蛋白由SEQIDNO:1的氨基酸序列组成;所述至少一种靶向RNA分子识别所述靶核酸序列;所述非靶核酸链还包含与所述前间区核酸序列的3’末端直接地相邻的前间区相邻基序PAM序列,其中所述PAM序列包含5’-NNNNCNN-3’;其中所述用途是在人类细胞中,并且其中所述人类细胞不是胚胎干细胞,其中所述用途不用于人类治疗。

全文数据:热稳定的Cas9核酸酶发明领域本发明涉及遗传工程geneticengineering领域,并且更特别地涉及核酸编辑和基因组修饰。本发明涉及呈核酸酶的形式的遗传工程工具,所述核酸酶可以被配置用于遗传物质的序列指导的位点特异性结合、切口nicking、切割和修饰;还涉及对遗传物质的序列特异性位点发挥活性特别地,核酸酶活性的核糖核蛋白、以及用于作为标志物使用的修饰的核酸酶和核糖核蛋白。因此,本发明还涉及用于在细胞中递送和表达核酸酶和指导RNAguideRNA的相关的表达构建体。此外,本发明涉及体外或体内的核酸的序列特异性编辑和被用于实现所述编辑的方法。发明背景在2007年首次证明CRISPR-Cas是在许多细菌和大多数古核生物archaea中的适应性免疫系统Barrangou等人,2007,Science315:1709-1712,Brouns等人,2008,Science321:960-964。基于功能和结构标准,迄今已经表征了两类CRISPR-Cas系统,每一类CRISPR-Cas系统包括三种类型,其中大多数使用小RNA分子作为指导guide以靶向互补的DNA序列Makarova等人,2015,NatRevMicrobiol13:722-736;Mahanraju等人,2016,Science353:aad5147。在DoudnaCharpentier实验室的最近的一项研究中,对第2类II型CRISPR-Cas系统的效应酶Cas9进行了彻底的表征,包括证明设计的CRISPRRNA指导具有特定间隔区序列的引入靶向了质粒上的互补序列前间区protospacers,引起该质粒的双链断裂Jinek等人,2012,Science337:816-821。继Jinek等人,2012之后,Cas9被用作用于基因组编辑的工具。Cas9已经被用于工程化一系列真核细胞例如鱼、植物、人类的基因组Charpentier和Doudna,2013,Nature495:50-51。另外,通过选择专门的重组事件,Cas9已经被用于改进细菌中同源重组的产率Jiang等人,2013,NatureBiotechnol31:233-239。为了实现这一点,将毒性片段靶向构建体与携带期望的改变的救援片段编辑构建体,携带点突变或缺失共转染。靶向构建体由Cas9与设计的CRISPR的组合和抗生素抗性标志物组成,定义了在宿主染色体上的期望重组的位点;在对应的抗生素的存在下,选择靶向构建体在宿主染色体中的整合。仅当编辑构建体与宿主染色体上的CRISPR靶位点发生另外的重组时,宿主才可以逃脱自身免疫问题。因此,在抗生素的存在下,仅期望的无标志物的突变体能够存活和生长。还呈现了选择用于随后从染色体去除整合的靶向构建体的相关的策略,生成真正的无标志物突变体。在最近几年,已经建立了CRISPR-Cas介导的基因组编辑构成用于遗传工程的有用的工具。已经建立了原核CRISPR系统作为适应性免疫系统为其宿主服务Jinek等人,2012,Science337:816-821,并且可以被用于快速和有效的遗传工程例如,Mali等人,2013,NatMethods10:957-963,仅需要指导序列的修饰以靶向感兴趣的序列。然而,对开发应用于遗传研究和基因组编辑领域中的在多种实验条件下具有改进的序列特异性核酸检测、裂解和操作的剂仍存在持续的需求。特别地,目前可得的序列特异性基因组编辑工具,包括Cas9,不适用于在所有条件或生物体中使用,例如,序列特异性核酸酶是相对地热敏感的,并且因此不适用于在严格嗜热微生物其能够在41℃与122℃之间生长,并且能够在从45℃至80℃的温度范围中最佳生长,其中极端嗜热菌hyperthermophiles能够在80℃以上最佳生长,例如,在工业发酵中使用的微生物或用于在升高的温度进行的体外实验室过程的微生物中使用。迄今,不存在关于嗜热菌thermophiles中有活性的Cas9蛋白的实验证据。基于由Chylinski等人2014;NucleicAcidsResearch42:6091-61-05对细菌中Cas9的存在的比较基因组筛选,发现II-C型CRISPR-Cas系统仅存在于所有细菌基因组的约3.3%中。在嗜热细菌中,基于统计学分析,II型系统的代表性不足P=0.0019。另外,然而,在古核生物中尚未发现II型系统,这可以可能是由于在古核生物中不存在RNA酶III蛋白参与II型系统。Chylinski等人2014;NucleicAcidsResearch42:6091-6105确实描述了II型CRISPR-Cas系统的分类和演化,特别地,鉴定出了表现出这些系统的两个物种,然而这些物种在55℃最大生长,并且没有表现出严格嗜热生长,其中最佳生长温度为60-80℃,而极端嗜热菌能够在高于80℃最佳地生长。尽管CRISPR-Cas系统在细菌基因组中的稀有性,并且特别是仅在具有低于45℃的最佳生长温度的细菌非古核生物中已经发现Cas9的事实,本发明人已经出乎意料地发现了几种能够在升高的温度进行基因组编辑的热稳定的Cas9变体。本发明人还已经发现了优化的前间区相邻基序protospaceradjacentmotif;PAM序列,该优化的前间区相邻基序PAM序列与热稳定的Cas9变体一起起作用,以使基因组编辑能够在宽范围的温度中进行,包括在升高的温度。这些Cas9核酸酶和通过相关的PAM序列的知识设计的RNA分子,提供了用于在升高的温度进行遗传工程的新型工具,并且在嗜热生物体特别地,微生物的遗传操作中具有特别的价值。最近已经进行了嗜热属即地芽孢杆菌属Geobacillus的系统发育重新评估,结果创建了一个新的属——副地芽孢杆菌属Parageobacillus。因此,先前的地芽孢杆菌属的一些物种已经被系统地重新分配至副地芽孢杆菌属,并且相应地重新命名Aliyu等人,2016SystematicandAppliedMicrobiology39:527-533。成簇的规律地间隔的短回文重复ClusteredRegularlyInterspacedShortPalindromicRepeatsCRISPR和CRISPR相关的Cas蛋白在原核生物中提供了针对入侵的遗传元件的适应性和遗传性免疫Brouns等人Science321,2008;Barrangou等人CRISPRprovidesacquiredresistanceagainstvirusesinprokaryotes.Science315,2007;Wright等人Cell164,29-442016;Mohanraju等人Science353,aad51472016。CRISPR-Cas系统根据其复杂性和特征蛋白被次分配到两类1和2和六个类型I-VI中Makarova等人Nat.Rev.Microbiol.13,722-7362015。第2类系统,包括II型CRISPR-Cas9和V型CRISPR-Cas12a先前被称为CRISPR-Cpf1最近已经被用作用于真核生物Komor等人Cell168,20-362017;Puchta,Curr.Opin.PlantBiol.36,1-82017;Xu等人J.Genet.Genomics42,141-1492015;Tang等人Nat.Plants3,170182017;Zetsche等人Nat.Biotechnol.35,31-342016和原核生物Mougiakos,等人TrendsBiotechnol.34,575-5872016二者的基因组工程工具。这些系统是最简单的CRISPR-Cas系统之一,因为它们引入了基于核糖核蛋白RNP复合体的靶向的双链DNA断裂DSB,该核糖核蛋白RNP复合体由单个Cas核酸内切酶和RNA指导RNAguide形成。迄今为止,酿脓链球菌StreptococcuspyogenesCas9SpCas9是用于基因组工程的最良好表征和最广泛使用的Cas9。尽管已经表征了一些其他的II型系统,但它们都不是来源于嗜热生物体Nakade,等人Bioengineered1-92017.doi:10.108021655979.2017.1282018。这类CRISPR-Cas系统的表征将有助于获得基本的见解以及开发新型应用。虽然基本的遗传工具可用于许多嗜热菌Taylor等人Microb.Biotechnol.4,438-4482011;Olson,等人Curr.Opin.Biotechnol.33,130-1412015;Zeldes,等人Front.Microbiol.6,12092015,这些工具的效率仍然太低以至于不能充分探索和开发这一组有趣的生物体。基于我们发现SpCas9在体内≥42℃不是有活性的,我们先前已经开发了用于兼性嗜热菌的基于SpCas9的工程化工具,该工程化工具组合了在升高的温度的同源重组和在中等温度的基于SpCas9的反选择counter-selectionMougiakos等人ACSSynth.Biol.6,849-8612017。然而,用于专性嗜热菌的基于Cas9的编辑和沉默工具还不可得,因为SpCas9在42℃或42℃以上不具有活性Mougiakos等人ACSSynth.Biol.6,849-8612017并且迄今为止尚未表征嗜热Cas9。发明概述本发明人已经发现并且表征了ThermoCas9:一种来自嗜热细菌热脱氮地芽孢杆菌GeobacillusthermodenitrificansT12的CRISPR-CasIIC型系统的RNA指导的DNA核酸内切酶。本发明人已经出乎意料地显示出其在宽的温度范围中的体外活性,证明了sgRNA结构对于热稳定性的重要性,并且跨越宽的温度范围应用了ThermoCas9用于体内基因组编辑。因此,本发明提供了分离的成簇的规律地间隔的短回文重复clusteredregularlyinterspacedshortpalindromicrepeat,CRISPR相关的Cas蛋白或多肽,所述分离的成簇的规律地间隔的短回文重复CRISPR相关的Cas蛋白或多肽包含;a.氨基酸基序EKDGKYYC[SEQIDNO:2];和或b.氨基酸基序X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和或c.氨基酸基序X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和或d.氨基酸基序X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和或e.氨基酸基序X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。为避免疑问,本发明的蛋白、多肽或编码Cas蛋白的核酸也可以被称为“GtCas9”或“ThermoCas9”。“GtCas9”和“ThermoCas9”在整个说明书中可互换地被使用,并且具有相同的含义。在本发明的上下文中的多肽可以被视作全长Cas蛋白的片段。这类片段可以是失活的并且以与结合、编辑和或切割遗传物质不直接地相关的方式和目的使用,例如用于测定中的标准物或产生抗体等。然而,在优选的实施方案中,Cas蛋白或多肽是有功能的并且当与至少一种靶向RNA分子和包含被靶向RNA分子识别的靶核酸序列的多核苷酸缔合时能够在20℃与100℃的范围中包括端点的温度进行裂解、结合、标记或修饰。优选地,Cas蛋白或多肽是有功能的,并且能够在50℃和70℃的范围中的温度,例如55℃或60℃的温度进行所述裂解、结合、标记或修饰。在特定实施方案中,本发明可以提供包含氨基酸基序EKDGKYYC[SEQIDNO:2]的Cas蛋白或多肽。在其他实施方案中,Cas蛋白或多肽还可以包含氨基酸基序X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一。在其他实施方案中,本文定义的Cas蛋白或多肽还可以另外地包含氨基酸基序X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺。在其他实施方案中,本文定义的Cas蛋白或多肽还可以另外地包含氨基酸基序X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一。在其他实施方案中,本文定义的Cas蛋白或多肽还可以另外地包含氨基酸基序X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。根据本发明,可以理解的是,本发明的Cas蛋白或多肽可以包含单独的或以组合方式的SEQIDNO:2至6的任何基序。以下总结了可以表征本发明的Cas蛋白或多肽的基序的每一个组合:EKDGKYYC[SEQIDNO:2]。EKDGKYYC[SEQIDNO:2];和X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一。EKDGKYYC[SEQIDNO:2];和X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺。EKDGKYYC[SEQIDNO:2];和X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一。EKDGKYYC[SEQIDNO:2];和X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。EKDGKYYC[SEQIDNO:2];和X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。EKDGKYYC[SEQIDNO:2];和X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。EKDGKYYC[SEQIDNO:2];和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。EKDGKYYC[SEQIDNO:2];和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺。EKDGKYYC[SEQIDNO:2];和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一。EKDGKYYC[SEQIDNO:2];和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。EKDGKYYC[SEQIDNO:2];和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一。EKDGKYYC[SEQIDNO:2];和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。EKDGKYYC[SEQIDNO:2];和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺。X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一。X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一。X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一。X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸。在另一方面中,本发明提供了分离的Cas蛋白或其多肽片段,所述分离的Cas蛋白或其多肽片段具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列,其中Cas蛋白或其多肽片段包含单独或以组合方式的任何下列基序或氨基酸:RuvC-I结构域,所述RuvC-I结构域包含IGLDIGITSIG[SEQIDNO:23],优选地IGLDIGITSIGWAVINLD[SEQIDNO:24];桥Bridge结构域,所述桥结构域包含RSARR[SEQIDNO:25],优选地PRRLARSARRRLRRRKHRLERIRRL[SEQIDNO:26];和或α螺旋识别叶lobe结构域,所述α螺旋识别叶结构域包含WQLR[SEQIDNO:27];和或α螺旋识别叶结构域,所述α螺旋识别叶结构域包含HLAKRRG[SEQIDNO:28],优选地LARILLHLAKRRG[SEQIDNO:29];和或α螺旋识别叶结构域,所述α螺旋识别叶结构域包含IFAKQ[SEQIDNO:30],优选地EIKLIFAKQ[SEQIDNO:31];和或α螺旋识别叶结构域,所述α螺旋识别叶结构域包含IWASQR[SEQIDNO:32];和或KVGFCTFEPKEKRAPK[SEQIDNO:33];和或FTVWEHINKLRL[SEQIDNO:34];和或RuvC-II结构域,所述RuvC-II结构域包含IANPVVMRALTQ[SEQIDNO:35]基序,优选地IANPVVMRALTQARKVVNAIIKKYG[SEQIDNO:36]基序;和或RuvC-II结构域,所述RuvC-II结构域包含ELAR[SEQIDNO:37]基序,优选地IHIELARE[SEQIDNO:38]基序;和或HNH结构域,所述HNH结构域包含QNGKCAY[SEQIDNO:39]基序,优选地IVKFKLWSEQNGKCAY[SEQIDNO:40]基序;和或HNH结构域,所述HNH结构域包含VDHVIP[SEQIDNO:41]基序,优选地VDHVIPYSRSLDDSYTNKVL[SEQIDNO:42]基序;和或RuvC-III结构域,所述RuvC-III结构域包含DTRYISRFLAN[SEQIDNO:43]基序;和或RuvC-III结构域,所述RuvC-III结构域包含VYTVNGRITAHLRSRW[SEQIDNO:44]基序;和或RuvC-III结构域,所述RuvC-III结构域包含HHAVDA[SEQIDNO:45]基序,优选地HHAVDAAIVA[SEQIDNO:46]基序;和或优选地,本发明提供了分离的Cas蛋白或其多肽片段,所述分离的Cas蛋白或其多肽片段具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列,其中Cas蛋白或其多肽片段以组合方式包含氨基酸基序[SEQIDNO:23]至[SEQIDNO:46]的每一个氨基酸基序。在另一方面中,本发明提供了分离的Cas蛋白或其多肽片段,所述分离的Cas蛋白或其多肽片段具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列。优选地,Cas蛋白或多肽能够在20℃和100℃的范围中包括端点的温度进行结合、裂解、标记或修饰。优选地,Cas蛋白或多肽能够在20℃和70℃之间的范围中,例如25℃、55℃、60℃或65℃的温度进行所述裂解、结合、标记或修饰。优选地,Cas蛋白或多肽能够在50℃和70℃之间的范围中的温度,例如55℃或60℃的温度进行所述裂解、结合、标记或修饰。优选地,Cas蛋白或多肽能够在30℃和80℃之间的范围中的温度、37℃和78℃之间的温度,优选地55℃以上的温度;更优选地55℃和80℃之间的温度;甚至更优选地55℃和65℃之间的温度或60℃和65℃之间的温度进行所述裂解、结合、标记或修饰。本发明还提供了本文提供的靶向RNA分子和Cas蛋白或多肽用于结合、裂解、标记或修饰包含靶核酸序列的靶多核苷酸的用途。靶向RNA分子识别多核苷酸的靶核酸链上的靶核酸序列。包含靶核酸序列的靶多核苷酸可以是双链的,并且因此包含靶核酸链和非靶核酸链,该靶核酸链包含所述靶核酸序列,该非靶核酸链包含前间区核酸序列。前间区核酸序列与靶核酸序列实质上互补,并且在双链靶多核苷酸中与其配对。非靶核酸链还可以包含与前间区序列的3’末端直接地相邻的前间区相邻基序PAM序列。PAM序列的长度可以是至少6个、7个或8个核酸。优选地,PAM序列在第五个位置中具有胞嘧啶。优选地,PAM序列包含序列5’-NNNNC-3’,使得PAM序列从5’-末端以5’-NNNNC-3’开始。另外地或可选地,PAM序列可以在第八个位置中具有腺嘌呤,使得PAM序列包含序列5’-NNNNNNNA-3’,并且从5’-末端PAM序列以5’-NNNNNNNA-3’开始。另外地或可选地,PAM序列可以在第一个、第二个、第三个、第四个和第六个位置的一个或更多个位置中具有胞嘧啶,使得PAM序列从5’-末端以5’-CNNNN-3’、5’-NCNNN-3’、5’-NNCNN-3’、5’-NNNCN-3’、和或5’-NNNNNC-3’开始。任选地,PAM序列包含5’-CCCCCCNA-3’[SEQIDNO:10],使得PAM序列从5’-末端以5’-CCCCCCNA-3’[SEQIDNO:10]开始,并且进一步优选地,PAM序列包含5’-CCCCCCAA-3’[SEQIDNO:11],使得PAM序列从5’-末端以5’-CCCCCCAA-3’[SEQIDNO:11]开始。其他优选的PAM序列包括5’-ATCCCCAA-3’[SEQIDNO:21]和5’-ACGGCCAA-3’[SEQIDNO:22]。优选地,Cas蛋白或多肽能够在40℃至80℃的范围包括端点中的温度,优选地在45℃至80℃的范围包括端点中的温度,并且进一步优选地在50℃至80℃的范围包括端点中的温度进行结合、裂解、标记或修饰。例如,结合、裂解、标记或修饰发生在45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃或80℃的温度。更优选地,Cas蛋白或多肽能够在55℃至65℃的范围中的温度进行结合、裂解、标记或修饰。在优选的方面中,本发明的Cas蛋白或多肽片段可以包含与SEQIDNO:1具有至少75%同一性;优选地至少85%;更优选地至少90%;甚至更优选地至少95%同一性的氨基酸序列。Cas蛋白或多肽可以与识别靶核酸链上的靶核酸序列的靶向RNA分子组合使用,其中非靶核酸序列具有与在非靶链上的前间区序列的3’末端直接地相邻的PAM序列,如本文所公开的。因此,PAM序列可以包含序列5’-NNNNC-3’,并且Cas蛋白可以在20℃和100℃的范围包括端点中的温度,优选地30℃和90℃的范围包括端点中的温度,在37℃和78℃的范围包括端点中的温度、在40℃和80℃的范围包括端点中的温度、在50℃和70℃的范围包括端点中的温度、或在55℃和65℃的范围包括端点中的温度结合、裂解、标记或修饰靶链。优选地,PAM序列从5’-末端以5’-NNNNC-3’开始,并且Cas蛋白可以在20℃和100℃的范围包括端点中的温度,优选地30℃和90℃的范围包括端点中的温度,在37℃和78℃的范围包括端点中的温度、在40℃和80℃的范围包括端点中的温度、在50℃和70℃的范围包括端点中的温度、或在55℃和65℃的范围包括端点中的温度结合、裂解、标记或修饰靶链。优选地,PAM序列从5’-末端以5’-NNNNNNNA-3’开始,并且Cas蛋白可以在20℃和100℃的范围包括端点中的温度,优选地30℃和90℃的范围包括端点中的温度,在37℃和78℃的范围包括端点中的温度、在40℃和80℃的范围包括端点中的温度、在50℃和70℃的范围包括端点中的温度、或55℃和65℃的范围包括端点中的温度结合、裂解、标记或修饰靶链。还优选地,PAM序列的5’-末端以5’-NNNNCNNA-3’[SEQIDNO:47]开始,并且Cas蛋白可以在20℃和100℃的范围包括端点中的温度,优选地在30℃和90℃的范围包括端点中的温度,在37℃和78℃的范围包括端点中的温度、在40℃和80℃的范围包括端点中的温度、在50℃和70℃的范围包括端点中的温度、或在55℃和65℃的范围包括端点中的温度结合、裂解、标记或修饰靶链。更特别地,本发明的Cas蛋白或多肽可以包含与SEQIDNO:1具有如下同一性百分比的氨基酸序列:至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或至少99.8%。同一性百分比可以是至少89%。同一性百分比可以是至少90%。优选地,同一性百分比将是至少95%,例如98%。与SEQIDNO:1的氨基酸序列同一性百分比是根据在选定的比较窗口中的序列共享的相同的位置的数目,考虑到需要被引入用于两个序列的最佳比对的空位的数目和每一个空位的长度可确定的。本发明的Cas蛋白或多肽片段可以根据参考序列SEQIDNO:1和其如由序列同一性百分比定义的任何上文提及的百分比变体二者,单独地或与任何上文提及的氨基酸基序即SEQIDNO:2和或SEQIDNO:3和或SEQIDNO:4和或SEQIDNO:5和或SEQIDNO:6组合作为基本特征来表征。本发明提供了如本文提供的靶向RNA分子和本发明的Cas蛋白或多肽用于结合、裂解、标记或修饰包含靶核酸序列的靶核酸链的用途。优选地,所述结合、裂解、标记或修饰发生在本文所公开的温度,例如20℃和100℃之间的温度。本发明还提供了结合、裂解、标记或修饰靶核酸链中的靶核酸序列的方法,包括设计如本文提供的靶向RNA分子和形成包含该靶向RNA分子和本发明的Cas蛋白或多肽的核糖核蛋白复合体。优选地,核糖核蛋白复合体在本文公开的温度,例如在37℃和100℃之间的温度结合、裂解、标记或修饰靶核酸序列。本发明的用途和方法可以在体内例如在人类细胞中进行,并且本发明的核蛋白可以在体内例如在人类细胞中形成和使用。任选地,本发明的用途和方法可以在体内例如在不是胚胎干细胞的人类细胞中进行,并且本发明的核蛋白可以在体内例如在不是胚胎干细胞的人类细胞中形成和使用。任选地,本发明的用途和方法可以在体内例如在人类细胞中在不涉及改变人类的生殖系遗传同一性germlinegeneticidentity的方法中使用,并且本发明的核蛋白可以在体内例如在人类细胞中在不涉及改变人类的生殖系遗传同一性的方法中形成和使用。可选地,本发明的用途和方法可以在体外进行,并且本发明的核蛋白可以在体外形成和使用。本发明的Cas蛋白可以以分离的形式被提供,例如当在体外使用时或当通过转染添加至细胞时,Cas蛋白可以例如在通过编码Cas蛋白的核酸瞬时或稳定转化细胞后被异源表达,靶向RNA分子可以在细胞通过编码RNA分子的核酸瞬时或稳定转化后从表达载体转录,和或RNA分子可以以分离的形式被提供,例如当在体外使用时或当通过转染添加至细胞时。在优选的实施方案中,在编码Cas蛋白或多肽的核酸在宿主细胞的基因组中稳定整合后,Cas蛋白或多肽从宿主细胞的基因组表达。因此,使用用于将蛋白或核酸分子添加至细胞否则在细胞中,该蛋白或核酸分子不存在的任何人工或人为的方法,Cas蛋白和或RNA分子可以被添加至体内或体外环境。包含靶核酸序列的多核苷酸可以被Cas蛋白裂解,并且任选地裂解可以是DNA裂解。包含靶序列的靶核酸链可以是双链DNA,并且方法或用途可以引起包含靶核酸序列的多核苷酸中的双链断裂。包含靶核酸序列的多核苷酸可以是双链DNA,Cas蛋白可以缺乏切割双链DNA的能力,并且用途或方法可以引起多核苷酸的基因沉默。Cas蛋白或多肽可以以250nM或更低的浓度,例如以200nM或更低、150nM或更低、100nM或更低、50nM或更低、25nM或更低、10nM或更低、5nM或更低、1nM或更低或0.5nM或更低的浓度被提供用于本发明的方法、用途和核蛋白。可选地,Cas蛋白或多肽可以以至少0.5nM、至少1nM、至少5nM、至少10nM、至少25nM、至少50nM、至少100nM、至少150nM、至少200nM或至少250nM的浓度被提供。本发明的PAM序列可以在第八个位置中具有腺嘌呤,使得PAM序列包含序列5’-NNNNNNNA-3’,并且Cas蛋白或多肽的浓度可以是100nM或更低、50nM或更低、25nM或更低、10nM或更低、5nM或更低、1nM或更低或0.5nM或更低。PAM序列可以包含序列5’-NNNNCNNA-3’[SEQIDNO:47],并且Cas蛋白或多肽的浓度可以是100nM或更低、50nM或更低、25nM或更低、10nM或更低、5nM或更低、1nM或更低或0.5nM或更低。PAM序列可以包含序列5’-CCCCCCNA-3’[SEQIDNO:10],并且Cas蛋白或多肽的浓度可以是100nM或更低、50nM或更低、25nM或更低、10nM或更低、5nM或更低、1nM或更低或0.5nM或更低。此外,本发明提供了编码本发明的任何上文提及的蛋白或多肽的核酸。核酸可以是分离的或呈表达构建体的形式。在本发明的所有上文提及的方面中,氨基酸残基可以被保守取代或非保守取代。保守氨基酸取代是指其中氨基酸残基被取代为具有类似化学特性例如,电荷或疏水性的其他氨基酸残基并且因此不改变所得多肽的功能特性的那些氨基酸取代。类似地,本领域普通技术人员将理解,核酸序列可以被保守或非保守取代,而不影响多肽的功能。保守修饰的核酸是被取代为编码氨基酸序列的相同或功能上相同的变体的核酸的那些核酸。本领域的读者将理解,核酸中的每一个密码子除了AUG和UGG;通常,分别是甲硫氨酸或色氨酸的唯一密码子可以被修饰以产生功能上相同的分子。因此,编码本发明的多肽的多核苷酸或多肽的每一个沉默变体即同义密码子隐含在每一个描述的多肽序列中。本发明提供了经转化的人类细胞,该经转化的人类细胞具有在双链靶多核苷酸中的靶核酸序列,所述细胞包含如本文提供的Cas蛋白或多肽和至少一种如本文提供的靶向RNA分子、和表达载体,所述表达载体包含编码所述Cas蛋白和所述靶向RNA分子中的至少一种的核酸。任选地,经转化的人类细胞是分离的人类细胞。任选地,人类细胞不是胚胎干细胞。如本文所公开的,Cas蛋白和靶向RNA分子可以使得结合、裂解、标记或修饰靶序列能够在升高的温度或在例如37℃和100℃之间的温度的范围,在经转化的细胞中发生,或允许结合、裂解、标记或修饰靶序列在升高的温度或在例如37℃和100℃之间的温度范围在经转化的细胞中发生。本发明还提供了结合、裂解、标记或修饰人类细胞中的靶核酸的方法,包括1用表达载体转化、转染或转导细胞,所述表达载体包含编码本发明的Cas蛋白或多肽的核苷酸序列和编码本发明的靶向RNA分子的核苷酸序列;或2用表达载体和另外的表达载体转化、转染或转导细胞,所述表达载体包含编码本发明的Cas蛋白或多肽的核苷酸序列,所述另外的表达载体包含编码本发明的靶向RNA分子的核苷酸序列;或3用表达载体转化、转染或转导细胞,所述表达载体包含编码本发明的Cas蛋白或多肽的核苷酸序列,和将如本文提供的靶向RNA分子递送至细胞或递送到细胞中。Cas蛋白或多肽可以例如在编码Cas蛋白或多肽的核苷酸序列稳定整合到基因组中后从经转化的细胞的基因组表达。任选地,人类细胞不是胚胎干细胞。任选地,该方法不涉及改变人类的生殖系遗传同一性。本发明还提供包含一种或更多种试剂的试剂盒,所述试剂盒用于实施本发明的用途和方法,或用于产生本发明的经转化的人类细胞或核蛋白复合体,所述试剂盒包含:本发明的Cas蛋白或多肽或包含编码本发明的Cas蛋白或多肽的核酸序列的表达载体;和或本发明的靶向RNA分子或包含编码本发明的靶向RNA分子的核酸序列的表达载体。试剂盒还可以包括实施本发明的说明书,例如如何设计根据本发明的靶向RNA分子的说明。RNA指导RNAGuides和靶序列本发明的Cas蛋白允许在升高的温度对靶核酸进行序列特异性结合、裂解、加标签、标记或修饰。靶核酸可以是DNA单链或双链、RNA或合成的核酸。本发明的特别有用的应用是通过与一种或更多种指导RNAgRNA呈复合体形式的本发明的一种或更多种Cas蛋白对基因组DNA进行序列特异性靶向和修饰,所述一种或更多种指导RNAgRNA与基因组DNA的靶向的序列互补地结合。因此,靶核酸优选地是双链DNA。这类靶向可以在体外或体内进行。优选地,这类靶向在体内进行。以该方式,本发明的Cas蛋白可以被用于靶向和修饰位于人类细胞的基因组DNA中的特定DNA序列。设想了Cas系统可以被用于修饰多种细胞类型中和或不同生物体中的基因组。任选地,本发明的Cas蛋白和系统可以被用于修饰多种人类细胞类型的基因组,特别地除了胚胎干细胞之外的分离的人类细胞的基因组。gRNA,也被称为靶向RNA分子,识别多核苷酸靶链上的靶核酸序列。RNA分子可以被设计为识别双链靶多核苷酸中的靶序列,其中非靶链包含与前间区序列的3’末端直接地相邻的前间区相邻基序PAM序列。本文公开了以最佳方式与本发明的Cas蛋白和多肽一起起作用的PAM序列。在具有这些PAM序列知识的情况下,gRNA可以被设计用于与本发明的Cas蛋白和多肽一起跨越本发明的温度范围和增加的温度使用。因此,本发明提供了核糖核蛋白复合体,所述核糖核蛋白复合体包含如上文描述的本发明的Cas蛋白或多肽,并且还包含至少一种RNA分子,所述至少一种RNA分子由于识别靶多核苷酸中的特定核苷酸序列而具有靶向功能。本发明还提供了至少一种靶向RNA分子和Cas蛋白或多肽用于结合、裂解、标记或修饰靶核酸链的用途,和使用本发明的核糖核蛋白或核蛋白结合、裂解、标记或修饰靶核酸链中的靶核酸序列的方法,以及具有Cas蛋白或多肽和靶向RNA分子的经转化的人类细胞。根据本文提供的PAM序列,靶多核苷酸还可以包含与前间区序列的3’末端直接地相邻的定义的PAM序列。PAM序列的长度可以是6个、7个或8个核酸,或更长,优选地8个核酸。优选地,RNA分子是单链RNA分子,例如CRISPRRNAcrRNA,并且例如通过杂交与tracrRNA缔合。靶向RNA可以是crRNA和tracrRNA的嵌合体。上文提及的RNA分子可以具有与靶核苷酸序列具有至少90%同一性或互补性的靶核苷酸序列。任选地,RNA分子具有与靶核苷酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性或互补性的靶核苷酸序列。优选的靶核苷酸序列是DNA。任选地,至少一种靶向RNA分子和Cas蛋白或多肽用于结合、裂解、标记或修饰靶核酸链的用途,和使用本发明的核糖核蛋白或核蛋白结合、裂解、标记或修饰靶核酸链中的靶核酸序列的方法,可以被用于人类细胞中。任选地,人类细胞将是分离的。任选地,人类细胞不是胚胎干细胞。任选地,本发明的Cas蛋白或多肽或核糖核蛋白或核蛋白将不被用于改变人类的生殖系遗传同一性。在优选的方面中,本发明提供了如上文描述的核糖核蛋白复合体,其中至少一种靶向RNA分子沿其长度与靶DNA序列基本上互补。靶向RNA分子可以在核蛋白复合体中与靶序列结合或缔合,使得包含靶序列的靶多核苷酸和在非靶链上的PAM序列可以与本发明的核蛋白复合体缔合并且因此形成本发明的核蛋白复合体的一部分。因此,与本发明的Cas蛋白缔合的RNA指导的序列的改变允许Cas蛋白被编程为在与指导RNA互补的位点处标记或切割双链DNA。优选地,在本发明的核糖核蛋白复合体中的至少一种靶向RNA分子的长度在35个至135个残基的范围中,任选地在以下范围中:35个至134个残基、35个至133个残基、35个至132个残基、35个至131个残基、35个至130个残基、35个至129个残基、35个至128个残基、35个至127个残基、35个至126个残基、35个至125个残基、35个至124个残基、35个至123个残基、35个至122个残基、35个至121个残基、35个至120个残基、35个至119个残基、35个至118个残基、35个至117个残基、35个至116个残基、35个至115个残基、35个至114个残基、35个至113个残基、35个至112个残基、35个至111个残基、35个至100个残基、35个至109个残基、35个至108个残基、35个至107个残基、35个至106个残基、35个至105个残基、35个至104个残基、35个至103个残基、35个至102个残基、35个至101个残基、35个至100个残基、35个至99个残基、35个至98个残基、35个至97个残基、35个至96个残基、35个至95个残基、35个至94个残基、35个至93个残基、35个至92个残基、35个至91个残基、35个至90个残基、35个至89个残基、35个至88个残基、35个至87个残基、35个至86个残基、35个至85个残基、35个至84个残基、35个至83个残基、35个至82个残基、35个至81个残基、35个至80个残基、35个至79个残基、35个至78个残基、35个至77个残基、35个至76个残基、35个至75个残基、35个至74个残基、35个至73个残基、35个至72个残基、35个至71个残基、35个至70个残基、35个至69个残基、35个至68个残基、35个至67个残基、35个至66个残基、35个至65个残基、35个至64个残基、35个至63个残基、35个至62个残基、35个至61个残基、35个至60个残基、35个至59个残基、35个至58个残基、35个至57个残基、35个至56个残基、35个至55个残基、35个至54个残基、35个至53个残基、35个至52个残基、35个至51个残基、35个至50个残基、35个至49个残基、35个至48个残基、35个至47个残基、35个至46个残基、35个至45个残基、35个至44个残基、35个至43个残基、35个至42个残基、35个至41个残基、35个至40个残基、35个至39个残基、35个至38个残基、35个至37个残基、35个至36个残基或35个残基。优选地,至少一种RNA分子的长度在以下范围中:36个至174个残基、37个至173个残基、38个至172个残基、39个至171个残基、40个至170个残基、41个至169个残基、42个至168个残基、43个至167个残基、44个至166个残基、45个至165个残基、46个至164个残基、47个至163个残基、48个至162个残基、49个至161个残基、50个至160个残基、51个至159个残基、52个至158个残基、53个至157个残基、54个至156个残基、36个至74个残基、37个至73个残基、38个至72个残基、39个至71个残基、40个至70个残基、41个至69个残基、42个至68个残基、43个至67个残基、44个至66个残基、45个至65个残基、46个至64个残基、47个至63个残基、48个至62个残基、49个至61个残基、50个至60个残基、51个至59个残基、52个至58个残基、53个至57个残基、54个至56个残基。在优选的方面中,本发明提供了核糖核蛋白复合体,其中至少一种RNA分子的互补部分是至少30个残基长。可选地,至少一种RNA分子的互补部分可以是31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个或75个残基长。靶向RNA分子将优选地要求对于靶核酸序列的高特异性和亲和力。在1μM至1pM,优选地1nM至1pM;更优选地1pM-100pM的范围中的解离常数Kd是期望的,如可以通过非变性凝胶电泳nativegelelectrophoresis或可选地等温滴定量热法、表面等离子体共振或基于荧光的滴定方法来确定。亲和力可以使用电泳迁移率变动测定EMSA来确定,所述电泳迁移率变动测定也被称为凝胶阻滞测定参见Semenova等人2011PNAS108:10098-10103。靶向RNA分子优选地在从原核生物自然界已知作为CRISPRRNAcrRNA分子的分子上建模modeled。crRNA分子的结构已经被建立并且在Jore等人,2011,NatureStructural&MolecularBiology18:529-537中更详细地解释。简而言之,I-E型的成熟crRNA通常是61个核苷酸长,并且由8个核苷酸的5’“手柄”区域、32个核苷酸的“间隔区”序列和21个核苷酸的3’序列组成,所述21个核苷酸的3’序列形成具有四核苷酸环的发夹图5。I型系统不同于II型Cas9系统,并且不同的系统的详细内容在VanderOost2014NatRevMicr12:479-492中被描述。II型Cas9系统中,存在不同的处理机制,使用第二种RNAtracrRNA和两种核糖核酸酶。在II型中的成熟的crRNA保持与tracrRNA片段附接而非发夹图5。然而,本发明中使用的RNA不必严格遵循天然存在的crRNA的设计被设计,无论是长度、区域还是特定的RNA序列。但明确的是,用于在本发明中使用的RNA分子可以基于公共数据库中的或新发现的基因序列信息来设计,并且然后人工制备,例如通过完全或部分化学合成。本发明的RNA分子还可以被设计并通过在遗传修饰的细胞或无细胞表达系统中表达的方式产生,并且这种选择可以包括合成一些或所有的RNA序列。II型Cas9中的crRNA的结构和要求也已经在Jinek等人,2012同上中被描述。在I型中,存在所谓的“种子SEED”部分形成间隔区序列的5’末端并且其5’侧翼为8个核苷酸的5’手柄。Semenova等人2011,PNAS108:10098-10103已经发现种子序列的所有残基均应该与靶序列互补,尽管对于在位置6处的残基可以容忍错配图5。在II型中,存在位于间隔区的3’末端处的10-12个核苷酸的种子图5由VanderOost2014同上综述。类似地,当设计和制备针对靶基因座即序列处的本发明的核糖核蛋白复合体的RNA组分时,可以应用用于II型种子序列的必要匹配和错配规则。因此,本发明包括检测和或定位靶核酸分子中的单个碱基变化的方法,所述方法包括使核酸样品与如上文描述的本发明的核糖核蛋白复合体或与如上文描述的本发明的Cas蛋白或多肽和单独的靶向RNA组分接触,并且其中靶向RNA的序列包括当在核糖核蛋白复合体中时使得通过在例如8个核苷酸残基的连续序列的位置6处的单个碱基变化区分正常等位基因和突变等位基因。不希望受特定理论束缚,可以被用于制备本发明的核糖核蛋白复合体的靶向RNA组分的设计规则涉及双链靶多核苷酸中的所谓“PAM”前间区相邻基序序列。在大肠杆菌E.coli的I-E型系统中,PAM序列可以是保守的核苷酸残基三联体,诸如5’-CTT-3’、5’-CAT-3’、5’-CCT-3’、5’-CAC-3’、5’-TTT-3’、5’-ATT-3’、和5’-AWG-3’,其中W是A、T或U。在I型中,位于靶向的链中的PAM序列通常在对应于种子的5’的位置处。然而,在II型中,PAM位于靠近crRNA间隔区的3’末端的置换链或非靶链的另一末端处,在对应于种子的3’的位置处图5Jinek等,2012,同上。对于酿脓链球菌StreptococcuspyogenesCas9,PAM序列具有保守的核苷酸残基对5’-NGG-3’。最近,已经表征了不同的Cas9变体IIA型和IIC型Ran等人,2015Nature520:186-191-图1A,并且已经揭示了PAM参见Ran等人,2015,同上-图1C。目前建立的Cas9PAM包括:IIA型5’-NGGNNNN-3’酿脓链球菌、5’-NNGTNNN-3’巴氏链球菌Streptococcuspasteurianus、5’-NNGGAAN-3’嗜热链球菌Streptococcusthermophilus、5’-NNGGGNN-3’金黄色葡萄球菌Staphylococcusaureus,和IIC型5’-NGGNNNN-3’白喉棒杆菌Corynebacteriumdiphtheriae、5’-NNGGGTN-3’红嘴鸥弯曲杆菌Campylobacterlari、5’-NNNCATN-3’Parvibaculumlavamentivorans、5’-NNNNGTA-3’灰色奈瑟菌Neisseriacinerea。热脱氮地芽孢杆菌T12的Cas9本发明属于IIC型Ran等人,2015,同上。本发明人已经出乎意料地发现,用于与本发明一起使用的PAM序列的选择可以影响其中本发明的Cas蛋白和多肽将与靶序列相互作用的一种或更多种温度。特别地,本发明人已经发现优选8聚体8-merPAM序列以跨越宽的温度范围赋予活性,其中胞嘧啶在靶序列3’末端后的第5个位置中,和或腺嘌呤在第8个位置中。在前间区序列的3’末端后,在PAM序列的第1个、第2个、第3个、第4个和或第6个位置中也存在对于胞嘧啶的偏好。在特定方面中,通过使用5’-NNNNCVAA-3’[SEQIDNO:48]的PAM序列,可以实现在例如20℃至100℃的宽的温度范围中、20℃至80℃的宽的温度范围中、30℃至80℃的宽的温度范围中、20℃至70℃的宽的温度范围中或25℃至65℃的宽的温度范围中与靶序列的相互作用。前4个PAM位置不存在特定的偏好。因此,前4个核苷酸可以方便地是任何核苷酸NNNN。优选地,可以通过利用5’-NNNNCSAA-3’[SEQIDNO:49]的PAM序列来实现在这类宽的温度范围中的与靶序列的相互作用。最佳地,PAM可以具有序列5’-NNNNCGAA-3’[SEQIDNO:50]或5’-NNNNCCAA-3’[SEQIDNO:51]。当需要在≥30℃,例如30℃至100℃的范围中,优选地在30℃至70℃的范围中,30℃至65℃的范围中或45℃至65℃的范围中与靶序列相互作用时,PAM序列可以最佳地具有序列5’-NNNNCNAA-3’[SEQIDNO:52]或5’-NNNNCMCA-3’[SEQIDNO:53]。前4个PAM位置不存在特定的偏好。因此,前4个核苷酸可以方便地是任何核苷酸NNNN。任选地,例如,PAM序列可以是5’-CCCCCNAA-3’或5’-CCCCCMCA-3’。任选地,例如,PAM序列可以选自5’-CCCCCAAA-3’、5’-CCCCCATA-3’、5’-CCCCCAGA-3’、5’-CCCCCACA-3’、5’-CCCCCTAA-3’、5’-CCCCCTTA-3’、5’-CCCCCTGA-3’、5’-CCCCCTCA-3’、5’-CCCCCGAA-3’、5’-CCCCCGTA-3’、5’-CCCCCGGA-3’、5’-CCCCCGCA-3’、5’-CCCCCCAA-3’[SEQIDNO:11]、5’-CCCCCCTA-3’、5’-CCCCCCGA-3’或5’-CCCCCCCA-3’。在本发明的实施方案中,靶向RNA分子可以具有在35个-200个残基范围中的长度。在优选的实施方案中,与期望的核酸序列互补的并且被用于靶向期望的核酸序列的RNA的部分是从15个至32个残基长。在天然存在的crRNA的情况中,这将对应于如例如在Semenova等人2011同上的图1中显示出的间隔区部分。本发明的核糖核蛋白复合体可以具有包含位于RNA序列5’的来源于CRISPR重复的8个残基的靶向组分,该RNA序列与DNA靶序列具有实质的互补性。与DNA靶序列具有互补性的RNA序列将被理解为对应于在crRNA的情况中作为间隔区序列。RNA的5’侧翼序列将被认为对应于crRNA的5’手柄;如例如在Semenova等人2011同上的图1中显示出的。本发明的核糖核蛋白复合体可以具有位于与DNA靶序列具有互补性的靶向RNA序列3’的发夹和四核苷酸环形成序列,即位于将对应于在crRNA中的间隔区序列侧翼的3’手柄的3’;例如,如在Semenova等人2011同上的图1中显示出的。不希望受特定理论的束缚,在优选的核糖核蛋白复合体和双链靶多核苷酸中,不与核糖核蛋白复合体的靶向RNA配对的非靶核酸链可以包含直接地3’相邻的PAM序列,该PAM序列选自5’-NNNNCNNA-3’[SEQIDNO:47]、5’-CNNNCNN-3’、5’-NNNCCNN-3’、5’-NNCNCNN-3’、5’-NNNNCCN-3’和5’-NCNNCNN-3’的一种或更多种。任选地,例如,PAM序列可以选自5’-NNNNC-3’,5’-NNNNCNNA-3’[SEQIDNO:47]、5’-CNNNC-3’、5’-CNNNCNNA-3’、5’-NCNNC-3’、5’-NCNNCNNA-3’、5’-NNCNC-3’、5’-NNCNCNNA-3’、5’-NNNCC-3’、5’-NNNCCNNA-3’、5’-NNNNCC-3’、5’-NNNNCCNA-3’、5’-CCNNC-3’、5’-CCNNCNNA-3’、5’-CNCNC-3’、5’-CNCNCNNA-3’、5’-CNNCCN-3’、5’-CNNCCNNA-3’、5’-CNNNCC-3’、5’-CNNNCCNA-3’、5’-CCCNCN-3’、5’-CCCNCNNA-3’、5’-CCNCCN-3’、5’-CCNCCNNA-3’、5’-CCNNCC-3’、5’-CCNNCCNA-3’、5’-CCCCC-3’[SEQIDNO:12]、5’-CCCCCNNA-3’[SEQIDNO:13]、5’-CCCCCC-3’[SEQIDNO:14]、5’-CCCCCCNA-3’[SEQIDNO:10]、5’-NCCNC-3’、5’-NCCNCNNA-3’、5’-NCCCC-3’、5’-NCCCCNNA-3’、5’-NCCCCC-3’[SEQIDNO:15]、5’-NCCCCCNA-3’[SEQIDNO:16]、5’-NNCCC-3’、5’-NNCCCNNA-3’、5’-NNCCCC-3’、5’-NNCCCCNA-3’、5’-NNNCCC-3’、和5’-NNNCCCNA-3’。PAM序列可以是5’-CNCCCCAC-3’[SEQIDNO:17]、5’-CCCCCCAG-3’[SEQIDNO:18]、5’-CCCCCCAA-3’[SEQIDNO:11]、5’-CCCCCCAT-3’[SEQIDNO:19]、5’-CCCCCCAC-3’[SEQIDNO:20]、5’-ATCCCCAA-3’[SEQIDNO:21]、或5’-ACGGCCAA-3’[SEQIDNO:22]。优选地,PAM序列将是序列5’-NNNNCNNA-3’[SEQIDNO:47]。然而,将理解的是,取决于期望的应用和或Cas蛋白或多肽的浓度,可以使用核苷酸的其他组合。特别是,前4个PAM位置不存在特定的偏好。因此,前4个核苷酸可以方便地是任何核苷酸NNNN。这些序列对应于在天然存在的crRNA的情况中被称为“前间区相邻基序”或“PAM”的序列。在IIC型CRISPRCas系统中,这些PAM序列促进CascadecrRNA复合体与其dsDNA靶稳定相互作用,以确保crRNA对靶序列的高度的特异性-在天然系统靶中和因此也优选地对于根据本发明的RNA二者。优选地,与前间区直接地相邻的序列将不是5’-NNNCATN-3’。另外地,PAM序列可以具有序列5’-NNNNCNNA-3’[SEQIDNO:47],例如5’-NNNNCNAA-3’[SEQIDNO:52],或5’-NNNNCMCA-3’[SEQIDNO:53]。嗜温SpCas9的局限性之一是它仅在25℃和44℃之间显示出活性;在这些温度以上,SpCas9活性快速地减少至不可检测的水平Mougiakos等人,2017,ACSSynthBiol.6:849-861。与其嗜温同源物SpCas9的25℃-44℃范围相比,本发明的ThermoCas9在20℃-70℃的更宽得多的温度范围中在体外有活性。ThermoCas9的延伸的活性和稳定性允许其在需要在20℃-70℃的温度进行DNA操作的分子生物学技术中的应用,以及其在需要稳健的酶活性的严苛环境中的利用。因此,ThermoCas9也可以用作用于人类细胞的基因组编辑工具。任选地,所述人类细胞将不是胚胎干细胞。除了具有宽的功能温度活性范围,即在低的温度和高的温度二者,例如在20℃和70℃二者,或20℃和65℃或25℃和65℃是有功能的之外,通过修饰ThermoCas9或相关的元件诸如,例如,sgRNA或tracRNA的结构特征,操作其中ThermoCas9能够进行靶向的裂解或结合或其中靶向的裂解或结合有效地发生的温度的范围的能力将使得能够对核酸序列操作施加更大水平的控制。然而,直到现在,对在特定温度的Cas9活性的分子决定因素知之甚少。本发明人已经鉴定了对于赋予ThermoCas9的热稳定性重要的若干因素,其中之一是ThermoCas9的PAM偏好。ThermoCas9的PAM偏好对于在温度范围的较低部分≤30℃的活性是非常严格的,而对于在中等至最佳温度37℃至60℃的活性允许PAM中的更多的变化。因此,可以改变PAM序列,以在给定的温度获得靶的最有效结合、裂解、标记或修饰。这提供了在ThermoCas9的应用中的大程度的灵活性,取决于特定应用。例如,在一些应用中,靶结合、裂解、标记或修饰的非常宽的温度范围可以是期望的,例如20℃至70℃,优选地20℃至65℃或25℃至65℃。在这类宽的温度范围中的靶序列的结合、裂解、标记或修饰可以通过使用5’-NNNNCVAA-3’[SEQIDNO:48]的PAM序列来实现。优选地,在这类宽的温度范围中的靶序列的结合、裂解、标记或修饰可以通过使用5’-NNNNCSAA-3’[SEQIDNO:49],例如5’-NNNNCGAA-3’[SEQIDNO:50]或5’-NNNNCCAA-3’[SEQIDNO:51]的PAM序列来实现。前4个PAM位置不存在特定的偏好。因此,前4个核苷酸可以方便地是任何核苷酸NNNN。任选地,例如5’-CCCCCGAA-3’或5’-CCCCCCAA-3’[SEQIDNO:11]。当需要在≥30℃,例如30℃至100℃的范围中,优选地在30℃至70℃的范围中、30℃至65℃的范围中或45℃至65℃的范围中结合、裂解、标记或修饰靶时,PAM序列可以最佳地具有序列5’-NNNNCNAA-3’[SEQIDNO:52]或5’-NNNNCMCA-3’[SEQIDNO:53]。前4个PAM位置不存在特定的偏好。因此,前4个核苷酸可以方便地是任何核苷酸NNNN。任选地,例如,PAM序列可以是5’-CCCCCNAA-3’或5’-CCCCCMCA-3’。任选地,例如,PAM序列可以选自5’-CCCCCAAA-3’、5’-CCCCCATA-3’、5’-CCCCCAGA-3’、5’-CCCCCACA-3’、5’-CCCCCTAA-3’、5’-CCCCCTTA-3’、5’-CCCCCTGA-3’、5’-CCCCCTCA-3’、5’-CCCCCGAA-3’、5’-CCCCCGTA-3’、5’-CCCCCGGA-3’、5’-CCCCCGCA-3’、5’-CCCCCCAA-3’[SEQIDNO:11]、5’-CCCCCCTA-3’、5’-CCCCCCGA-3’或5’-CCCCCCCA-3’。本文提供的本发明的PAM序列包含本文所公开的序列,例如作为6-聚体、7-聚体或8-聚体序列。6聚体、7聚体或8聚体序列可以直接地从在非靶链上的前间区序列的3’开始,而在前间区序列和PAM序列的5’末端之间不具有另外的核酸间隔,该前间区序列与靶向RNA结合的序列互补。然而,将理解的是,在6聚体、7聚体或8聚体序列的3’末端处,可以存在另外的核酸形成PAM序列的部分。另外地或可选地,非靶链可以包含在PAM序列3’的另外的核酸。本发明的核蛋白复合体可以包含本发明的核糖核蛋白复合体和核糖核蛋白与其缔合的核酸的靶核酸链。结合、裂解、标记和修饰温度本发明的Cas蛋白的活性,例如核酸酶活性的温度范围,包括最佳温度范围,显著地高于已知的Cas9蛋白的活性的温度范围。此外,它在其中保持活性的范围的上限比已知的Cas9蛋白保持活性的范围的上限高得多。较高的最佳温度和功能范围在高温度的遗传工程中提供了显著的优点。因此,本发明的方法、用途、核蛋白和经转化的人类细胞可以是在升高的温度的基因组编辑中有用的。本发明的PAM序列与非靶链中的前间区序列直接地相邻的存在,改进了Cas蛋白和多肽对靶序列的特异性,并且支持Cas蛋白和多肽在更高温度和跨越更大功能温度范围的用途。根据显著地更大的热稳定性,本发明的Cas蛋白,跨越比已知Cas9蛋白保持活性的温度范围大得多的温度范围保持功能,例如核酸酶活性。此外,它在其中保持活性的范围的上限比已知的Cas9蛋白的范围的上限高得多。较高的最佳温度和功能范围在高的温度的遗传工程中提供了显著的优点,并且因此,例如,在在升高的温度编辑人类细胞的基因组中提供了显著的优点。任选地,不包括胚胎干细胞的工程化。ThermoCas9的延伸的活性和稳定性允许其在需要在宽的温度范围中例如20-70℃进行DNA操作的分子生物学技术中的应用,以及其在需要稳健的酶活性的严苛环境中的利用。有益地,本发明人还已经显示出,本发明的Cas蛋白也可以用于指导靶序列的转录控制,例如通过与靶序列序列特异性结合来使转录沉默。因此,ThermoCas9也可以用作人类细胞中的转录控制工具,例如用在使靶基因的转录沉默或激活中。因此,ThermoCas9也可以用作在人类细胞中的基因沉默工具。任选地,本发明的Cas蛋白不被用于胚胎干细胞中。任选地,本发明的Cas蛋白不被用于改变人类的生殖系遗传同一性。有益地,本发明的Cas蛋白或多肽能够在从20℃至100℃的温度进行核酸结合、裂解、标记或修饰,但在升高的温度,例如在41℃和122℃之间的温度,优选地在50℃和100℃之间的温度是特别有用的。本发明的Cas蛋白和多肽能够结合、裂解、标记或修饰DNA、RNA和合成的核酸。本发明的Cas蛋白或多肽还可以例如在20℃至50℃的范围中的温度提供用于核酸酶活性、基因编辑和核酸标记应用的可操作性。在本文包括温度范围的情况下,预期端点被包括在所公开的温度范围中,即该范围是“包括性的”。例如,当陈述在20℃和100℃之间的范围中的温度存在活性时,20℃和100℃的温度被包括在所述范围中。优选地,当与合适的gRNA指导RNA,也被称为靶向RNA分子缔合时所述gRNA识别一个或更多个多核苷酸分子中的待被结合、裂解、标记或修饰的靶序列,本发明的Cas蛋白或多肽在20℃至100℃的范围中的温度,任选地在20℃至70℃、20℃至65℃、25℃至70℃、25℃至65℃、55℃至100℃、50℃至70℃、55℃至70℃、或55℃至65℃的范围中的温度进行结合、裂解、标记或修饰。优选地,当与合适的gRNA指导RNA,也称为靶向RNA分子缔合时所述gRNA识别一个或更多个多核苷酸分子中的待被结合、裂解、标记或修饰的靶序列,本发明的Cas蛋白或多肽在50℃至100℃的范围中的温度,任选地在55℃至100℃、60℃至100℃、65℃至100℃、70℃至100℃、75℃至100℃、80℃至100℃、85℃至100℃、90℃至100℃、95℃至100℃的温度进行结合、裂解、标记或修饰。更优选地,本发明的Cas蛋白在51℃至99℃、52℃至98℃、53℃至97℃、54℃至96℃、55℃至95℃、56℃至94℃、57℃至93℃、58℃至92℃、59℃至91℃、60℃至90℃、61℃至89℃、62℃至88℃、63℃至87℃、64℃至86℃、65℃至85℃、66℃至84℃、67℃至83℃、68℃至82℃、69℃至81℃、70℃至80℃、71℃至79℃、72℃至78℃、73℃至77℃、74℃至76℃的范围中的温度、或在75℃的温度对核酸进行裂解、标记或修饰。优选地,本发明的Cas蛋白在60℃至80℃、61℃至79℃、62℃至78℃、63℃至77℃、64℃至76℃、60℃至75℃、60℃至70℃的范围中的温度对核酸进行结合、裂解、标记或修饰。最佳地,本发明的Cas蛋白在60℃至65℃的范围中的温度,优选地在65℃对核酸进行结合、裂解、标记或修饰。靶向RNA分子可以被设计用于与本发明的Cas蛋白和多肽一起使用,其中靶向RNA分子与靶链中的靶序列结合,并且非靶链还包含本文提供的紧邻前间区序列3’的PAM序列。PAM序列可以包含5’-NNNNNNNA-3’,优选地5’-NNNNCNNA-3’[SEQIDNO:47],任选地,例如5’-CCCCCCNA-3’[SEQIDNO:10]或5’-CCCCCCAA-3’[SEQIDNO:11],并且本发明的用途、方法、经转化的细胞和核蛋白可以跨越从55℃至65℃的温度范围,优选地跨越从50℃至70℃、从40℃至65℃、从45℃至75℃、从37℃至78℃和或从20℃至80℃的温度范围,提供靶链的结合、裂解、标记和或修饰。可以改变PAM序列,以在给定的温度获得靶的最有效裂解。这提供了在本发明的Cas蛋白的应用中的大程度的灵活性,取决于特定应用。当结合、裂解、标记或修饰活性,例如裂解活性,需要在20℃至100℃的温度范围中,优选地20℃至70℃的温度范围中,或20℃至65℃的温度范围中或25℃至65℃的温度范围中时,那么活性可以通过使用5’-NNNNCVAA-3’[SEQIDNO:48]的PAM序列来实现,优选地,在这类温度范围中的活性可以通过使用5’-NNNNCSAA-3’[SEQIDNO:49],例如5’-NNNNCGAA-3’[SEQIDNO:50]或5’-NNNNCCAA-3’[SEQIDNO:51]的PAM序列来实现。任选地,例如5’-CCCCCGAA-3’[SEQIDNO:52]或5’-CCCCCCAA-3’[SEQIDNO:11]。本发明人已经发现ThermoCas9的热稳定性随着形成核糖核蛋白复合体的指导sgRNA的缔合而增加。指导sgRNA可以合适地包含tracrRNA和crRNA。在这类布置中,该指导可以合适地包含crRNA,所述crRNA包含核苷酸间隔区片段和重复片段。crRNA的长度可以合适地是17-20nt。任选地,crRNA的长度可以是17nt。可选地,crRNA的长度可以是18nt、19nt或20nt。该指导还可以包含tracrRNA反向重复anti-repeat片段与crRNA的重复片段碱基配对。tracrRNA和crRNA可以通过合成的接头来分隔。以下指导代表了优选的布置:5’-[crRNA17-20个核苷酸间隔区片段&重复片段–任选的:连接两个RNA的合成的环–tracrRNA反向重复片段与crRNA的重复片段碱基配对&一些可变的茎环结构如参见下文中的结构,在某些系统中可以被截短至一定程度]-3’。通常地,tracrRNA将作为嵌合的单指导RNAsgRNA的一部分被提供,所述嵌合的单指导RNAsgRNA例如包含crRNA和tracrRNA。tracrRNA可以由反向重复区域和随后的一个或更多个发夹结构,优选地两个或更多个发夹结构或更优选地三个或更多个发夹结构组成。在间隔区远端的全长重复反向重复发夹由在通过4-核苷酸接头例如5’-GAAA-3’融合的合成的sgRNA嵌合体中的crRNA部分的3’-末端重复和互补的tracrRNA部分反向重复的5’-末端形成的存在作为核酸酶的锚发挥功能,但对靶选择和裂解活性不是必需的。例如,可以容忍在tracrRNA部分的高达50-nt缺失的间隔区远端处的缺失,而对DNA裂解效率影响很小或没有影响。因此,例如,全长重复-反向重复发夹的间隔区远端的缺失可以被制备成高达50nt、高达45nt、高达40nt、高达35nt、高达30nt、高达25nt、高达20nt、高达15nt、高达10nt或高达5nt,而在靶DNA裂解效率的方面没有损害。出乎意料地,本发明人还已经发现tracrRNA的结构影响ThermoCas9的热稳定性和活性特别是裂解活性的效率。具体地,可以修饰tracrRNA或sgRNA中的发夹或茎环结构的数目,以在给定温度获得靶的最有效结合、裂解、标记或修饰。这提供了本发明的Cas蛋白的应用中的大程度的灵活性,取决于特定应用。任选地,tracrRNA或sgRNA可以被提供能够形成一个或更多个茎环结构、两个或更多个茎环结构或三个或更多个茎环结构的核酸序列。任选地,tracrRNA或sgRNA可以被提供被布置成形成一个或更多个茎环结构、两个或更多个茎环结构或三个或更多个茎环结构的核酸序列。优选地,sgRNA将被提供能够形成至少三个茎环结构的核酸序列。任选地,在结合、裂解、标记或修饰活性,例如裂解活性需要在20℃至60℃的温度范围中,优选地37℃至60℃的温度范围中,或37℃、40℃、45℃、50℃、55℃或60℃的情况,那么可以通过使用能够形成一个或更多个茎环结构的sgRNA序列来实现活性。任选地,在结合、裂解、标记或修饰活性,例如裂解活性需要在20℃至65℃的温度范围中,优选地37℃至65℃的温度范围中,更优选地45℃至55℃的温度范围中、或37℃、40℃、45℃、50℃、55℃或60℃的情况,那么可以通过使用能够形成两个或更多个茎环结构的sgRNA序列来实现活性。任选地,在结合、裂解、标记或修饰活性,例如裂解活性需要在20℃至100℃的温度范围中,优选地20℃至70℃的温度范围中,更优选地37℃至65℃的温度范围中、或37℃、40℃、45℃、50℃、55℃、60℃或65℃的情况,那么可以通过使用能够形成三个或更多个茎环结构的sgRNA序列来实现活性。优选地,对应于tracrRNA的sgRNA的部分将包含序列AAGGGCUUUCUGCCUAUAGGCAGACUGCCC[SEQIDNO:54],该序列例示了5’发夹。优选地,对应于tracrRNA的sgRNA的部分还将包含序列GUGGCGUUGGGGAUCGCCUAUCGCC[SEQIDNO:55],该序列例示了‘中间’发夹。优选地,对应于tracrRNA的sgRNA的部分还将包含序列CGCUUUCUUCGGGCAUUCCCCACUCUUAGGCGUUUU[SEQIDNO:56],该序列例示了3’发夹。优选地,对应于tracrRNA的sgRNA的部分将包含序列AAGGGCUUUCUGCCUAUAGGCAGACUGCCCGUGGCGUUGGGGAUCGCCUAUCGCC[SEQIDNO:57],即包括5’发夹和中间发夹。优选地,对应于tracrRNA的sgRNA的部分可以包含序列AAGGGCUUUCUGCCUAUAGGCAGACUGCCCGUGGCGUUGGGGAUCGCCUAUCGCCCGCUUUCUUCGGGCAUUCCCCACUCUUAGGCGUUUU[SEQIDNO:58],即包括5’发夹、中间发夹和3’发夹。本发明人已经发现,tracrRNA支架的预测的茎环的数目在DNA裂解中起着至关重要的作用,特别是在升高的温度。本发明人已经确定,尽管tracrRNA支架的三个茎环的存在对于裂解活性不是必需的,但是当所有三个环都存在时,在该范围中的所有温度,裂解是最有效的,这表明在升高的温度需要全长的tracrRNA用于最佳的基于ThermoCas9的DNA裂解。与之相比,去除3’发夹引起裂解效率的减少。此外,本发明人发现去除中间发夹和3’发夹二者引起ThermoCas9的裂解效率的急剧地下降,特别地在功能温度范围的上限和下限。优选地,在需要在升高的温度,例如45℃至100℃、50℃至100℃、50℃至70℃、50℃至65℃、55℃至65℃的温度范围中或在宽的温度范围中,诸如20℃至100℃、20℃至70℃、20℃至65℃的温度范围中,对靶序列进行结合、裂解、标记或修饰的情况。优选地,在20℃至100℃、20℃至70℃、20℃至65℃、45℃至100℃、50℃至100℃、50℃至70℃、50℃至65℃或55℃至65℃的范围中的选择的温度,与具有三个茎环结构的sgRNA缔合的ThermoCas9将保持稳定,并且能够对靶序列进行结合、裂解、标记或修饰持续至少1min、至少2min、至少3min、至少4min或至少5min,优选地5min。此外,本发明人还已经发现,可以改变sgRNA的间隔区序列的长度,以控制ThermoCas9活性,例如结合、裂解、标记或修饰活性的效率。通常地,间隔区序列的长度将在18nt至25nt的范围中。任选地,间隔区序列的长度将是18nt、19nt、20nt、21nt、22nt、23nt、24nt或25nt。优选地,将使用19nt、20nt、21nt或23nt的间隔区长度,因为当与具有这些间隔区长度的sgRNA缔合时,本发明的Cas9蛋白以最高的效率裂解靶序列。当使用18nt的间隔区时,裂解效率显著地下降。优选地,间隔区的长度将是23nt。在本发明的所有方面中,Cas蛋白或多肽可以获得自或来源于细菌、古核生物或病毒;或可选地可以从头合成。在优选的实施方案中,本发明的Cas蛋白或多肽来源于嗜热原核生物体,所述嗜热原核生物体可以被分类为古核生物或细菌,但优选地是细菌。更优选地,本发明的Cas蛋白或多肽将来源于嗜热细菌。本文中,术语嗜热应当理解为意指能够在相对地高的温度存活和生长,例如,在本发明的情况中,能够在41℃和122℃106℉和252℉之间的温度进行核酸裂解、结合或修饰。优选地,本发明的Cas蛋白或多肽可以从一种或更多种嗜热细菌分离,并且将在60℃以上发挥功能。优选地,本发明的Cas蛋白或多肽可以从一种或更多种嗜热细菌分离,并且将在60℃至80℃的范围中并且最佳地在60℃与65℃之间的范围中发挥功能。在优选的实施方案中,本发明的Cas蛋白或多肽来源于地芽孢杆菌属的种。更优选地,本发明的Cas蛋白来源于热脱氮地芽孢杆菌。甚至更优选地,本发明的Cas蛋白来源于热脱氮地芽孢杆菌T12。本发明的Cas蛋白或多肽可以来源于病毒。功能部分有益地,可以使用本发明的Cas蛋白、多肽和核糖核蛋白复合体以序列特异性方式靶向任何多核苷酸序列的能力来以某种方式修饰靶核酸,例如通过裂解靶核酸和或标记靶核酸和或修饰靶核酸。因此将理解的是,可以随Cas蛋白或多肽提供另外的蛋白以实现这一点。因此,本发明的Cas蛋白或多肽还可以包含至少一个功能部分,和或本发明的Cas蛋白、多肽或核糖核蛋白复合体可以作为蛋白复合体的一部分被提供,所述蛋白复合体包含至少一种另外的蛋白。在优选的方面中,本发明提供了一种Cas蛋白、多肽或核糖核蛋白复合体,其中Cas蛋白或至少一种另外的蛋白还包含至少一个功能部分。至少一个功能部分可以与Cas蛋白融合或连接。优选地,至少一个功能部分可以通过在天然或人工蛋白表达系统中表达而与Cas蛋白翻译地融合。可选地,至少一个功能部分可以通过化学合成步骤与Cas蛋白共价地连接。优选地,至少一个功能部分与Cas蛋白的N-末端和或C-末端优选地C-末端融合或连接。期望地,至少一个功能部分将是蛋白。它可以是异源蛋白,或可选地可以是Cas蛋白来源于其的细菌物种天然的。至少一个功能部分可以是蛋白;任选地选自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白DNAstructuringprotein、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签。在特别地优选的方面中,本发明提供了一种Cas蛋白、多肽或核糖核蛋白复合体,其中至少一个功能部分是标志物蛋白,例如GFP。核酸酶活性本发明的Cas核糖核蛋白在本文所公开的温度,优选地在升高的温度,例如在50℃和100℃之间的温度,具有核酸结合、裂解、标记或修饰活性。本发明的核糖核蛋白能够结合、裂解、标记或修饰DNA、RNA或合成的核酸。在优选的方面中,本发明的Cas核糖核蛋白能够以序列特异性方式裂解DNA,特别是双链DNA。本发明的Cas蛋白、多肽或核糖核蛋白可以具有多于一个核酸酶结构域。位点特异性核酸酶可以允许沿着DNA的链的选择的位置处生成双链断裂DSB。在靶宿主细胞中,这使DSB能够在基因组中特定的预先选择的位置处产生。通过位点特异性核酸酶创建这类断裂促使内源细胞修复机制被重新使用,以在感兴趣的基因组中的期望的位置处插入、缺失或修饰DNA。蛋白或多肽分子的一个或更多个核酸酶活性位点可以被失活,例如,以允许与蛋白或多肽连接或融合的另一个功能部分例如核酸酶结构域诸如FokI核酸酶的活性。因此,尽管本发明的Cas蛋白、多肽和核糖核蛋白可以具有内源核酸酶活性的事实,但对于某些应用,可能期望使Cas蛋白的天然核酸酶活性失活并且提供Cas蛋白或核糖核蛋白复合体,其中天然的Cas9核酸酶活性被失活并且Cas蛋白与至少一个功能部分连接。这类应用的一种是通过补充天然的Cas9核酸酶活性来降低错误靶向事件的发生率。这可以期望地通过使Cas蛋白或核糖核蛋白复合体的天然Cas9核酸酶活性失活和提供优选地与Cas蛋白融合的异源核酸酶来实现。因此,本发明提供了Cas蛋白或核糖核蛋白复合体,其中至少一个功能部分是核酸酶结构域,优选地FokI核酸酶结构域。在一个特别地优选的方面中,与FokI核酸酶结构域融合的本发明的Cas蛋白或核糖核蛋白复合体作为蛋白复合体的一部分被提供,优选地包含与FokI核酸酶结构域融合的本发明的另一个Cas蛋白或核糖核蛋白复合体,并且其中两个复合体靶向靶基因组DNA的相对链。对于一些应用,可以期望完全地减弱Cas蛋白、多肽或核糖核蛋白的核酸酶活性,例如在其中Cas蛋白或核糖核蛋白复合体被用于识别和修饰核酸中的特定靶序列,例如用于将其标记为诊断测试的一部分的应用中。在这类应用中,Cas蛋白的核酸酶活性可以被失活,并且与Cas蛋白融合的功能部分可以是蛋白;任选地选自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签。在优选的方面中,缺乏核酸酶活性的催化上失活的或“死亡”的Cas蛋白或多肽dCas可以与靶核酸序列结合,并且从而在空间上阻遏该序列的活性。例如,可以设计与基因的启动子或外显子序列互补的靶向RNA,使得dCas和靶向RNA与基因的结合在空间上阻遏基因序列的转录起始或延伸,从而阻遏基因的表达。可选地,本文描述的方法和用途可以使用为切口酶nickases的gtCas9的修饰的核酸酶变体。切口酶可以通过gtCas9核酸酶的HNH或RuvC催化结构域的任一个中的突变来创建。这已经针对酿脓链球菌Cas9spCas显示出,spCas9-突变体D10A和H840A,它们分别地具有失活的RuvC或HNH核酸酶结构域。这两种突变的组合导致催化上死亡的Cas9变体Standage-Beier,K.等人,2015,ACSSynth.Biol.4,1217-1225;Jinek,M.等人,2012,Science337,816-821;Xu,T.等人,2015,Appl.Environ.Microbiol.81,4423-4431。基于序列同源性图3,这些残基可以是在gtCas9中的D8在图3中的D17和D581或H582图3。优选地,在gtCas9ThermoCas9中的D8A和H582A突变可以被用于产生催化上失活或“死亡”的Cas蛋白或缺乏核酸酶活性的ThermoCas9的多肽变体dCas。这类dCas可以有效地找到应用,例如,作为有效的热活性转录沉默CRISPRi工具,能够稳定和特异性地与DNA元件结合而不引入dsDNA断裂。有益地,这类系统可以,除其他之外,极大地促进人类细胞的代谢研究。在特别地优选的方面中,本发明提供了Cas蛋白或核糖核蛋白复合体,其中Cas蛋白的核酸酶活性被失活,并且至少一个功能部分是标志物蛋白,例如GFP。以该方式,特异性地靶向感兴趣的核酸序列并且使用生成光信号的标志物使其可视化可以是可能的。合适的标志物可以包括例如荧光报告物蛋白,例如绿色荧光蛋白GFP、黄色荧光蛋白YFP、红色荧光蛋白RFP、青色荧光蛋白CFP或mCherry。这类荧光报告物基因提供了用于蛋白表达的可视化的合适的标志物,因为它的表达可以通过荧光测量简单地且直接地测定。可选地,报告物核酸可以编码发光蛋白,诸如萤光素酶例如萤火虫萤光素酶。可选地,报告物基因可以是可以被用于生成光信号的显色酶,例如显色酶诸如β-半乳糖苷酶LacZ或β-葡糖醛酸糖苷酶Gus。用于测量表达的报告物也可以是抗原肽标签。其他报告物或标志物是本领域中已知的,并且可以适当地使用它们。因为标志物可以被可视化,在其中靶核酸是RNA,特别地mRNA的某些实施方案中,特别地在由标志物生成的光信号与表达产物的量成正比的情况,通过检测和定量由标志物提供的光信号来定量基因的转录活性可以是可能的。因此,在本发明的优选的实施方案中,本发明的Cas蛋白或核糖核蛋白可以被用于测定感兴趣的基因的表达产物。在一方面中,本文描述的gtCas9可以被用于同源重组HR介导的基因组修饰方法中。这类方法涉及HR和位点定向的gtCas9活性,由此通过gtCas9活性,反选择counterselection发生,去除不具有由HR引入的期望的修饰的细胞。因此,本文提供的方法和用途允许同源重组的过程在第一步期间被支持,使得基因组可以被修饰以具有期望的突变,以及在第二步期间被支持,在该第二步中未修饰的细胞可以被gtCas9核糖核酸酶复合体靶向以将DSDB引入未修饰的细胞的基因组中。这些方法和用途总体上增加了具有期望的突变的细胞的群体,同时消除了任何未修饰的细胞。优选地,这类方法和用途被用于实质上不具有内源NHEJ修复机制的微生物。可选地,所述方法和用途可以被应用于具有内源NHEJ修复机制的细胞。本文描述的方法和用途可以被应用于具有内源NHEJ修复机制,但其中NHEJ修复机制有条件地降低或NHEJ活性被敲除的细胞。本文提供的方法和用途可以使用同源重组多核苷酸的序列,该序列与指导RNA具有至少一个错配,使得指导RNA不再能够识别修饰的基因组。这意味着gtCas9核糖核酸酶复合体将不识别修饰的基因组。因此,gtCas9核糖核酸酶复合体不可以引入DSDB,并且因此修饰的细胞将存活。然而,具有未修饰的基因组的细胞仍将具有与指导RNA的实质的互补性,并且因此可以被gtCas9核糖核酸酶复合体位点特异性地裂解。在本发明的方法和用途的另一个方面中,其中防止gtCas9核糖核酸酶复合体起作用以裂解微生物基因组的方式与其说是以修饰或消除被指导靶向的序列,不如说是修饰或消除被gtCas9核糖核酸酶复合体需要的PAM。PAM被修饰或消除,以使gtCas9核糖核酸酶复合体对特异性切割位点不敏感blind。因此,本发明的方法和用途可以包括使用同源重组多核苷酸的序列的那些方法和用途,该同源重组多核苷酸的序列不包括被gtCas9核糖核酸酶复合体识别的PAM序列。因此,gtCas9核糖核酸酶复合体不可以引入DSDB,并且因此HR修饰的细胞将存活。然而,未修饰的细胞仍将被gtCas9核糖核酸酶复合体及其指导所识别,并且因此被位点特异性地裂解。因此,本文提供了依赖HR以修饰细胞的基因组的方法和用途。优选地,上游侧翼区和下游侧翼区的长度各自是0.5千碱基kb至1.0kb。然而,使用更大或更短片段的重组也是可能的。同源重组多核苷酸还可以包含在上游和下游侧翼区域之间的多核苷酸序列。该多核苷酸序列可以例如包含将被引入基因组中的修饰。虽然同源重组依赖与靶区域具有实质互补性的上游和下游侧翼区,但也可以容纳错配。因此,在一些实施方案中,已知同源重组发生在与上游和下游侧翼区具有广泛同源性的DNA区段之间。在可选的实施方案中,上游和下游侧翼区具有与靶区域完全的互补性。上游和下游侧翼区的尺寸不必是相同的。然而,在一些实例中,上游和下游侧翼区的尺寸是相同的。同源重组的效率将根据侧翼区的最小片段长度的同源重组的可能性而变化。然而,即使同源重组过程是低效的,有益地,本文描述的方法将相对于未修饰的细胞选择具有期望的修饰的任何细胞。同源重组也允许产生包括完整基因簇的大的缺失例如50kb或更大。同源重组也被用于重组工程,重组工程是众所周知的允许在较小片段45-100nt内进行重组的方法。本文描述的方法和用途可以任选地还包含至少另一种同源重组多核苷酸或包含编码同源重组多核苷酸的序列的多核苷酸,所述同源重组多核苷酸具有与包含基因组中的靶的第二靶区域实质上互补的序列。在优选的实施方案中,本文描述的方法和用途使用同源重组多核苷酸,即DNA。在一些实施方案中,DNA是单链的。在另外的实施方案中,DNA是双链的。在其他实施方案中,DNA是双链的并且是质粒携带的。本文提供的方法和用途中的HR可以被用于从基因组去除多核苷酸序列。可选地,本文提供的方法和用途中的HR可以被用于将一个或更多个基因或所述基因的一个或更多个片段插入基因组中。作为另外的可选选择,在本文提供的方法和用途中的HR可以被用于修饰或代替基因组中的至少一个核苷酸。因此,本文提供的方法和用途可以被用于任何期望种类的基因组修饰。可选地,本文描述的gtCas9可以被用于细胞中的HR介导的基因组修饰方法,由此gtCas9活性在细胞中引入DSDB并且可以诱导细胞HR,如对于spCas9已经显示出的Jiang等人2013NatureBiotech,31,233-239;Xu等人2015ApplEnvironMicrobiol,81,4423-4431;Huang等人2015ActaBiochimicaetBiophysicaSinica,47,231-243。可选地,同源重组可以通过重组工程来促进,例如通过将寡核苷酸引入到表达编码RecT或β蛋白的基因的细胞中来促进,如由Mougiakos等人2016,TrendsBiotechnol.34:575-587综述的。在另外的实施方案中,Cas9可以与多重自动化基因组工程MultiplexAutomatedGenomeEngineeringMAGE进行组合,如由Ronda等人2016,Sci.Rep.6:19452.例示的。自始至终,本发明的Cas蛋白的参考序列可以被定义为编码氨基酸序列的核苷酸序列。例如,在SEQIDNO:2至6中定义的基序的氨基酸序列还包括编码该氨基酸序列的所有核酸序列。因此,本发明还提供了分离的核酸分子,所述分离的核酸分子编码Cas蛋白,所述Cas蛋白包含:a.氨基酸基序EKDGKYYC[SEQIDNO:2];和或b.氨基酸基序X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和或c.氨基酸基序X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和或d.氨基酸基序X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和或e.氨基酸基序X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸;其中,当与至少一种靶向RNA分子和包含被靶向RNA分子识别的靶核酸序列的多核苷酸缔合时,Cas蛋白能够在50℃与100℃之间进行DNA结合、裂解、标记或修饰。任选地,Cas蛋白能够在人类细胞中进行所述裂解、标记或修饰。任选地,其中所述人类细胞不是胚胎干细胞。任选地,其中所述裂解、标记或修饰不改变人类的生殖系遗传同一性。在另一个方面中,本发明还提供了分离的核酸分子,所述分离的核酸分子编码成簇的规律地间隔的短回文重复CRISPR相关的Cas蛋白,所述成簇的规律地间隔的短回文重复CRISPR相关的Cas蛋白具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列。在另一个方面中,本发明还提供了分离的核酸分子,所述分离的核酸分子还包含编码在翻译后与Cas蛋白融合的肽的至少一种核酸序列。在另一个方面中,本发明还提供了分离的核酸分子,其中与编码Cas蛋白的核酸分子融合的至少一种核酸序列编码选自以下的蛋白:解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签。ThermoCas9核酸酶活性:二价阳离子先前表征的嗜温Cas9核酸内切酶使用二价阳离子以催化在靶DNA中生成DSB。本发明人已经显示出,在任何以下二价阳离子的存在下,ThermoCas9可以介导dsDNA裂解:Mg2+、Ca2+、Mn2+、Co2+、Ni2+和Cu2+。ThermoCas9核酸酶活性:底物本发明人还已经出乎意料地显示出,尽管有报道称某些IIC型系统是有效的单链DNA切割物Ma,等人,Mol.Cell60,398-4072015;Zhang,等人,Mol.Cell60,242-2552015,ThermoCas9不能指导ssDNA的裂解。ThermoCas9的核酸酶活性局限于dsDNA底物。表达载体本发明的核酸可以被分离。然而,为了核酸感测构建体nucleicacidsensingconstruct的表达可以在选择的细胞中进行,编码Cas蛋白或核糖核蛋白的多核苷酸序列将优选地被提供于表达构建体中。在一些实施方案中,编码Cas蛋白或核糖核蛋白的多核苷酸将作为合适的表达载体的一部分被提供。在某些实施方案中,本发明的表达载体具有或不具有编码表达后将与Cas蛋白融合的氨基酸残基的核苷酸序列可以还包含编码如上文定义的靶向RNA分子的核苷酸序列。因此,这类表达载体可以被用于在适当的宿主中以生成可以靶向期望的核苷酸序列的本发明的核糖核蛋白复合体。可选地,编码如上文定义的靶向RNA分子的核苷酸序列可以被提供于单独的表达载体中,或者可选地可以通过其他手段递送至靶细胞。合适的表达载体将根据受体细胞而变化,并且合适地可以掺入使得表达能够在靶细胞中进行,并且优选地促进高水平表达的调控元件。这类调控序列可以能够例如在起始、准确性、速率、稳定性、下游加工、及迁移率mobility的方面影响基因或基因产物的转录或翻译。这类元件可以包括,例如,强和或组成型启动子、5’和3’UTR、转录和或翻译增强子、转录因子或蛋白结合序列、起始位点和终止序列、核糖体结合位点、重组位点、聚腺苷酸化序列、有义或反义序列、确保正确起始转录的序列以及任选地确保宿主细胞中转录终止和转录物稳定的多聚A信号。调控序列可以是植物、动物、细菌、真菌或病毒来源的。清楚地,适当的调控元件将根据感兴趣的宿主细胞而变化。促进在人类宿主细胞中的高水平表达的调控元件可以包括酵母中的AOX1或GAL1启动子,或CMV启动子或SV40启动子、CMV增强子、SV40增强子、单纯疱疹Herpessimplex病毒VIP16转录活化物或人类细胞中的珠蛋白内含子的内含物。合适的调控元件可以是组成型的,由此它们在大多数环境条件或发育阶段发育阶段特异性或诱导型下指导表达。优选地,启动子是诱导型的,以响应于环境、化学或发育信号cues诸如温度、光照、化学品、干旱和其他刺激物来指导表达。合适地,可以选择允许感兴趣的蛋白在特定发育阶段或响应于细胞外或细胞内条件、信号或外部施加的刺激物而表达的启动子。例如,存在用于在大肠杆菌中使用的一系列启动子,所述启动子在生长的特定阶段例如osmY稳定期启动子或响应于特定刺激物例如HtpG热激启动子提供高水平表达。合适的表达载体可以包含编码允许在合适的宿主细胞中和或在特定条件下选择所述载体的选择性标志物的另外的序列。本发明还包括修饰人类细胞中的靶核酸的方法,所述方法包括用如上文描述的任何表达载体转染、转化或转导细胞。转染、转化或转导的方法是本领域技术人员熟知的类型。在使用一种表达载体生成本发明的核糖核蛋白复合体的表达的情况下,并且当靶向RNA被直接地添加至细胞时,那么可以使用相同的或不同的转染、转化或转导的方法。类似地,当使用一种表达载体生成本发明的核糖核蛋白复合体的表达时,并且当另一种表达载体用于通过表达原位生成靶向RNA时,那么可以使用相同或不同的转染、转化或转导方法。在其他实施方案中,引入编码Cas蛋白或多肽的mRNA到细胞中,使得Cascade复合体在细胞中被表达。将Cas蛋白复合体引导至期望的靶序列的靶向RNA也被引入到细胞中,无论是与mRNA同时地、单独地或顺序地引入到细胞中,使得在细胞中形成必需的核糖核蛋白复合体。因此,本发明还提供了修饰即裂解、加标签、修饰、标记或结合靶核酸的方法,所述方法包括使所述核酸与如上文定义的核糖核蛋白复合体接触。任选地,所述核酸是在人类细胞中。任选地,所述人类细胞不是胚胎干细胞。另外,本发明还包括修饰靶核酸的方法,所述方法包括使核酸与除了如上文定义的靶向RNA分子以外的如上文定义的Cas蛋白或多肽接触。根据以上方法,靶核酸的修饰因此可以在体外和在无细胞的环境中进行。在无细胞环境中,靶核酸、Cas蛋白和靶向RNA分子的各自的添加可以是同时的、顺序的根据需要以任何顺序或单独的。因此,以下是可能的:靶核酸和靶向RNA同时地被添加至反应混合物,并且然后在稍后阶段,本发明的Cas蛋白或多肽单独地被添加。等同地,靶核酸的修饰可以在体内进行,即在人类细胞中原位进行,无论是分离的细胞还是作为多细胞组织、器官或生物体的一部分。在整个组织和器官的情况中和在生物体的情况中,该方法可以期望地在体内,或可选地可以通过从整个组织、器官或生物体分离人类细胞,根据该方法用核糖核蛋白复合体处理细胞,并且随后将用核糖核蛋白复合体处理的细胞返回至其之前的位置或不同的位置,无论是在相同的还是不同的生物体中进行。任选地,所述人类细胞不是胚胎干细胞。在这些实施方案中,核糖核蛋白复合体或Cas蛋白或多肽要求递送到细胞中的适当形式。这类合适的递送系统和方法是本领域技术人员熟知的,并且包括但不限于细胞质或核显微注射。在优选的递送方式中,使用腺相关病毒AAV;该递送系统不在人类中引起疾病,并且已经在欧洲被批准用于临床使用。因此,本发明提供了修饰靶核酸的方法,所述方法包括使核酸与以下接触:a.如上文定义的核糖核蛋白复合体;或b.如上文定义的蛋白或蛋白复合体和如上文定义的RNA分子。在另外的方面中,本发明提供了修饰人类细胞中的靶核酸的方法,所述方法包括用包含编码如上文定义的核糖核蛋白复合体的核苷酸序列的表达载体转化、转染或转导细胞;或可选地用包含编码如上文定义的蛋白或蛋白复合体的核苷酸序列的表达载体和包含编码如上文定义的靶向RNA分子的核苷酸序列的另外的表达载体转化、转染或转导细胞。任选地,所述靶核酸是在人类细胞中,其中所述人类细胞不是胚胎干细胞。在另外的方面中,本发明提供了修饰人类细胞中的靶核酸的方法,所述方法包括用包含编码如上文定义的蛋白或蛋白复合体的核苷酸序列的表达载体转化、转染或转导细胞,并且然后将如上文定义的靶向RNA分子递送到细胞中。任选地,所述靶核酸是在人类细胞中,其中所述人类细胞不是胚胎干细胞。在其中指导即靶向RNAgRNA分子和Cas蛋白或多肽被单独地而不是作为核糖核蛋白复合体的一部分提供的实施方案中,gRNA分子要求递送到人类细胞中的适当的形式,无论是与Cas蛋白或蛋白复合体同时地、单独地还是顺序地递送。将RNA引入到细胞中的这类形式是本领域技术人员熟知的,并且可以包括通过常规转染方法的体外或离体递送。可以各自使用物理方法,诸如显微注射和电穿孔、以及钙共沉淀、和商购可得的阳离子聚合物和脂质、以及细胞穿透肽、细胞穿透基因枪biolistic颗粒。例如,病毒特别地优选的是AAV可以用作递送媒介物,无论是递送到细胞质和或细胞核,例如经由本发明的Cas蛋白复合体或本发明的核糖核蛋白复合体与病毒颗粒的可逆的融合。在另一个方面中,本发明提供了修饰靶核酸的方法,其中至少一个功能部分是标志物蛋白或报告物蛋白,并且标志物蛋白或报告物蛋白与靶核酸缔合;优选地其中标志物是荧光蛋白,例如绿色荧光蛋白GFP。在上文提及的修饰靶核酸的方法中,功能部分可以是标志物,并且标志物与靶核酸缔合;优选地其中标志物是蛋白;任选地荧光蛋白,例如绿色荧光蛋白GFP、黄色荧光蛋白YFP、红色荧光蛋白RFP或mCherry。无论是在体外、离体还是体内,然后本发明的方法可以被用于直接使核酸分子中的靶基因座可视化,优选地呈更高级结构的形式,诸如超螺旋的质粒或染色体、或单链靶核酸诸如mRNA。靶基因座的直接可视化可以使用电子显微术或荧光显微术。然而,将理解的是,在本发明的方法的情况中,其他种类的标记物可以用作为标志物,包括可以是小分子的有机染料分子、放射性标记物和自旋标记物。在其中靶核酸是dsDNA的用于修饰靶核酸的本发明的方法中,功能部分可以是核酸酶或解旋酶-核酸酶,并且修饰优选地是在期望的基因座处的单链或双链断裂。以该方式,独特的序列特异性DNA切割可以通过使用与核糖核蛋白复合体融合的合适的功能部分来工程化。最终的核糖核蛋白复合体的RNA组分的选择的序列提供了用于功能部分的作用的所需的序列特异性。因此,本发明还提供了在人类细胞中期望的基因座处非同源末端连接dsDNA分子以从dsDNA分子去除至少一部分核苷酸序列;任选地以敲除一个基因或更多个基因的功能的方法,其中该方法包括使用如上文描述的任何修饰靶核酸的方法制备双链断裂。任选地,所述方法不在人类细胞中进行,其中所述人类细胞不是胚胎干细胞。本发明还提供了将核酸同源重组到人类细胞中期望的基因座处的dsDNA分子中以修饰现有的核苷酸序列或插入期望的核苷酸序列的方法,其中该方法包括使用如上文描述的任何修饰靶核酸的方法在期望基因座处制备双链断裂。任选地,所述方法不在人类细胞中进行,其中所述人类细胞不是胚胎干细胞。因此,本发明还提供了修饰生物体中的基因表达的方法,所述方法包括根据上文描述的任何方法修饰靶核酸序列,其中核酸是dsDNA,并且功能部分选自DNA修饰酶例如甲基化酶或乙酰基转移酶、转录活化物或转录阻遏物;并且其中所述生物体是人类。本发明另外地提供了修饰生物体中的基因表达的方法,该方法包括根据上文描述的任何方法修饰靶核酸序列,其中核酸是mRNA,并且功能部分是核糖核酸酶;任选地选自核酸内切酶、3’核酸外切酶或5’核酸外切酶;并且其中所述生物体是人类。靶核酸可以是DNA、RNA或合成的核酸。优选地,靶核酸是DNA;优选地dsDNA。然而,靶核酸可以是RNA;优选地mRNA。可选地,因此,本发明还提供了修饰靶核酸的方法,其中靶核酸是RNA。在另一个方面中,本发明提供了修饰人类细胞中的靶核酸的方法,其中核酸是dsDNA,至少一个功能部分是核酸酶或解旋酶-核酸酶,并且修饰是在期望的基因座处的单链断裂或双链断裂。任选地,所述人类细胞不是胚胎干细胞。任选地,其中所述方法不改变人类的生殖系遗传同一性。在另一个方面中,本发明提供了修饰人类细胞中的靶核酸的方法,其中修饰引起在期望的基因座处的基因表达的沉默;并且其中该方法包括以下步骤:a.制备在dsDNA分子中的双链断裂;和b.通过非同源末端连接NHEJ修复细胞中的dsDNA分子;任选地,所述人类细胞不是胚胎干细胞。任选地,其中所述方法不改变人类的生殖系遗传同一性。在另一个方面中,本发明提供了修饰人类细胞中的靶核酸的方法;其中现有的核苷酸序列被修饰或缺失和或期望的核苷酸序列被插入在期望的位置处,并且其中该方法包括以下步骤:a.制备在期望的基因座处的双链断裂;和b.通过同源重组修复细胞中的dsDNA分子;任选地,所述人类细胞不是胚胎干细胞。任选地,其中所述方法不改变人类的生殖系遗传同一性。在另一个方面中,本发明提供了修饰人类细胞中的基因表达的方法,所述方法包括如上文描述地修饰靶核酸序列;其中核酸是dsDNA,并且功能部分选自DNA修饰酶例如甲基化酶或乙酰基转移酶、转录活化物或转录阻遏物;任选地,所述人类细胞不是胚胎干细胞。任选地,其中所述方法不改变人类的生殖系遗传同一性。在另一个方面中,本发明提供了修饰人类细胞中的基因表达的方法,所述方法包括如上文描述地修饰靶核酸序列,其中核酸是mRNA,并且功能部分是核糖核酸酶;任选地选自核酸内切酶、3’核酸外切酶或5’核酸外切酶;任选地,所述人类细胞不是胚胎干细胞。任选地,其中所述方法不改变人类的生殖系遗传同一性。在另一方面中,本发明提供了如上文描述的修饰靶核酸的方法,其中该方法在45℃和100℃之间的温度进行。优选地,该方法在50℃或在50℃以上的温度进行。更优选地,该方法在55℃和80℃之间的温度进行。最佳地,该方法在60℃和65℃之间的温度进行。可选地,该方法可以在20℃和45℃之间的温度进行。更优选地,在30℃和45℃之间的温度进行。甚至更优选地,在37℃和45℃之间的温度进行;任选地,其中靶核酸是在人类细胞中。任选地,所述人类细胞不是胚胎干细胞。任选地,其中所述方法不改变人类的生殖系遗传同一性。在上文描述的修饰靶核酸的任何方法中,细胞可以是人类细胞。任选地,在上文描述的修饰靶核酸的任何方法中,所述人类细胞可以不是胚胎干细胞。任选地,所述方法不改变人类的生殖系遗传同一性。宿主细胞有益地,本文描述的方法具有宽的适用性,并且本发明的宿主细胞可以来源于可以被培养的任何人类细胞。因此,本发明提供了通过如上文描述的方法转化的人类细胞。本发明提供了经转化的人类细胞,该经转化的人类细胞具有在双链靶多核苷酸中的靶核酸序列,所述细胞包含如本文提供的Cas蛋白或多肽和至少一种如本文提供的靶向RNA分子、和包含编码所述Cas蛋白和所述靶向RNA分子中的至少一种的核酸的表达载体。任选地,所述人类细胞可以不是胚胎干细胞。可以选择通常被使用的宿主细胞用于根据本发明的用途,所述通常被使用的宿主细胞包括遗传上可获得的并且可以被培养的人类细胞,例如包括人类细胞但不是胚胎干细胞。用于根据本发明的用途的优选的宿主细胞通常是通常表现出高生长速率、易于培养和或转化、显示短的世代时间的那些宿主细胞,已经建立了与它们相关的遗传资源的宿主细胞或已经被选择、修饰或合成以用于在特定条件下的异源蛋白的最佳表达的细胞。在其中感兴趣的蛋白最终被用于特定的工业或治疗情况的本发明的优选的实施方案中,可以基于期望的特定条件或感兴趣的蛋白将被部署在其中的细胞情况来选择适当的宿主细胞。优选地,宿主细胞将是人类细胞。本文描述的本发明的方法和用途可以被用于修饰人类细胞的基因组。附图简述现在将参考具体实施方案并且参考附图详细地描述本发明,在附图中:图1示出了Cas9蛋白序列的邻接树。包括基于pBLAST或PSI-BLAST与菌株T12具有高于40%的序列相似性的所有序列,以及目前良好表征的序列酿脓链球菌S.pyogenes、嗜热链球菌S.thermophiles和内氏放线菌A.naeslundii,以及当这些低于40%同一性时所有目前鉴定的嗜热序列。对于所有的嗜热序列,在菌株名称之后指示出与T12的同一性百分比。在物种名称前指示出基因标识符gi编号。图例:实心圆形:嗜热最佳温度为60℃以上Cas9序列,实心方形:耐热最佳温度5’exo-聚合酶NEB至每个退火的寡聚物混合物并且然后添加2.5μl的10μMdNTP。在37℃孵育持续1h,并且然后在75℃孵育持续20min。3.添加2μl的HF-BamHI和2μl的BspHI限制性酶至46μl的退火混合物。在37℃孵育持续1h。该过程将导致SpPAMbb插入物具有粘性末端。使用ZymoDNA清洗和浓缩试剂盒ZymoResearch清洗创建的插入物。4.用HF-BamHI和BspHINEB消化pNW33n,并且使用ZymoDNA清洗和浓缩试剂盒ZymoResearch纯化具有粘性末端的3,400bp长的线性pNW33nbb片段。5.根据所提供的方案,使用NEBT4连接酶将50ng的pNW33nBB与11ng的SPPAMbb插入物进行连接。使用ZymoDNA清洗和浓缩试剂盒ZymoResearch纯化连接混合物。6.转化DH10b电感受态细胞200μl细胞,用500ng的DNA。在SOC培养基在800μlSOC中200μl细胞中回收细胞持续1小时,并且然后用回收的细胞接种50ml的LB+12.5μgml氯霉素。在37℃和180rpm,孵育培养物过夜。7.使用JetStar2.0maxiprep试剂盒GENOMED从培养物分离质粒DNA。8.根据所提供的方案,使用SapINEB限制性处理用于使分离的质粒线性化。PAM确定反应的设计和执行设置以下裂解反应,用于将gtCas9诱导的dsDNA断裂引入至PAM文库成员,所述PAM文库成员包含在靶向的前间区的3’末端下游的正确PAM:1.每反应2.5μg的E.cloni::pRham:cas9gtCFE2.sgRNA至30nM最终浓度3.每反应200ng的线性化的PAM文库4.2μl的裂解缓冲液100mM磷酸钠缓冲液pH=7.5、500mMNaCl、25mMMgCl2、25%vv甘油、5mMDTT5.MQ水,直到20μl最终体积反应在60℃孵育持续1h,并且在加入4μl的6×凝胶加样染料NEB后终止。然后将反应混合物加样至1%琼脂糖凝胶。凝胶在100V经历1h和15min长的电泳,并且然后在包含10μl的SYBRGold染料ThermoFisher的100ml0.5×TAE缓冲液中孵育持续30min。根据所提供的方案,在用蓝光使DNA条带可视化后,从凝胶上切下与成功地裂解的和包含PAM的DNA片段对应的条带,并且使用“ZymocleanTMGelDNARecoveryKit”进行凝胶纯化。对包含PAM的gtCas9裂解的DNA片段加标签用于测序Cas9诱导的DNA断裂通常被引入在前间区的第3个和第4个核苷酸之间,靠近PAM序列。因此,不可能设计可以PCR扩增裂解的DNA片段的包含PAM的部分的一对引物,以进一步测序和确定PAM序列。为了该目标,使用了5步的过程:第1步:用Taq聚合酶接A尾A-Tailing接A尾是使用Taq聚合酶将非模板的腺嘌呤添加至双链DNA分子的平的3’末端的过程反应组分:·gtCas9-裂解的和包含PAM的DNA片段–200ng·缓冲液NEB–5μl·1mMdATP-10μl·TaqDNA聚合酶NEB-0.2μl·H2O-直到50μl最终反应体积·孵育时间-20min·孵育温度-72℃第2步:测序衔接子的构建将两个互补的短ssDNA寡核苷酸磷酸化和退火,以形成用于来自第1步的DNA片段的PAM近端位点的测序衔接子。其中一种寡核苷酸在其3’末端处具有另外的胸腺嘧啶,以促进将衔接子连接至接A尾的片段。衔接子寡核苷酸磷酸化对于每个寡聚物,单独的磷酸化反应·100μM寡核苷酸原液stock–2μL·10×T4DNA连接酶缓冲液NEB–2μL·无菌MQ水–15μL·T4多核苷酸激酶NEB–1μL·孵育时间–60min·孵育温度–37℃·T4PNK失活–65℃持续20min磷酸化的寡核苷酸的退火·寡核苷酸1–来自对应的磷酸化混合物的5μL混合物·寡核苷酸1–来自对应的磷酸化混合物的5μL混合物·无菌MQ水–90μL·将磷酸化的寡聚物在95℃孵育持续3分钟。在室温,缓慢地冷却反应持续~30min至1hr第3步:gtCas9裂解的接A尾的片段与测序衔接子的连接根据以下方案,使第1步和第2步的产物进行连接:·10×T4DNA连接酶缓冲液–2μL·第1步的产物–50ng·第2步的产物–4ng·T4DNA连接酶–1μl·无菌MQ水–至20μl·孵育时间–10min·孵育温度–20-25℃·在65℃加热失活持续10min第4步:150个核苷酸长的包含PAM片段的PCR扩增使用来自第4步的连接混合物的5μl混合物作为用于使用Q5DNA聚合酶NEB的PCR扩增的模板。具有来自第2步的胸腺嘧啶延伸的寡核苷酸被用作正向引物,并且反向引物被设计为在PAM序列下游的150个核苷酸处退火。使用非gtCas9处理的PAM文库DNA作为模板来扩增相同的序列。两种PCR产物被凝胶纯化,并且送出用于IlluminaHiSeq2500配对末端测序paired-endsequencingBaseclear。测序结果的分析和候选PAM序列的确定在分析测序结果后,构建了以下频率矩阵。这些矩阵描绘了在gtCas9消化的和非消化的文库的每个PAM位置处的每个核苷酸的相对丰度:这些结果指示对于在第5个PAM位置具有胞嘧啶的靶的明显的偏好和对于在前4个PAM位置具有胞嘧啶的靶的偏好。实施例7:对于gtCas9的计算机模拟PAM预测如果在基因组数据库中足够的前间区序列是可得的,PAM的计算机模拟预测是可能的。gtCas9PAM的计算机模拟预测以以下开始:通过与在基因组数据库诸如GenBank中的序列比较,鉴定来自CRISPR阵列的间隔区在热脱氮地芽孢杆菌T12菌株的基因组中的击中。使用“CRISPR查找器”http:crispr.u-psud.frServer工具以鉴定在T12中的候选CRISPR基因座。然后,将鉴定的CRISPR基因座输出加载到“CRISPR靶”http:bioanalysis.otago.ac.nzCRISPRTargetcrispr_analysis.html工具中,该工具搜索选定的数据库并且提供具有匹配前间区的输出。然后,筛选这些前间区序列以确定独特的击中和与间隔区的互补性—例如,在种子序列中的错配被认为可能是假阳性击中并且被排除在进一步分析之外。与前噬菌体序列和整合的质粒具有同一性的击中证明了获得的击中是真阳性。总的来说,该过程产生了6个单击中图7。随后,使用WebLogohttp:weblogo.berkeley.edulogo.cgiCrooks_GE、Hon_G、Chandonia_JM、Brenner_SEWebLogo:Asequencelogogenerator,GenomeResearch,14:1188-1190,2004工具图8,对剩余的独特前间区击中的侧翼区域对于II型gtCas核酸酶的3’进行比对和比较以确定共有序列。计算机模拟结果与体外PAM鉴定实验结果参见实施例6相当,其中存在PAM序列的第5个残基的身份偏向为胞嘧啶。实施例8:对于gtCas9的8个核苷酸长的PAM序列的确定来自实施例8的计算机模拟数据表明gtCas9在第8个位置处具有对于腺苷的某种偏好,因此进行了进一步的PAM确定实验,其中还测试了PAM序列的第8个位置。这与嗜温侧孢短芽孢杆菌SSP360D4Karvelis等人,2015年Cas9PAM序列的表征是一致的,发现嗜温侧孢短芽孢杆菌SSP360D4Cas9PAM序列在前间区的3’末端处的第5个和第8个位置之间延伸。用gtCas9试验了PAM的特定8个核苷酸长的序列变体:1CNCCCCAC[SEQIDNO:17]、2CCCCCCAG[SEQIDNO:18]、3CCCCCCAA[SEQIDNO:11]、4CCCCCCAT[SEQIDNO:19]、5CCCCCCAC[SEQIDNO:20]、6NNNNTNNC阴性对照PAM。在60℃进行体外裂解测定后,如之前一样地参见实施例6用纯化的gtCas9和相同的sgRNA靶向这些非线性化的质粒,当CCCCCCAA[SEQIDNO:11]序列被用作PAM时,观察到增加的gtCas9裂解活性图9。然而,对于所有测试的PAM序列,裂解活性明确地是可检测的,即使对于阴性对照PAM序列,观察到微弱的裂解条带。不希望受限于特定的理论,可能的是,高gtCas9浓度的使用促成通过阴性对照观察到的裂解。通常地已经观察到,在体外测定中高Cas9浓度导致Cas9诱导的DNA裂解,而无严格的PAM需求。通常地,已知Cas9浓度会影响Cas9诱导的DNA裂解的效率Cas9浓度越高,引起越高的Cas9活性。这也是当使用具有CCCCCCAA[SEQIDNO:11]PAM序列的靶向的质粒和不同的gtCas9浓度进行体外测定时观察到的图10。如以上描述的,具有CCCCCCAA[SEQIDNO:11]PAM序列的靶向的质粒用于体外测定,在38℃和78℃之间的宽的温度范围中进行所述体外测定图11。出乎意料地,gtCas9在所有温度是有活性的,在40.1℃和64.9℃之间显示出最高的活性。因此,来自地芽孢杆菌属的种的Cas9的最佳温度范围比迄今已经被表征的Cas9蛋白的最佳温度范围高得多。类似地,其中来自地芽孢杆菌属的种的Cas9保持核酸酶活性的范围的上限比已知的Cas9蛋白的范围的上限高得多。较高的最佳温度和功能范围在高温度的遗传工程中提供了显著的优点,并且因此在编辑嗜热生物体的基因组中提供了显著的优点,其在升高的温度进行的一系列工业、农业和制药过程中具有效用。实施例9:用gtCas9和8个核苷酸长度的PAM序列对史氏芽孢杆菌ET138进行体内基因组编辑为了证实8个核苷酸的PAM也被gtCas9体内识别,设计了在55℃使在史氏芽孢杆菌ET138基因组中的pyrF基因缺失的实验。该方法依赖于提供同源重组模板构建体,在同源重组模板构建体中与靶pyrF基因上游和下游互补的区域被提供至史氏芽孢杆菌ET138细胞。模板的引入允许同源重组的过程被用于将同源重组模板不具有pyrF基因引入到基因组中,使得它也代替在细胞的基因组中的WTpyrF基因。在同源重组构建体中包含gtCas9和sgRNA可以被用于将双链DNA断裂DSDB引入到包含WTpyrF的细菌基因组中。通常地,在细菌基因组中的DSDB引起细胞死亡。因此,识别WTpyrF中的序列的sgRNA可以引起DSDB和仅包含WTpyrF的细胞的死亡。DSDB的引入还取决于合适的PAM序列,该合适的PAM序列位于被gtCas9识别的前间区的3’末端的下游。使用pNW33n质粒作为骨架以克隆:i在内部开发的葡萄糖阻遏启动子的控制下的cas9gt基因;和ii在史氏芽孢杆菌ET138的基因组中的pyrF基因的1kb上游和1kb下游区域作为用于同源重组的模板,该同源重组将引起pyrF基因从史氏芽孢杆菌ET138的基因组的缺失;和iii在组成型启动子的转录控制下的表达单指导RNAsgRNA的模块。生成了三种单独的构建体,其中单指导RNA序列在前20个核苷酸是不同的,所述前20个核苷酸对应于将gtCas9指导至在基因组中的其特异性DNA靶也被称为间隔区的序列。三种不同的间隔区序列被设计为靶向三种不同的候选前间区,其全部都在史氏芽孢杆菌ET138的pyrF基因中。这些构建体在本文中分别地被称为构建体1、构建体2和构建体3。三种不同的靶向的前间区在其3’末端具有以下候选PAM序列:1.TCCATTCC根据体外测定的结果,阴性对照;被构建体编号3上编码的sgRNA靶向的前间区的3’-末端2.ATCCCCAA被构建体编号1上编码的sgRNA靶向的前间区的3’-末端;[SEQIDNO:21]3.ACGGCCAA被构建体编号2上编码的sgRNA靶向的前间区的3’-末端;[SEQIDNO:22]在用三种构建体之一转化史氏芽孢杆菌ET138细胞并且在筛选板上铺板后,获得以下结果:1.当用靶向前间区前间区在3’末端具有阴性对照TCCATTCCPAM序列的构建体构建体编号3转化细胞时,转化效率不受影响图12A。菌落的数目在与用pNW33n阳性对照构建体转化后的菌落的数目相同的范围中图12B。15个菌落经历菌落PCR以筛选其中缺失pyrF基因的菌落,没有一个显示出缺失基因型-2.1kb的预期条带尺寸-,所有菌落是野生型-2.9kb的预期条带尺寸-图13。这指示测试的PAM事实上在体内没有被gtCas9识别。2.当用构建体编号1转化细胞时,当与阳性对照用pNW33n转化的细胞相比时,仅获得几个菌落图12C。20个菌落经历菌落PCR以筛选其中缺失pyrF基因的菌落。大多数19个菌落包含野生型和pyrF缺失基因型二者,而一个菌落具有pyrF缺失基因型图14。该结果指示,PAM序列ATCCCCAA[SEQIDNO:21]在体内被gtCas9识别,因为没有观察到仅WT基因型。降低的转化效率也指示一部分的细胞群体已经被减少,其可以是可归因于由于通过gtCas9的成功靶向,通过DSDB对仅WT基因型细胞引起的细胞死亡。3.当用构建体编号2转化细胞时,没有获得菌落图12D。菌落的缺乏指示所有的细胞群体已经成功地被gtCas9靶向,其导致通过DSDB引起的细胞死亡。这表明ACGGCCAA[SEQIDNO:22]PAM被gtCas9识别。这些结果指示,用以上提及的PAM序列,gtCas9在55℃在体内是有活性的,该结果与体外PAM确定结果一致。此外,它可以在相同的温度与质粒携带的同源重组模板组合用作基因组编辑工具。实施例10:ThermoCas9鉴定和纯化我们最近分离并且测序了热脱氮地芽孢杆菌T12菌株,这是一种革兰氏阳性、中等嗜热细菌,其最佳生长温度在65℃Daas等人Biotechnol.Biofuels9,2102016。与先前的声称相反,该声称为在嗜热细菌中不存在II型CRISPR-Cas系统Li等人NucleicAcidsRes.44,e34-e342016,测序结果揭示了热脱氮地芽孢杆菌T12的基因组中存在IIC型CRISPR-Cas系统图15A。与其他Cas9直系同源物诸如SpCas91368个氨基酸相比,该系统的Cas9核酸内切酶ThermoCas9被预测是相对地小的1082个氨基酸。大小差异主要是由于截短的REC叶,如已经对于其他小Cas9直系同源物证明的图19Ran等人Nature520,186-1912015。此外,预期ThermoCas9至少在热脱氮地芽孢杆菌T12的最佳温度附近是有活性的Daas等人Biotechnol.Biofuels9,2102016。使用ThermoCas9序列作为查询序列,我们在NCBI非冗余蛋白序列数据集中进行了BLAST-P搜索,并且发现了许多高度同一的Cas9直系同源物在蛋白水平上87-99%同一性,表1,主要地在地芽孢杆菌属中,支持了ThermoCas9是嗜热细菌的高度保守的防御系统的一部分的观点图15B。这些特征表明,它可能是用于开发作为用于嗜热微生物的基因组编辑和沉默工具的潜在候选物,和用于其中需要增强的蛋白稳健性的条件的潜在候选物。我们最初使用先前描述的方法Mougiakos等人TrendsBiotechnol.34,575-5872016;Ran等人Nature520,186-1912015对热脱氮地芽孢杆菌T12CRISPR-Cas系统的crRNA和tracrRNA模块进行了计算机模拟预测。基于该预测,通过将预测的全长crRNA30nt长间隔区,随后是36nt长重复和tracrRNA36nt长反向重复,随后是具有三个预测的发夹结构的88nt序列连接起来,设计了190nt的sgRNA嵌合体。将ThermoCas9在大肠杆菌中异源地表达并且纯化至均质性。假设将sgRNA装载至ThermoCas9将稳定蛋白,我们在60℃和65℃孵育纯化的用体外转录的sgRNA装载的apo-ThermoCas9和ThermoCas9,持续15min和30min。SDS-PAGE分析显示出,纯化的ThermoCas9在65℃变性,但在60℃不变性,而ThermoCas9-sgRNA复合体的变性温度是65℃以上图15C。被证明的ThermoCas9的热稳定性暗含了其作为耐热CRISPR-Cas9基因组编辑工具的潜力,并且鼓励我们更详细地分析一些相关的分子特征。表1.来自图1B的Cas9蛋白序列与ThermoCas9相比的pBLAST结果。实施例11:ThermoCas9PAM确定表征ThermoCas9的第一步是进行计算机模拟预测它对于成功地裂解DNA靶的PAM偏好。我们使用热脱氮地芽孢杆菌T12CRISPR基因座的10个间隔区,使用CRISPR靶Biswas等人RNABiol.10,817-8272013在病毒和质粒序列中搜索潜在的前间区。因为用噬菌体基因组仅获得两个击中图20A,所以决定用体外PAM确定方法继续进行。我们体外转录了预测的sgRNA序列,该sgRNA序列包含用于基于ThermoCas9的靶向的线性dsDNA底物的间隔区和匹配的前间区。前间区在其3’末端处侧翼为随机化的7个碱基对bp的序列。在55℃进行基于ThermoCas9的裂解测定后,对文库的裂解的成员与作为对照的非靶向的文库样品一起进行了深度测序和比较了,以鉴定ThermoCas9PAM偏好图16A。测序结果揭示了,ThermoCas9引入双链DNA断裂,类似于嗜温Cas9变体,主要位于第3个和第4个PAM近端核苷酸之间。此外,裂解的序列揭示了ThermoCas9识别5’-NNNNCNR-3’PAM,在第1个、第3个、第4个和第6个PAM位置处对于胞嘧啶具有细微的偏好图16B。最近的研究已经揭示了第8个PAM位置对于某些IIC型Cas9直系同源物的靶识别的重要性Karvelis等人GenomeBiol.16,2532015;Kim等人GenomeRes.24,1012-92014。为了该目的,并且考虑到来自计算机模拟ThermoCas9PAM预测的结果,我们进行了另外的PAM确定测定。这揭示了在第8个PAM位置处腺嘌呤的存在下的最佳靶向效率图16C。有趣的是,尽管击中的次数有限,上文提及的计算机模拟PAM预测图20B也表明了在第5个PAM位置的胞嘧啶和在第8个PAM位置的腺嘌呤的重要性。为了进一步阐明PAM在第6个和第7个PAM位置的模糊性,我们生成了一组16个不同的靶DNA片段,在所述靶DNA片段中匹配的前间区的侧翼为5’-CCCCCNNA-3’[SEQIDNO:13]PAM。进行了这些片段每个片段具有第6个和第7个核苷酸的独特组合的裂解测定,其中不同的组分ThermoCas9、sgRNA指导、dsDNA靶在不同的温度20℃、30℃、37℃、45℃、55℃和60℃单独地预加热持续10min,然后组合它们并且在对应的测定温度孵育持续1小时。当在37℃和60℃之间的温度进行测定时,所有不同的DNA底物被裂解图16D、图21。然而,消化最多的靶片段由PAM序列第5个至第8个PAM位置5’-CNAA-3’和5’-CMCA-3’组成,而消化最少的靶包含5’-CAKA-3’PAM。在30℃,仅观察到具有最佳PAM序列第5个至第8个PAM位置5’-CNAA-3’和5’-CMCA-3’的DNA底物的裂解图2D。最后,在20℃,仅具有第5个至第8个PAM位置5’-CVAA-3’和5’-CCCAPAM序列的DNA底物被靶向图21,使得这些序列成为最优选的PAM。这些发现证明,在其温度下限,ThermoCas9仅裂解具有优选的PAM的片段。可以在体内编辑过程期间开发该特征,例如以避免脱靶效应。实施例12:热稳定性和截短预测的tracrRNA由反向重复区域随后是三个发夹结构组成图17A。使用tracrRNA随crRNA一起形成sgRNA嵌合体,引起DNA底物的成功的指导的裂解。观察到全长的重复-反向重复发夹的间隔区远端的41-nt长的缺失图17A,最可能更类似于双指导的天然状态,对DNA裂解效率具有很少影响或没有影响。通过进行裂解时间序列来评价预测的发夹的进一步截短图17A对ThermoCas9裂解效率的作用,其中所有组分sgRNA、ThermoCas9、底物DNA在不同的温度37-65℃单独地预加热持续1min、2min和5min,然后将它们进行组合并且在多种测定温度37-65℃孵育持续1小时。tracrRNA支架的预测的茎环的数目看起来在DNA裂解中起着至关重要的作用;当所有三个环存在时,在所有测试的温度,裂解效率是最高的,而去除3’发夹后效率减少图17B。此外,去除中间发夹和3’发夹二者后,裂解效率急剧地下降图22。尽管在65℃预加热ThermoCas9持续1min或2min引起可检测的裂解,但在孵育5分钟后裂解活性被消除。热稳定性测定显示出,不具有3’茎环的sgRNA变体引起ThermoCas9蛋白在65℃的稳定性减少,指示出在升高的温度的最佳的基于ThermoCas9的DNA裂解需要全长的tracrRNA。另外地,我们还改变了间隔区序列的长度从25nt至18nt,并且发现23个、21个、20个和19个的间隔区长度以最高的效率裂解靶。当使用18nt的间隔区时,裂解效率显著地下降。在体内,ThermoCas9:sgRNARNP复合体可能在几分钟内形成。连同以上发现,这促使我们评价RNP的活性和热稳定性。在60℃、65℃和70℃加热预组装的RNP复合体持续5min和10min,然后添加预加热的DNA,并且随后在60℃、65℃和70℃孵育持续1小时。引人注目的是,我们观察到ThermoCas9RNP在高达70℃是有活性的,尽管它在70℃预加热持续了5min图17C。该发现证实了我们的假设,即ThermoCas9稳定性与适当的sgRNA指导的缔合紧密地相关Ma等人,Mol.Cell60,398–4072015。在一些应用中,ThermoCas9具有宽的温度活性范围即在低的温度和高的温度二者有功能,将是有益的。此外,在一些情况中,如果ThermoCas9的活性可以被限制在较窄的温度范围,例如,仅在低的温度或仅在高的温度有活性,将是有益的。因此,通过修饰ThermoCas9或相关的元件诸如sgRNA的结构特征,操作其中ThermoCas9能够进行靶向的裂解或结合或其中靶向的裂解或结合有效地发生的温度的范围的能力,将使得能够对核酸序列操作施加更大水平的控制。因此,我们开始将ThermoCas9的温度范围与酿脓链球菌Cas9SpCas9的温度范围进行比较。对两种Cas9同源物进行在20℃和65℃之间的体外活性测定。将两种蛋白在对应的测定温度孵育持续5min,然后添加sgRNA和靶DNA分子。与先前的分析26一致,嗜温SpCas9仅在25℃和44℃之间是有活性的图17D;在这些温度以上,SpCas9活性快速地减少至不可检测的水平。相反,在25℃和65℃之间可以检测到ThermoCas9裂解活性图17D。这指示出使用ThermoCas9作为用于嗜热生物体和嗜温生物体二者的基因组编辑工具的潜力。先前表征的嗜温Cas9核酸内切酶使用二价阳离子以催化在靶DNA中生成DSBJinek等人Science337,816-8212012;Chen等人J.Biol.Chem.289,13284-132942014。为了评价哪些阳离子有助于通过ThermoCas9的DNA裂解,在以下二价阳离子之一的存在下进行质粒裂解测定:Mg2+、Ca2+、Mn2+、Co2+、Ni2+和Cu2+;具有阳离子螯合剂EDTA的测定被包括作为阴性对照。如预期的,在二价阳离子的存在下靶dsDNA被裂解,并且在EDTA的存在下保持完整图23A。基于某些IIC型系统是有效的单链DNA切割物的报道Ma等人Mol.Cell60,398-4072015;Zhang等人Mol.Cell60,242-2552015,我们测试了ThermoCas9对ssDNA底物的活性。然而,没有观察到裂解,指示出ThermoCas9是dsDNA核酸酶图23B。实施例13:嗜热史氏芽孢杆菌中基于ThermoCas9的基因缺失我们开始开发用于嗜热细菌的基于ThermoCas9的基因组编辑工具。在这里,我们示出了使用在55℃培养的史氏芽孢杆菌ET138的原理的证明。为了使用最少的遗传部件,我们遵循了单个质粒方法。我们构建了一组基于pNW33n的pThermoCas9质粒,其包含在天然xylL启动子PxylL控制下的thermocas9基因、用于修复在感兴趣的基因中的Cas9诱导的双链DNA断裂的同源重组模板、和在来自凝结芽孢杆菌的组成型pta启动子Ppta控制下的表达sgRNA的模块图4A。第一个目标是使全长的pyrF基因从史氏芽孢杆菌ET138的基因组缺失。使用pNW33n来源的质粒pThermoCas9_bsΔpyrF1和pThermoCas9_bsΔpyrF2用于表达不同的ThermoCas9指导,所述不同的ThermoCas9指导带有靶向pyrF基因的不同位点的间隔区,而第三个质粒pThermoCas9_ctrl包含在表达sgRNA的模块中的随机非靶向间隔区。用对照质粒pNW33n无指导和pThermoCas9_ctrl在55℃转化史氏芽孢杆菌ET138感受态细胞,引起对于每种质粒~200个菌落的形成。在10个筛选的pThermoCas9_ctrl菌落中,没有一个包含ΔpyrF基因型,证实了来自先前的研究的发现,即在史氏芽孢杆菌ET138中的同源重组不足以获得完全的突变体Mougiakos等人ACSSynth.Biol.6,849-8612017;Bosma等人Microb.CellFact.14,992015。相反,用pThermoCas9_bsΔpyrF1和pThermoCas9_bsΔpyrF2质粒转化分别地产生20个和0个菌落,证实了在55℃ThermoCas9的体内活性,并且验证了蛋白的以上描述的宽的体外温度范围。在10个筛选的pThermoCas9_ΔpyrF1菌落中,一个是完全的ΔpyrF突变体,而剩余的菌落具有混合的野生型ΔpyrF基因型图4B,证明了该系统的适用性,因为靶向的pyrF基因的设计的同源定向修复是成功的。尽管如此,在严格控制的基于SpCas9的反选择系统中,我们先前开发的pyrF缺失效率是更高的Olson等人,Curr.Opin.Biotechnol.33,130-1412015。在基于ThermoCas9的工具中获得的转化体和完全突变体的数目低可以解释为在史氏芽孢杆菌中同源重组效率低Olson等人,Curr.Opin.Biotechnol.33,130-1412015与高活性的ThermoCas9的组成型表达的组合。预计使用严格可控的启动子将增加效率。实施例14:嗜温恶臭假单胞菌中基于ThermoCas9的基因缺失为了拓宽基于ThermoCas9的基因组编辑工具的适用性,并且为了评价体外结果是否可以在体内被证实,通过将同源重组和基于ThermoCas9的反选择组合来评价其在嗜温革兰氏阴性细菌恶臭假单胞菌KT2440中的活性。对于该生物体,迄今尚未报道基于Cas9的工具。再次,我们遵循单个质粒方法。我们构建了基于pEMG的pThermoCas9_ppΔpyrF质粒,该质粒包含在3-苯甲酸甲酯诱导型Pm启动子的控制下的thermocas9基因、用于pyrF基因的缺失的同源重组模板和在组成型P3启动子的控制下的表达sgRNA的模块。在转化恶臭假单胞菌KT2440细胞和PCR证实质粒整合后,将菌落接种在选择性液体培养基中用于在37℃过夜培养。使用过夜培养物用于接种选择性培养基,并且用3-苯甲酸甲酯诱导ThermoCas9表达。随后,将稀释物铺板在补充有3-苯甲酸甲酯的非选择性培养基上。为了比较,进行了平行实验,即不用3-苯甲酸甲酯诱导ThermoCas9表达。该过程产生了,对于诱导的培养物的76个菌落和对于非诱导的对照培养物的52个菌落。对于诱导的培养物,38个菌落50%具有完全的缺失基因型,并且6个菌落具有混合的野生型缺失基因型。相反,非诱导的培养物的仅1个菌落2%具有缺失基因型,并且未获取到具有混合的野生型缺失基因型的菌落图24。这些结果显示出,当在37℃生长时ThermoCas9可以被用作在嗜温恶臭假单胞菌KT2440中的有效反选择工具。实施例15:基于ThermoCas9的基因沉默目前没有一种可用的有效的热活性转录沉默CRISPRi工具。这类系统在许多应用中可以是有用的。例如,这类系统将极大地促进嗜热菌的代谢研究。ThermoCas9的催化上死亡的变体可以通过稳定地与DNA元件结合而不引入dsDNA断裂来用于该目的。为此,我们鉴定了ThermoCas9的RuvC和HNH催化结构域,并且将对应的D8A和H582A突变引入用于创建死亡的dThermoCas9。在证实设计的序列后,异源地产生、纯化了Thermo-dCas9,并且将其与在上文提及的ThermoCas9测定中使用的相同的DNA靶一起用于体外裂解测定;没有观察到裂解,证实了核酸酶的催化的失活。为了开发基于Thermo-dCas9的CRISPRi工具,我们的目标是使来自史氏芽孢杆菌ET138的基因组的高度表达的ldhL基因转录沉默。我们构建了基于pNW33n的pThermoCas9i_ldhL和pThermoCas9i_ctrl载体。两种载体包含在PxylL启动子的控制下的thermo-dCas9基因和在组成型Ppta启动子的控制下的表达sgRNA的模块图4C。pThermoCas9i_ldhL质粒包含间隔区,该间隔区用于靶向史氏芽孢杆菌ET138中的138ldhL基因的5’末端处的非模板DNA链图S7。位置和靶向的链选择是基于先前的研究Bikard等人NucleicAcidsRes.41,7429-74372013;Larson等人Nat.Protoc.8,2180-21962013,目的是ldhL基因的有效下调。pThermoCas9i_ctrl质粒包含在表达sgRNA的模块中的随机非靶向间隔区。使用该构建体以在55℃转化史氏芽孢杆菌ET138感受态细胞,随后是在LB2琼脂平板上铺板,产生等量的菌落。如先前描述的Bosma等人Appl.Environ.Microbiol.81,1874-18832015,选择每个构建体大约700个菌落中的两个用于在微需氧乳酸盐产生条件下培养持续24小时。pThermoCas9i_ldhL培养物的生长比pThermoCas9i_ctrl培养物的生长少50%图4E。我们先前已经显示出,由于在微需氧条件下缺乏基于Ldh的NAD+再生能力,ldhL基因的缺失引起史氏芽孢杆菌ET138中的严重生长迟缓Bosma等人Microb.CellFact.14,992015。因此,观察到的生长减少可能是由ldhL基因的转录抑制和随后的由于NAD+再生能力的损失而引起的氧化还原失衡引起的。事实上,HPLC分析揭示了ldhL沉默的培养物的乳酸盐产生降低了40%,并且RT-qPCR分析显示出与pThermoCas9i_ctrl培养物相比,在pThermoCas9i_ldhL培养物中ldhL基因的转录水平显著地降低图4E。实施例16:概述大多数CRISPR-Cas应用是基于由第2类CRISPR-Cas蛋白诸如Cas9和Ca12a对RNA指导的DNA干扰Komor等人,Cell168,20-362017;Puchta,Curr.Opin.PlantBiol.36,1-82017;Xu等人J.Genet.Genomics42,141-1492015;Tang等人Nat.Plants3,170182017;Zetsche等人Nat.Biotechnol.35,31-342016;Mougiakos等人,TrendsBiotechnol.34,575-5872016。在本研究前,嗜热微生物中没有鉴定和表征到第2类CRISPR-Cas免疫系统,与之相反的是嗜热细菌和古核生物中存在的高度丰富的第1类CRISPR-Cas系统Makarova等人,Nat.Rev.Microbiol.13,722-7362015;Weinberger等人,MBio3,e00456-122012,其中一些已经被用于嗜热菌的基因组编辑Li等人NucleicAcidsRes.44,e34-e342016。因此,由于所使用的Cas-核酸内切酶的嗜温性质,CRISPR-Cas技术的应用主要地局限于低于42℃的温度。因此,这已经排除了这些技术在专性嗜热菌中和在需要升高的温度和或改进的蛋白稳定性的实验方法中的应用。本发明人已经表征了来自嗜热细菌热脱氮地芽孢杆菌T12的Cas9直系同源物即ThermoCas9,热脱氮地芽孢杆菌T12是我们先前从堆肥分离的菌株Daas等人,Biotechnol.Biofuels9,2102016。数据挖掘揭示了其他嗜热菌的基因组中的另外的Cas9直系同源物,所述另外的Cas9直系同源物几乎是与ThermoCas9相同的,这是第一次显示出CRISPR-CasII型系统确实存在于嗜热菌中,至少存在于芽孢杆菌属和地芽孢杆菌属的一些分支中。本发明人已经显示出,ThermoCas9在体外在20-70℃的宽的温度范围中是有活性的,这比其嗜温直系同源物SpCas9的25-44℃范围宽得多。ThermoCas9的延伸的活性和稳定性允许其在需要在20-70℃的温度进行DNA操作的分子生物学技术中的应用,以及其在需要稳健的酶活性的严苛环境中的利用。此外,本发明人已经鉴定了几个对于赋予ThermoCas9的热稳定性重要的因素。首先,本发明人已经证明,ThermoCas9的PAM偏好对于在温度范围的较低部分≤30℃的活性是非常严格的,而在中等至最佳温度37-60℃对于活性允许PAM中的更多的变化。其次,本发明人已经证明ThermoCas9活性和热稳定性强烈地取决于与适当的sgRNA指导的缔合。不希望受任何特定理论的束缚,本发明人假设多结构域Cas9蛋白的这种稳定化最可能是从开放柔性状态openflexiblestate到相当紧密状态compactstate的主要构象变化的结果,如针对在指导结合时的SpCas9描述的Jinek等人Science343,1247997-12479972014。基于在此描述的新型ThermoCas9的表征,本发明人已经成功地开发了用于严格嗜热原核生物的基因组工程工具。我们显示出ThermoCas9在体内在55℃和37℃是有活性的,并且我们将目前的基于Cas9的工程技术适用于嗜热史氏芽孢杆菌ET138和嗜温恶臭假单胞菌KT2440。由于ThermoCas9的宽的温度范围,预计简单、有效和基于单个质粒的ThermoCas9方法将合适地用于宽的范围的嗜热微生物和嗜温微生物,所述嗜热微生物和嗜温微生物可以在从37℃直至70℃的温度生长。这补充了现有的嗜温技术,允许其用于对于这些有效工具迄今为止不可得的大量生物体使用。从自然资源筛选具有期望的性状的新型酶无疑是有价值的。先前的研究已经表明,用定向演化directedevolution和蛋白工程使嗜温Cas9直系同源物适应于更高的温度,将是为了构建嗜热Cas9蛋白的最佳途径29。相反,我们在一些嗜热细菌中鉴定了Cas9的分支,并且将这些耐热ThermoCas9变体之一转化为用于嗜热生物体和嗜温生物体二者的强大的基因组工程工具。通过本研究,我们进一步拓展了基于Cas9的基因组编辑技术的潜力,并且打开了用于在严苛条件下或需要在宽的温度范围中的活性的新型应用中使用Cas9技术的新的可能性。实施例17:材料和方法a.细菌菌株和生长条件使用中等嗜热菌史氏芽孢杆菌ET138ΔsigFΔhsdRMougiakos,等人,2017ACSSynth.Biol.6,849-861用于使用ThermoCas9的基因编辑和沉默实验。将该细菌在55℃、在LB2培养基Bosma,等人Microb.CellFact.14,992015中生长。对于平板,在所有实验中,使用每一升的培养基30g的琼脂Difco。如果需要,添加浓度为7μgmL的氯霉素。对于蛋白表达,在摇动培养箱中以120rpm在37℃在烧瓶中的LB培养基中使大肠杆菌RosettaDE3生长,直到达到OD600nm为0.5,之后温度转换至16℃。在30min后,通过添加异丙基-1-硫代-β-d-半乳糖基吡喃糖苷IPTG至0.5mM的最终浓度来诱导表达,之后在16℃继续孵育。对于克隆第6个、第7个和第8个位置的PAM构建体,根据制造商提供的手册转化DH5-α感受态大肠杆菌NEB,并且在37℃在LB琼脂平板上生长过夜。对于克隆简并7-nt长的PAM文库,根据标准程序Sambrook,Fritsch&Maniatis,T.Molecularcloning:alaboratorymanual.ColdSpringHarborLaboratory,1989转化电感受态DH10B大肠杆菌细胞,并且在37℃在LB琼脂平板上生长过夜。使用大肠杆菌DH5αλpirInvitrogen用于使用由Ausubel等人CurrentProtocolsinMolecularBiology.JohnWiley&Sons,Inc.,2001.doi:10.10020471142727描述的转化程序的恶臭假单胞菌质粒构建。对于所有大肠杆菌菌株,如果需要,使用浓度为25mgL的氯霉素和浓度为50mgL的卡那霉素。除非另有说明,否则在37℃在LB培养基中培养恶臭假单胞菌KT2440DSM6125菌株。如果需要,添加浓度为50mgL的卡那霉素和浓度为3mM的3-苯甲酸甲酯。b.ThermoCas9表达和纯化从热脱氮地芽孢杆菌T12的基因组PCR扩增ThermoCas9,然后克隆并且在大肠杆菌RosettaDE3中异源地表达,并且通过Ni2+亲和、阴离子交换和凝胶过滤层析步骤的组合使用FPLC纯化。通过使用寡核苷酸表2的连接不依赖性克隆,将基因序列插入到pML-1B质粒从UCBerkeleyMacroLab获得,Addgene#29653中,以生成编码ThermoCas9多肽序列1-1082残基的蛋白表达构建体,该ThermoCas9多肽序列与包含六个组氨酸序列和烟草蚀纹病毒TobaccoEtchVirusTEV蛋白酶裂解位点的N-末端标签融合。为了表达催化上失活的ThermoCas9蛋白Thermo-dcas9,使用PCR插入D8A和H582A点突变,并且通过DNA测序验证。在大肠杆菌Rosetta2DE3菌株中表达蛋白。使培养物生长到OD600nm为0.5-0.6。通过将IPTG添加至0.5mM的最终浓度诱导表达,并且在16℃继续孵育过夜。通过离心收集细胞,并且将细胞沉淀重悬浮于20mL的裂解缓冲液50mM磷酸钠,pH8,500mMNaCl,1mMDTT,10mM咪唑中,该裂解缓冲液补充有蛋白酶抑制剂RochecOmplete,无EDTA和溶菌酶。一旦均质化,使用超声MS72微尖端探头Bandelin通过超声Sonoplus,Bandelin裂解细胞持续5-8分钟,由2s脉冲和在30%振幅的2.5s暂停组成,并且然后在4℃以16000×g离心持续1小时以去除不溶性物质。过滤澄清的裂解物通过0.22微米过滤器Mdimembranetechnologies,并且施加于镍柱HistrapHP,GELifesciences,洗涤,并且然后用250mM咪唑洗脱。汇集包含ThermoCas9的级分,并且过夜透析到透析缓冲液250mMKCl,20mMHEPESKOH,和1mMDTT,pH7.5中。在透析后,在10mMHEPESKOHpH8中1:1稀释样品,并且装载到IEX-A缓冲液150mMKCl,20mMHEPESKOHpH8中预平衡的肝素FF柱上。用IEX-A洗涤柱,并且然后用IEX-C的梯度2MKCl,20mMHEPESKOHpH8洗脱。将样品浓缩至700μL,然后通过FPLCAKTAPure装载到凝胶过滤柱HiLoad16600Superdex200上。通过SDS-PAGE分析来自凝胶过滤的级分;汇集包含ThermoCas9的级分并且浓缩至200μL50mM磷酸钠pH8,2mMDTT,5%甘油,500mMNaCl,并且直接地用于生物化学测定或在-80℃冷冻用于保存。c.sgRNA的体外合成通过将预测的crRNA和tracrRNA序列与5’-GAAA-3’接头融合,设计sgRNA模块。将表达sgRNA的DNA序列放置在T7启动子的转录控制下。它是合成的Baseclear,Leiden,TheNetherlands,并且提供于pUC57骨架中。使用HiScribeTMT7高产率RNA合成试剂盒NEB合成在生物化学反应中使用的所有sgRNA。使用编码sgRNA的PCR片段,其中T7序列在5’末端上,作为用于体外转录反应的模板。进行T7转录持续4小时。运行sgRNA并且从尿素-PAM凝胶切下,并且使用乙醇沉淀纯化。d.体外裂解测定用纯化的重组ThermoCas9进行体外裂解测定。将ThermoCas9蛋白、体外转录的sgRNA和DNA底物使用表2中描述的引物,使用PCR扩增生成单独地除非另有指示在所表明的温度孵育持续10min,随后将组分组合在一起,并且在裂解缓冲液100mM磷酸钠缓冲液pH=7、500mMNaCl、25mMMgCl2、25VV%甘油、5mM二硫苏糖醇DTT中在多种测定温度孵育持续1小时。每次裂解反应包含160nM的ThermoCas9蛋白、4nM的底物DNA和150nM的合成的sgRNA。通过添加6×加样染料NEB终止反应,并且在1.5%琼脂糖凝胶上运行。用SYBRsafeDNA染色剂LifeTechnologies染色凝胶,并且用GelDocTMEZ凝胶成像系统Bio-rad成像。e.用于体外PAM筛选的文库构建为了构建PAM文库,通过引物退火和基于Klenow片段外切NEB的延伸构建了122-bp长的DNA片段,该DNA片段包含在其3’末端处的前间区和7-bp长的简并序列。用BspHI和BamHINEB消化PAM文库片段和pNW33n载体,并且然后连接T4连接酶,NEB。将连接混合物转化到电感受态大肠杆菌DH10B细胞中,并且从液体培养物分离质粒。对于7nt长的PAM确定过程,质粒文库通过SapINEB线性化并且用作靶。对于其余的测定,通过PCR扩增将DNA底物线性化。f.PAM筛选测定使用体外裂解测定进行thermoCas9的PAM筛选,体外裂解测定由以下组成每次反应:160nM的ThermoCas9、150nM的体外转录的sgRNA、4nM的DNA靶、4μl的裂解缓冲液100mM磷酸钠缓冲液pH7.5、500mMNaCl、5mMDTT、25%甘油和MQ水直至20μl最终反应体积。凝胶纯化包含来自55℃反应的裂解片段的PAM,将其与Illumina测序衔接子连接,并且送出用于IlluminaHiSeq2500测序Baseclear。对等摩尔量的非thermoCas9处理的PAM文库进行相同的过程,并且送出用于IlluminaHiSeq2500测序作为参考。选择与参考序列完全序列匹配的HiSeq读段用于进一步分析。从所选择的读段来看,在ThermoCas9处理的文库中存在多于1000次并且与对照文库相比,在ThermoCas9处理的文库中至少10倍更多的那些读段被用于WebLogo分析Crooks等人,GenomeRes.14,1188-11902004。g.用于史氏芽孢杆菌和恶臭假单胞菌的编辑和沉默构建体用于质粒构建的所有引物和质粒都设计具有适当的突出端,用于进行NEBuilderHiFiDNA组装NEB,并且它们分别地列于表2和表3中。通过用Q5聚合酶NEB或PhusionFlashHigh-FidelityPCRMasterMixThermoFisherScientific进行PCR获得用于组装质粒的片段,PCR产物经历1%琼脂糖凝胶电泳,并且使用Zymogen凝胶DNA回收试剂盒ZymoResearch纯化PCR产物。将组装的质粒转化至化学感受态大肠杆菌DH5α细胞NEB,或在恶臭假单胞菌构建体的情况中转化至大肠杆菌DH5αλpirInvitrogen,后者促进直接载体整合。将单菌落接种在LB培养基中,使用GeneJetplasmidminiprep试剂盒ThermoFisherScientific分离质粒物质,并且验证序列GATC-biotech,并且1μg的每种构建体转化史氏芽孢杆菌ET138电感受态细胞,史氏芽孢杆菌ET138电感受态细胞是根据先前描述的方案Bosma,等人Microb.CellFact.14,992015制备的。使用MasterPureTM革兰氏阳性DNA纯化试剂盒Epicentre用于从史氏芽孢杆菌和恶臭假单胞菌液体培养物分离基因组DNA。为了构建pThermoCas9_ctrl、pThermoCas9_bsΔpyrF1和pThermoCas9_bsΔpyrF2载体,将pNW33n骨架与ΔpyrF同源重组侧翼区一起从pWUR_Cas9sp1_hr载体Mougiakos,等人ACSSynth.Biol.6,849-8612017PCR扩增BG8191和BG8192。天然PxylA启动子从史氏芽孢杆菌ET138的基因组PCR扩增BG8194和BG8195。thermocas9基因从热脱氮地芽孢杆菌T12的基因组PCR扩增BG8196和BG8197。Ppta启动子从pWUR_Cas9sp1_hr载体Mougiakos,等人ACSSynth.Biol.6,849-8612017PCR扩增BG8198和BG8261_2BG8263_nc2BG8317_3。间隔区随后是sgRNA支架从pUC57_T7t12sgRNA载体PCR扩增BG8266_2BG8268_nc28320_3和BG8210。设计并且执行了四片段组装用于构建pThermoCas9i_ldhL载体。最初,通过两步PCR方法,使用pThermoCas9_ctrl作为模板,将靶向的点突变引入thermocas9催化残基的密码子D8A和H582A突变。在第一个PCR步骤BG9075、BG9076期间,将期望的突变引入到产生的PCR片段的末端处,并且在第二个步骤BG9091、BG9092期间,使用产生的片段作为PCR模板用于引入适当的组装-突出端。第二个突变下游的thermocas9的一部分随ldhL沉默间隔区一起,使用pThermoCas9_ctrl作为模板PCR扩增BG9077和BG9267。sgRNA支架与pNW33n骨架一起,使用pThermoCas9_ctrl作为模板PCR扩增BG9263和BG9088。启动子与第一个突变上游的thermocas9的一部分一起,使用pThermoCas9_ctrl作为模板PCR扩增BG9089、BG9090。设计并且执行了两片段组装用于构建pThermoCas9i_ctrl载体。用在两个末端处包含BaeI限制位点的随机序列代替pThermoCas9i_ldhL载体中的间隔区序列。sgRNA支架与pNW33n骨架一起,使用pThermoCas9_ctrl作为模板PCR扩增BG9548、BG9601。由Thermo-dCas9和启动子组成的构建体的另一半,使用pThermoCas9i_ldhL作为模板扩增BG9600、BG9549。设计并且执行了五片段组装用于构建恶臭假单胞菌KT2440载体pThermoCas9_ppΔpyrF。PCR扩增来自自杀载体pEMG的复制子BG2365、BG2366。pyrF的侧翼区域从KT2440基因组DNA扩增BG2367、BG2368用于576-bp上游侧翼区,并且BG2369、BG2370用于540-bp下游侧翼区。使用引物BG2368和BG2369的重叠,使用引物BG2367和BG2370,以重叠延伸PCR融合侧翼区。sgRNA从pThermoCas9_ctrl质粒扩增BG2371、BG2372。组成型P3启动子从pSW_I-SceI扩增BG2373、BG2374。使用引物BG2371和BG2374的重叠,使用引物BG2372和BG2373,以重叠延伸PCR将该启动子片段与sgRNA片段融合。ThermoCas9从pThermoCas9_ctrl质粒扩增BG2375、BG2376。将用于3-苯甲酸甲酯诱导ThermoCas9的诱导型Pm-XylS系统,从pSW_I-SceI扩增BG2377、BG2378。h.用于恶臭假单胞菌的编辑方案根据Choi等人Choi等人,J.Microbiol.Methods64,391-3972006进行了将质粒转化至恶臭假单胞菌。在转化和选择整合体后,接种过夜培养物。使用10μl的过夜培养物用于接种3ml新鲜选择性培养基,并且在37℃生长2小时后,用3-苯甲酸甲酯诱导ThermoCas9。在另外的6h后,将培养物的稀释物铺板在补充有3-苯甲酸甲酯的非选择性培养基上。对于对照培养物,所有步骤中省略了3-苯甲酸甲酯的添加。用引物BG2381和BG2135通过菌落PCR进行恶臭假单胞菌染色体中质粒整合的证实。用引物BG2381和BG2382通过菌落PCR进行pyrF缺失的证实。i.RNA分离基于先前描述的方案vanHijum等人BMCGenomics6,772005,通过苯酚提取进行RNA分离。将10mL过夜培养物在4℃和4816×g离心持续15min,并且立即地用于RNA分离。在去除培养基后,将细胞悬浮在0.5mL的冰冷的TE缓冲液pH8.0中,并且保持在冰上。将所有样品分到两支2mL的带螺旋盖的管中,所述带螺旋盖的管包含0.5g的锆珠、30μL的10%SDS、30μL的3M乙酸钠pH5.2和500μL的Roti-苯酚pH4.5-5.0,CarlRothGmbH。使用FastPrep-24仪器MPBiomedicals以5500rpm破碎细胞持续45s,并且在4℃和10000rpm离心持续5min。将来自每支管的400μL的水相转移至新的管,向新的管加入400μL的氯仿-异戊醇CarlRothGmbH,之后在4℃和18400×g离心样品持续3min。将300μL的水相转移至新的管,并且与来自高纯度RNA分离试剂盒Roche的300μL的裂解缓冲液混合。随后,除了DNA酶孵育步骤进行持续45min之外,根据制造商的方案进行来自该试剂盒的其余的程序。使用Nanodrop-1000确定cDNA的浓度和完整性。在NanoDrop-1000上检查分离的RNA的完整性和浓度。j.通过RT-qPCR定量mRNA根据制造商的方案,使用SuperScriptTMIII逆转录酶Invitrogen对分离的RNA进行第一链cDNA合成。使用来自QuantaBiosciences的PerfeCTaSYBRGreenSupermixforiQ进行qPCR。使用40ng的每种cDNA文库作为用于qPCR的模板。使用两组引物:BG9665:BG9666扩增ldhL基因的150nt长的区域,并且BG9889:BG9890扩增用作用于qPCR的对照的rpoDRNA聚合酶sigma因子基因的150nt长的序列。在Bio-RadC1000热循环仪上运行qPCR。k.HPLC使用高压液相色谱HPLC系统ICS-5000用于乳酸盐定量。用来自Bio-RadLaboratories的AminexHPX87H柱操作该系统,并且配备在210nm上操作的UV1000检测器和RI-15040℃折射率检测器。流动相由0.16NH2SO4组成,并且以0.8mLmin操作柱。用0.01NH2SO4中的10mMDMSO4:1稀释所有样品。说明书的以下部分由编号的段落组成,这些段落仅仅提供了本文已经描述的本发明的陈述。在本部分中的编号的段落不是权利要求。权利要求在所附的题为“权利要求书”的部分阐述。1.一种分离的成簇的规律地间隔的短回文重复CRISPR相关Cas蛋白或多肽,包含:a.氨基酸基序EKDGKYYC[SEQIDNO:2];和或b.氨基酸基序X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和或c.氨基酸基序X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和或d.氨基酸基序X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和或e.氨基酸基序X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸;其中,当与至少一种靶向RNA分子和包含被靶向RNA分子识别的靶核酸序列的多核苷酸缔合时,Cas蛋白能够在50℃与100℃之间进行核酸裂解。2.一种分离的Cas蛋白或多肽片段,该分离的Cas蛋白或多肽片段具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列,其中当与至少一种识别靶序列的RNA分子缔合时,Cas蛋白能够在50℃和100℃之间的温度结合、裂解、修饰或标记包含靶核酸序列的多核苷酸。3.如在编号的段落1或2中所述的Cas蛋白或多肽片段,其中Cas蛋白或片段能够在50℃和75℃之间的温度,优选地60℃以上的温度;更优选地在60℃和80℃之间的温度;甚至更优选地在60℃和65℃之间的温度进行核酸结合、裂解、标记或修饰。4.如在编号的段落1至3的任一项中所述的Cas蛋白或多肽片段,其中核酸结合、裂解、标记或修饰是DNA裂解。5.如在前述编号的段落的任一项中所述的Cas蛋白或多肽片段,其中氨基酸序列包含SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列。6.如在任一项前述编号的段落中所述的Cas蛋白或多肽片段,其中Cas蛋白从细菌、古核生物或病毒可获得。7.如在任一项前述编号的段落中所述的Cas蛋白或多肽片段,其中Cas蛋白从地芽孢杆菌属的种,优选地从热脱氮地芽孢杆菌可获得。8.一种核糖核蛋白复合体,所述核糖核蛋白复合体包含如在前述编号的段落的任一项中所述的Cas蛋白,并且包含识别靶多核苷酸中的序列的至少一种靶向RNA分子。9.如在编号的段落8中所述的核糖核蛋白复合体,其中靶向RNA分子包含crRNA和任选地tracrRNA。10.如在编号的段落7至9的任一项中所述的核糖核蛋白复合体,其中至少一种RNA分子的长度是在35-135个核苷酸残基的范围中。11.如在编号的段落8或9中所述的核糖核蛋白复合体,其中靶序列的长度是31个或32个核苷酸残基。12.如在编号的段落1至7的任一项中所述的Cas蛋白或多肽、或如在编号的段落8至11的任一项中所述的核糖核蛋白复合体,其中蛋白或多肽作为蛋白复合体的一部分被提供,所述蛋白复合体包含至少一种另外的功能蛋白或非功能蛋白。13.如在编号的段落12中所述的Cas蛋白、多肽或核糖核蛋白复合体,其中Cas蛋白或多肽和或至少一种另外的蛋白还包含至少一个功能部分。14.如在编号的段落13中所述的Cas蛋白或多肽、或核糖核蛋白复合体,其中至少一个功能部分与Cas蛋白、多肽或核糖核蛋白复合体的N-末端和或C-末端、优选地N-末端融合或连接。15.如在编号的段落13或14中所述的Cas蛋白或多肽、或核糖核蛋白复合体,其中至少一个功能部分是蛋白;任选地选自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签。16.如在编号的段落15中所述的Cas蛋白或多肽、或核糖核蛋白复合体,其中Cas9核酸酶活性的天然活性被失活并且Cas蛋白与至少一个功能部分连接。17.如在编号的段落15或16中所述的Cas蛋白或多肽、或核糖核蛋白复合体,其中至少一个功能部分是核酸酶结构域;优选地为FokI核酸酶结构域。18.如在编号的段落15至17的任一项中所述的Cas蛋白或多肽、或核糖核蛋白复合体,其中至少一个功能部分是标志物蛋白,例如GFP。19.一种编码Cas蛋白或多肽的分离的核酸分子,该Cas蛋白或多肽包含:a.氨基酸基序EKDGKYYC[SEQIDNO:2];和或b.氨基酸基序X1X2CTX3X4[SEQIDNO:3],其中X1独立地选自异亮氨酸、甲硫氨酸或脯氨酸,X2独立地选自缬氨酸、丝氨酸、天冬酰胺或异亮氨酸,X3独立地选自谷氨酸或赖氨酸,并且X4是丙氨酸、谷氨酸或精氨酸之一;和或c.氨基酸基序X5LKX6IE[SEQIDNO:4],其中X5独立地选自甲硫氨酸或苯丙氨酸,并且X6独立地选自组氨酸或天冬酰胺;和或d.氨基酸基序X7VYSX8K[SEQIDNO:5],其中X7是谷氨酸或异亮氨酸,并且X8是色氨酸、丝氨酸或赖氨酸之一;和或e.氨基酸基序X9FYX10X11REQX12KEX13[SEQIDNO:6],其中X9是丙氨酸或谷氨酸,X10是谷氨酰胺或赖氨酸,X11是精氨酸或丙氨酸,X12是天冬酰胺或丙氨酸,并且X13是赖氨酸或丝氨酸;其中,当与至少一种靶向RNA分子和包含被该靶向RNA分子识别的靶核酸序列的多核苷酸缔合时,Cas蛋白或多肽能够在50℃与100℃之间进行DNA结合、裂解、标记或修饰。20.一种分离的核酸分子,所述分离的核酸分子编码成簇的规律地间隔的短回文重复CRISPR相关的Cas蛋白或其多肽片段,所述成簇的规律地间隔的短回文重复CRISPR相关的Cas蛋白或其多肽片段具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列。21.如在编号的段落19或20中所述的分离的核酸分子,所述分离的核酸分子还包含编码在翻译后与Cas蛋白或多肽融合的氨基酸序列的至少一种核酸序列。22.如在编号的段落21中所述的分离的核酸分子,其中与编码Cas蛋白或多肽的核酸分子融合的至少一种核酸序列编码选自以下的蛋白:解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签。23.一种表达载体,所述表达载体包含如在编号的段落19至22的任一项中所述的核酸分子。24.如在编号的段落23中所述的表达载体,所述表达载体还包含编码至少一种靶向RNA分子的核苷酸序列。25.一种修饰人类细胞中的靶核酸的方法,所述方法包括使所述核酸与以下接触:a.如在编号的段落6至11的任一项中所述的核糖核蛋白复合体;或b.如在编号的段落12至18的任一项中所述的蛋白或蛋白复合体和至少一种如在编号的段落6至11的任一项中定义的靶向RNA分子;任选地其中所述人类细胞不是胚胎干细胞;并且任选地其中所述方法不改变人类的生殖系遗传同一性。26.一种修饰人类细胞中的靶核酸的方法,所述方法包括用编号的段落24的表达载体转化、转染或转导细胞;或可选地用编号的段落23的表达载体和包含编码如在编号的段落6至11的任一项中定义的靶向RNA分子的核苷酸序列的另外的表达载体转化、转染或转导细胞;任选地其中所述人类细胞不是胚胎干细胞;并且任选地其中所述方法不改变人类的生殖系遗传同一性。27.一种修饰人类细胞中的靶核酸的方法,所述方法包括用编号的段落23的表达载体转化、转染或转导细胞,并且然后将如在编号的段落6至11的任一项中定义的靶向RNA分子递送至细胞或递送到细胞中;任选地其中所述人类细胞不是胚胎干细胞;并且任选地其中所述方法不改变人类的生殖系遗传同一性。28.如在编号的段落25至28的任一项中所述的修饰靶核酸的方法,其中至少一个功能部分是标志物蛋白或报告物蛋白,并且该标志物蛋白或报告物蛋白与靶核酸缔合;优选地其中标志物是荧光蛋白,例如绿色荧光蛋白GFP。29.如在编号的段落25至28的任一项中所述的方法,其中靶核酸是DNA;优选地是dsDNA。30.如在编号的段落25至28的任一项中所述的方法,其中靶核酸是RNA。31.如在编号的段落29中所述的修饰靶核酸的方法,其中核酸是dsDNA,至少一个功能部分是核酸酶或解旋酶-核酸酶,并且修饰是在期望的基因座处的单链断裂或双链断裂。32.一种在期望的基因座处使基因表达沉默的方法,所述方法根据在编号的段落26、27、29或31的任一项中所述的方法中的任一种方法进行。33.一种在期望的位置处修饰或缺失和或插入期望的核苷酸序列的方法,所述方法根据如在编号的段落26、27、29或31的任一项中所述的方法中的任一种方法进行。34.一种修饰细胞中的基因表达的方法,所述方法包括以如在编号的段落25至29的任一项中所述的方法修饰靶核酸序列;其中核酸是dsDNA,并且功能部分选自DNA修饰酶例如甲基化酶或乙酰基转移酶、转录活化物或转录阻遏物。35.一种修饰细胞中的基因表达的方法,所述方法包括以如在编号的段落30中所述的方法修饰靶核酸序列,其中核酸是mRNA并且功能部分是核糖核酸酶;任选地选自核酸内切酶、3’核酸外切酶或5’核酸外切酶。36.如在编号的段落25至35的任一项中所述的修饰靶核酸的方法,其中所述方法在50℃和100℃之间的温度进行。37.如在编号的段落36中所述的修饰靶核酸的方法,其中所述方法在60℃或60℃以上的温度,优选地在60℃和80℃之间的温度,更优选地在60℃和65℃之间的温度进行。38.一种宿主细胞,所述宿主细胞通过如在编号的段落22至36的任一项中所述的方法转化,其中该细胞是人类细胞;并且任选地其中所述人类细胞不是胚胎干细胞;并且任选地其中所述方法不改变人类的生殖系遗传同一性。序列表瓦赫宁根大学;科学技术基金会热稳定的Cas9核酸酶P220294WO3PCTEP20160810772016-12-14170PatentIn3.5版11082PRT热脱氮地芽孢杆菌GeobacillusthermodenitrificansT121MetLysTyrLysIleGlyLeuAspIleGlyIleThrSerIleGlyTrp151015AlaValIleAsnLeuAspIleProArgIleGluAspLeuGlyValArg202530IlePheAspArgAlaGluAsnProLysThrGlyGluSerLeuAlaLeu354045ProArgArgLeuAlaArgSerAlaArgArgArgLeuArgArgArgLys505560HisArgLeuGluArgIleArgArgLeuPheValArgGluGlyIleLeu65707580ThrLysGluGluLeuAsnLysLeuPheGluLysLysHisGluIleAsp859095ValTrpGlnLeuArgValGluAlaLeuAspArgLysLeuAsnAsnAsp100105110GluLeuAlaArgIleLeuLeuHisLeuAlaLysArgArgGlyPheArg115120125SerAsnArgLysSerGluArgThrAsnLysGluAsnSerThrMetLeu130135140LysHisIleGluGluAsnGlnSerIleLeuSerSerTyrArgThrVal145150155160AlaGluMetValValLysAspProLysPheSerLeuHisLysArgAsn165170175LysGluAspAsnTyrThrAsnThrValAlaArgAspAspLeuGluArg180185190GluIleLysLeuIlePheAlaLysGlnArgGluTyrGlyAsnIleVal195200205CysThrGluAlaPheGluHisGluTyrIleSerIleTrpAlaSerGln210215220ArgProPheAlaSerLysAspAspIleGluLysLysValGlyPheCys225230235240ThrPheGluProLysGluLysArgAlaProLysAlaThrTyrThrPhe245250255GlnSerPheThrValTrpGluHisIleAsnLysLeuArgLeuValSer260265270ProGlyGlyIleArgAlaLeuThrAspAspGluArgArgLeuIleTyr275280285LysGlnAlaPheHisLysAsnLysIleThrPheHisAspValArgThr290295300LeuLeuAsnLeuProAspAspThrArgPheLysGlyLeuLeuTyrAsp305310315320ArgAsnThrThrLeuLysGluAsnGluLysValArgPheLeuGluLeu325330335GlyAlaTyrHisLysIleArgLysAlaIleAspSerValTyrGlyLys340345350GlyAlaAlaLysSerPheArgProIleAspPheAspThrPheGlyTyr355360365AlaLeuThrMetPheLysAspAspThrAspIleArgSerTyrLeuArg370375380AsnGluTyrGluGlnAsnGlyLysArgMetGluAsnLeuAlaAspLys385390395400ValTyrAspGluGluLeuIleGluGluLeuLeuAsnLeuSerPheSer405410415LysPheGlyHisLeuSerLeuLysAlaLeuArgAsnIleLeuProTyr420425430MetGluGlnGlyGluValTyrSerThrAlaCysGluArgAlaGlyTyr435440445ThrPheThrGlyProLysLysLysGlnLysThrValLeuLeuProAsn450455460IleProProIleAlaAsnProValValMetArgAlaLeuThrGlnAla465470475480ArgLysValValAsnAlaIleIleLysLysTyrGlySerProValSer485490495IleHisIleGluLeuAlaArgGluLeuSerGlnSerPheAspGluArg500505510ArgLysMetGlnLysGluGlnGluGlyAsnArgLysLysAsnGluThr515520525AlaIleArgGlnLeuValGluTyrGlyLeuThrLeuAsnProThrGly530535540LeuAspIleValLysPheLysLeuTrpSerGluGlnAsnGlyLysCys545550555560AlaTyrSerLeuGlnProIleGluIleGluArgLeuLeuGluProGly565570575TyrThrGluValAspHisValIleProTyrSerArgSerLeuAspAsp580585590SerTyrThrAsnLysValLeuValLeuThrLysGluAsnArgGluLys595600605GlyAsnArgThrProAlaGluTyrLeuGlyLeuGlySerGluArgTrp610615620GlnGlnPheGluThrPheValLeuThrAsnLysGlnPheSerLysLys625630635640LysArgAspArgLeuLeuArgLeuHisTyrAspGluAsnGluGluAsn645650655GluPheLysAsnArgAsnLeuAsnAspThrArgTyrIleSerArgPhe660665670LeuAlaAsnPheIleArgGluHisLeuLysPheAlaAspSerAspAsp675680685LysGlnLysValTyrThrValAsnGlyArgIleThrAlaHisLeuArg690695700SerArgTrpAsnPheAsnLysAsnArgGluGluSerAsnLeuHisHis705710715720AlaValAspAlaAlaIleValAlaCysThrThrProSerAspIleAla725730735ArgValThrAlaPheTyrGlnArgArgGluGlnAsnLysGluLeuSer740745750LysLysThrAspProGlnPheProGlnProTrpProHisPheAlaAsp755760765GluLeuGlnAlaArgLeuSerLysAsnProLysGluSerIleLysAla770775780LeuAsnLeuGlyAsnTyrAspAsnGluLysLeuGluSerLeuGlnPro785790795800ValPheValSerArgMetProLysArgSerIleThrGlyAlaAlaHis805810815GlnGluThrLeuArgArgTyrIleGlyIleAspGluArgSerGlyLys820825830IleGlnThrValValLysLysLysLeuSerGluIleGlnLeuAspLys835840845ThrGlyHisPheProMetTyrGlyLysGluSerAspProArgThrTyr850855860GluAlaIleArgGlnArgLeuLeuGluHisAsnAsnAspProLysLys865870875880AlaPheGlnGluProLeuTyrLysProLysLysAsnGlyGluLeuGly885890895ProIleIleArgThrIleLysIleIleAspThrThrAsnGlnValIle900905910ProLeuAsnAspGlyLysThrValAlaTyrAsnSerAsnIleValArg915920925ValAspValPheGluLysAspGlyLysTyrTyrCysValProIleTyr930935940ThrIleAspMetMetLysGlyIleLeuProAsnLysAlaIleGluPro945950955960AsnLysProTyrSerGluTrpLysGluMetThrGluAspTyrThrPhe965970975ArgPheSerLeuTyrProAsnAspLeuIleArgIleGluPheProArg980985990GluLysThrIleLysThrAlaValGlyGluGluIleLysIleLysAsp99510001005LeuPheAlaTyrTyrGlnThrIleAspSerSerAsnGlyGlyLeu101010151020SerLeuValSerHisAspAsnAsnPheSerLeuArgSerIleGly102510301035SerArgThrLeuLysArgPheGluLysTyrGlnValAspValLeu104010451050GlyAsnIleTyrLysValArgGlyGluLysArgValGlyValAla105510601065SerSerSerHisSerLysAlaGlyGluThrIleArgProLeu10701075108028PRT热脱氮地芽孢杆菌T122GluLysAspGlyLysTyrTyrCys1536PRT人工序列来自Cas9的氨基酸基序X1..1异亮氨酸、甲硫氨酸或脯氨酸X2..2缬氨酸、丝氨酸、天冬酰胺或异亮氨酸X5..5谷氨酸或赖氨酸X6..6丙氨酸、谷氨酸或精氨酸3XaaXaaCysThrXaaXaa1546PRT人工序列来自热脱氮地芽孢杆菌T12Cas9的氨基酸基序X1..1甲硫氨酸或苯丙氨酸X4..4组氨酸或天冬酰胺4XaaLeuLysXaaIleGlu1556PRT人工序列来自热脱氮地芽孢杆菌T12的氨基酸基序X1..1谷氨酸或异亮氨酸X5..5色氨酸、丝氨酸或赖氨酸5XaaValTyrSerXaaLys15612PRT人工序列来自嗜热Cas9的氨基酸基序X1..1丙氨酸或谷氨酸X4..4谷氨酰胺或赖氨酸X5..5精氨酸或丙氨酸X9..9天冬酰胺或丙氨酸X12..12赖氨酸或丝氨酸6XaaPheTyrXaaXaaArgGluGlnXaaLysGluXaa151073249DNA热脱氮地芽孢杆菌T127atgaagtataaaatcggtcttgatatcggcattacgtctatcggttgggctgtcattaat60ttggacattcctcgcatcgaagatttaggtgtccgcatttttgacagagcggaaaacccg120aaaaccggggagtcactagctcttccacgtcgcctcgcccgctccgcccgacgtcgtctg180cggcgtcgcaaacatcgactggagcgcattcgccgcctgttcgtccgcgaaggaatttta240acgaaggaagagctgaacaagctgtttgaaaaaaagcacgaaatcgacgtctggcagctt300cgtgttgaagcactggatcgaaaactaaataacgatgaattagcccgcatccttcttcat360ctggctaaacggcgtggatttagatccaaccgcaagagtgagcgcaccaacaaagaaaac420agtacgatgctcaaacatattgaagaaaaccaatccattctttcaagttaccgaacggtt480gcagaaatggttgtcaaggatccgaaattttccctgcacaagcgtaataaagaggataat540tacaccaacactgttgcccgcgacgatcttgaacgggaaatcaaactgattttcgccaaa600cagcgcgaatatgggaacatcgtttgcacagaagcatttgaacacgagtatatttccatt660tgggcatcgcaacgcccttttgcttctaaggatgatatcgagaaaaaagtcggtttctgt720acgtttgagcctaaagaaaaacgcgcgccaaaagcaacatacacattccagtccttcacc780gtctgggaacatattaacaaacttcgtcttgtctccccgggaggcatccgggcactaacc840gatgatgaacgtcgtcttatatacaagcaagcatttcataaaaataaaatcaccttccat900gatgttcgaacattgcttaacttgcctgacgacacccgttttaaaggtcttttatatgac960cgaaacaccacgctgaaggaaaatgagaaagttcgcttccttgaactcggcgcctatcat1020aaaatacggaaagcgatcgacagcgtctatggcaaaggagcagcaaaatcatttcgtccg1080attgattttgatacatttggctacgcattaacgatgtttaaagacgacaccgacattcgc1140agttacttgcgaaacgaatacgaacaaaatggaaaacgaatggaaaatctagcggataaa1200gtctatgatgaagaattgattgaagaacttttaaacttatcgttttctaagtttggtcat1260ctatcccttaaagcgcttcgcaacatccttccatatatggaacaaggcgaagtctactca1320accgcttgtgaacgagcaggatatacatttacagggccaaagaaaaaacagaaaacggta1380ttgctgccgaacattccgccgatcgccaatccggtcgtcatgcgcgcactgacacaggca1440cgcaaagtggtcaatgccattatcaaaaagtacggctcaccggtctccatccatatcgaa1500ctggcccgggaactatcacaatcctttgatgaacgacgtaaaatgcagaaagaacaggaa1560ggaaaccgaaagaaaaacgaaactgccattcgccaacttgttgaatatgggctgacgctc1620aatccaactgggcttgacattgtgaaattcaaactatggagcgaacaaaacggaaaatgt1680gcctattcactccaaccgatcgaaatcgagcggttgctcgaaccaggctatacagaagtc1740gaccatgtgattccatacagccgaagcttggacgatagctataccaataaagttcttgtg1800ttgacaaaggagaaccgtgaaaaaggaaaccgcaccccagctgaatatttaggattaggc1860tcagaacgttggcaacagttcgagacgtttgtcttgacaaataagcagttttcgaaaaag1920aagcgggatcgactccttcggcttcattacgatgaaaacgaagaaaatgagtttaaaaat1980cgtaatctaaatgatacccgttatatctcacgcttcttggctaactttattcgcgaacat2040ctcaaattcgccgacagcgatgacaaacaaaaagtatacacggtcaacggccgtattacc2100gcccatttacgcagccgttggaattttaacaaaaaccgggaagaatcgaatttgcatcat2160gccgtcgatgctgccatcgtcgcctgcacaacgccgagcgatatcgcccgagtcaccgcc2220ttctatcaacggcgcgaacaaaacaaagaactgtccaaaaagacggatccgcagtttccg2280cagccttggccgcactttgctgatgaactgcaggcgcgtttatcaaaaaatccaaaggag2340agtataaaagctctcaatcttggaaattatgataacgagaaactcgaatcgttgcagccg2400gtttttgtctcccgaatgccgaagcggagcataacaggagcggctcatcaagaaacattg2460cggcgttatatcggcatcgacgaacggagcggaaaaatacagacggtcgtcaaaaagaaa2520ctatccgagatccaactggataaaacaggtcatttcccaatgtacgggaaagaaagcgat2580ccaaggacatatgaagccattcgccaacggttgcttgaacataacaatgacccaaaaaag2640gcgtttcaagagcctctgtataaaccgaagaagaacggagaactaggtcctatcatccga2700acaatcaaaatcatcgatacgacaaatcaagttattccgctcaacgatggcaaaacagtc2760gcctacaacagcaacatcgtgcgggtcgacgtctttgagaaagatggcaaatattattgt2820gtccctatctatacaatagatatgatgaaagggatcttgccaaacaaggcgatcgagccg2880aacaaaccgtactctgagtggaaggaaatgacggaggactatacattccgattcagtcta2940tacccaaatgatcttatccgtatcgaatttccccgagaaaaaacaataaagactgctgtg3000ggggaagaaatcaaaattaaggatctgttcgcctattatcaaaccatcgactcctccaat3060ggagggttaagtttggttagccatgataacaacttttcgctccgcagcatcggttcaaga3120accctcaaacgattcgagaaataccaagtagatgtgctaggcaacatctacaaagtgaga3180ggggaaaagagagttggggtggcgtcatcttctcattcgaaagccggggaaactatccgt3240ccgttataa324981045PRT内氏放线菌Actinomycesnaeslundii8MetTrpTyrAlaSerLeuMetSerAlaHisHisLeuArgValGlyIle151015AspValGlyThrHisSerValGlyLeuAlaThrLeuArgValAspAsp202530HisGlyThrProIleGluLeuLeuSerAlaLeuSerHisIleHisAsp354045SerGlyValGlyLysGluGlyLysLysAspHisAspThrArgLysLys505560LeuSerGlyIleAlaArgArgAlaArgArgLeuLeuHisHisArgArg65707580ThrGlnLeuGlnGlnLeuAspGluValLeuArgAspLeuGlyPhePro859095IleProThrProGlyGluPheLeuAspLeuAsnGluGlnThrAspPro100105110TyrArgValTrpArgValArgAlaArgLeuValGluGluLysLeuPro115120125GluGluLeuArgGlyProAlaIleSerMetAlaValArgHisIleAla130135140ArgHisArgGlyTrpArgAsnProTyrSerLysValGluSerLeuLeu145150155160SerProAlaAsnAlaAsnGluIleArgLysIleCysAlaArgGlnGly165170175ValSerProAspValCysLysGlnLeuLeuArgAlaValPheLysAla180185190AspSerProArgGlySerAlaValSerArgValAlaProAspProLeu195200205ProGlyGlnGlySerPheArgArgAlaProLysCysAspProGluPhe210215220GlnArgPheArgIleIleSerIleValAlaAsnLeuArgIleSerGlu225230235240ThrLysGlyGluAsnArgProLeuThrAlaAspGluArgArgHisVal245250255ValThrPheLeuThrGluAspSerGlnAlaAspLeuThrTrpValAsp260265270ValAlaGluLysLeuGlyValHisArgArgAspLeuArgGlyThrAla275280285ValHisThrAspAspGlyGluArgSerAlaAlaArgProProIleAsp290295300AlaThrAspArgIleMetArgGlnThrLysIleSerSerLeuLysThr305310315320TrpTrpGluGluAlaAspSerGluGlnArgGlyAlaMetIleArgTyr325330335LeuTyrGluAspProThrAspSerGluCysAlaGluIleIleAlaGlu340345350LeuProGluGluAspGlnAlaLysLeuAspSerLeuHisLeuProAla355360365GlyArgAlaAlaTyrSerArgGluSerLeuThrAlaLeuSerAspHis370375380MetLeuAlaThrThrAspAspLeuHisGluAlaArgLysArgLeuPhe385390395400GlyValAspAspSerTrpAlaProProAlaGluAlaIleAsnAlaPro405410415ValGlyAsnProSerValAspArgThrLeuLysIleValGlyArgTyr420425430LeuSerAlaValGluSerMetTrpGlyThrProGluValIleHisVal435440445GluHisValArgAspGlyPheThrSerGluArgMetAlaAspGluArg450455460AspLysAlaAsnArgArgArgTyrAsnAspAsnGlnGluAlaMetLys465470475480LysIleGlnArgAspTyrGlyLysGluGlyTyrIleSerArgGlyAsp485490495IleValArgLeuAspAlaLeuGluLeuGlnGlyCysAlaCysLeuTyr500505510CysGlyThrThrIleGlyTyrHisThrCysGlnLeuAspHisIleVal515520525ProGlnAlaGlyProGlySerAsnAsnArgArgGlyAsnLeuValAla530535540ValCysGluArgCysAsnArgSerLysSerAsnThrProPheAlaVal545550555560TrpAlaGlnLysCysGlyIleProHisValGlyValLysGluAlaIle565570575GlyArgValArgGlyTrpArgLysGlnThrProAsnThrSerSerGlu580585590AspLeuThrArgLeuLysLysGluValIleAlaArgLeuArgArgThr595600605GlnGluAspProGluIleAspGluArgSerMetGluSerValAlaTrp610615620MetAlaAsnGluLeuHisHisArgIleAlaAlaAlaTyrProGluThr625630635640ThrValMetValTyrArgGlySerIleThrAlaAlaAlaArgLysAla645650655AlaGlyIleAspSerArgIleAsnLeuIleGlyGluLysGlyArgLys660665670AspArgIleAspArgArgHisHisAlaValAspAlaSerValValAla675680685LeuMetGluAlaSerValAlaLysThrLeuAlaGluArgSerSerLeu690695700ArgGlyGluGlnArgLeuThrGlyLysGluGlnThrTrpLysGlnTyr705710715720ThrGlySerThrValGlyAlaArgGluHisPheGluMetTrpArgGly725730735HisMetLeuHisLeuThrGluLeuPheAsnGluArgLeuAlaGluAsp740745750LysValTyrValThrGlnAsnIleArgLeuArgLeuSerAspGlyAsn755760765AlaHisThrValAsnProSerLysLeuValSerHisArgLeuGlyAsp770775780GlyLeuThrValGlnGlnIleAspArgAlaCysThrProAlaLeuTrp785790795800CysAlaLeuThrArgGluLysAspPheAspGluLysAsnGlyLeuPro805810815AlaArgGluAspArgAlaIleArgValHisGlyHisGluIleLysSer820825830SerAspTyrIleGlnValPheSerLysArgLysLysThrAspSerAsp835840845ArgAspGluThrProPheGlyAlaIleAlaValArgGlyGlyPheVal850855860GluIleGlyProSerIleHisHisAlaArgIleTyrArgValGluGly865870875880LysLysProValTyrAlaMetLeuArgValPheThrHisAspLeuLeu885890895SerGlnArgHisGlyAspLeuPheSerAlaValIleProProGlnSer900905910IleSerMetArgCysAlaGluProLysLeuArgLysAlaIleThrThr915920925GlyAsnAlaThrTyrLeuGlyTrpValValValGlyAspGluLeuGlu930935940IleAsnValAspSerPheThrLysTyrAlaIleGlyArgPheLeuGlu945950955960AspPheProAsnThrThrArgTrpArgIleCysGlyTyrAspThrAsn965970975SerLysLeuThrLeuLysProIleValLeuAlaAlaGluGlyLeuGlu980985990AsnProSerSerAlaValAsnGluIleValGluLeuLysGlyTrpArg99510001005ValAlaIleAsnValLeuThrLysValHisProThrValValArg101010151020ArgAspAlaLeuGlyArgProArgTyrSerSerArgSerAsnLeu102510301035ProThrSerTrpThrIleGlu1040104591160PRT酿脓链球菌Streptococcuspyogenes9MetAspLysLysTyrSerIleGlyLeuAspIleGlyThrAsnSerVal151015GlyTrpAlaValIleThrAspGluTyrLysValProSerLysLysPhe202530LysValLeuGlyAsnThrAspArgHisSerIleLysLysAsnLeuIle354045GlyAlaLeuLeuPheAspSerGlyGluThrAlaGluAlaThrArgLeu505560LysArgThrAlaArgArgArgTyrThrArgArgLysAsnArgIleCys65707580TyrLeuGlnGluIlePheSerAsnGluMetAlaLysValAspAspSer859095PhePheHisArgLeuGluGluSerPheLeuValGluGluAspLysLys100105110HisGluArgHisProIlePheGlyAsnIleValAspGluValAlaTyr115120125HisGluLysTyrProThrIleTyrHisLeuArgLysLysLeuValAsp130135140SerThrAspLysAlaAspLeuArgLeuIleTyrLeuAlaLeuAlaHis145150155160MetIleLysPheArgGlyHisPheLeuIleGluGlyAspLeuAsnPro165170175AspAsnSerAspValAspLysLeuPheIleGlnLeuValGlnThrArg180185190LysGlnArgThrPheAspAsnGlySerIleProHisGlnIleHisLeu195200205GlyGluLeuHisAlaIleLeuArgArgGlnGluAspPheTyrProPhe210215220LeuLysAspAsnArgGluLysIleGluLysIleLeuThrPheArgIle225230235240ProTyrTyrValGlyProLeuAlaArgGlyAsnSerArgPheAlaTrp245250255MetThrArgLysSerGluGluThrIleThrProTrpAsnPheGluGlu260265270ValValAspLysGlyAlaSerAlaGlnSerPheIleGluArgMetThr275280285AsnPheAspLysAsnLeuProAsnGluLysValLeuProLysHisSer290295300LeuLeuTyrGluTyrPheThrValTyrAsnGluLeuThrLysValLys305310315320TyrValThrGluGlyMetArgLysProAlaPheLeuSerGlyGluGln325330335LysLysAlaIleValAspLeuLeuPheLysThrAsnArgLysValThr340345350ValLysGlnLeuLysGluAspTyrPheLysLysIleGluCysPheAsp355360365SerValGluIleSerGlyValGluAspArgPheAsnAlaSerLeuGly370375380ThrTyrHisAspLeuLeuLysIleIleLysAspLysAspPheLeuAsp385390395400AsnGluGluAsnGluAspIleLeuGluAspIleValLeuThrLeuThr405410415LeuPheGluAspArgGluMetIleGluGluArgLeuLysThrTyrAla420425430HisLeuPheAspAspLysValMetLysGlnLeuLysArgArgArgTyr435440445ThrGlyTrpGlyArgLeuSerArgLysLeuIleAsnGlyIleArgAsp450455460LysGlnSerGlyLysThrIleLeuAspPheLeuLysSerAspGlyPhe465470475480AlaAsnArgAsnPheMetGlnLeuIleHisAspAspSerLeuThrPhe485490495LysGluAspIleGlnLysAlaGlnValSerGlyGlnGlyAspSerLeu500505510HisGluHisIleAlaAsnLeuAlaGlySerProAlaIleLysLysGly515520525IleLeuGlnThrValLysValValAspGluLeuValLysValMetGly530535540ArgHisLysProGluAsnIleValIleGluMetAlaArgGluAsnGln545550555560ThrThrGlnLysGlyGlnLysAsnSerArgGluArgMetLysArgIle565570575GluGluGlyIleLysGluLeuGlySerGlnIleLeuLysGluHisPro580585590ValGluAsnThrGlnLeuGlnAsnGluLysLeuTyrLeuTyrTyrLeu595600605GlnAsnGlyArgAspMetTyrValAspGlnGluLeuAspIleAsnArg610615620LeuSerAspTyrAspValAspHisIleValProGlnSerPheLeuLys625630635640AspAspSerIleAspAsnLysValLeuThrArgSerAspLysAsnArg645650655GlyLysSerAspAsnValProSerGluGluValValLysLysMetLys660665670AsnTyrTrpArgGlnLeuLeuAsnAlaLysLeuIleThrGlnArgLys675680685PheAspAsnLeuThrLysAlaGluArgGlyGlyLeuSerGluLeuAsp690695700LysAlaGlyPheIleLysArgGlnLeuValGluThrArgGlnIleThr705710715720LysHisValAlaGlnIleLeuAspSerArgMetAsnThrLysTyrAsp725730735GluAsnAspLysLeuIleArgGluValLysValIleThrLeuLysSer740745750LysLeuValSerAspPheArgLysAspPheGlnPheTyrLysValArg755760765GluIleAsnAsnTyrHisHisAlaHisAspAlaTyrLeuAsnAlaVal770775780ValGlyThrAlaLeuIleLysLysTyrProLysLeuGluSerGluPhe785790795800ValTyrGlyAspTyrLysValTyrAspValArgLysMetIleAlaLys805810815SerGluGlnGluIleGlyLysAlaThrAlaLysTyrPhePheTyrSer820825830AsnIleMetAsnPhePheLysThrGluIleThrLeuAlaAsnGlyGlu835840845IleArgLysArgProLeuIleGluThrAsnGlyGluThrGlyGluIle850855860ValTrpAspLysGlyArgAspPheAlaThrValArgLysValLeuSer865870875880MetProGlnValAsnIleValLysLysThrGluValGlnThrGlyGly885890895PheSerLysGluSerIleLeuProLysArgAsnSerAspLysLeuIle900905910AlaArgLysLysAspTrpAspProLysLysTyrGlyGlyPheAspSer915920925ProThrValAlaTyrSerValLeuValValAlaLysValGluLysGly930935940LysSerLysLysLeuLysSerValLysGluLeuLeuGlyIleThrIle945950955960MetGluArgSerSerPheGluLysAsnProIleAspPheLeuGluAla965970975LysGlyTyrLysGluValLysLysAspLeuIleIleLysLeuProLys980985990TyrSerLeuPheGluLeuGluAsnGlyArgLysArgMetLeuAlaSer99510001005AlaGlyGluLeuGlnLysGlyAsnGluLeuAlaLeuProSerLys101010151020TyrValAsnPheLeuTyrLeuAlaSerHisTyrGluLysLeuLys102510301035GlySerProGluAspAsnGluGlnLysGlnLeuPheValGluGln104010451050HisLysHisTyrLeuAspGluIleIleGluGlnIleSerGluPhe105510601065SerLysArgValIleLeuAlaAspAlaAsnLeuAspLysValLeu107010751080SerAlaTyrAsnLysHisArgAspLysProIleArgGluGlnAla108510901095GluAsnIleIleHisLeuPheThrLeuThrAsnLeuGlyAlaPro110011051110AlaAlaPheLysTyrPheAspThrThrIleAspArgLysArgTyr111511201125ThrSerThrLysGluValLeuAspAlaThrLeuIleHisGlnSer113011351140IleThrGlyLeuTyrGluThrArgIleAspLeuSerGlnLeuGly114511501155GlyAsp1160108DNA人工序列PAMmisc_feature7..7n是a、c、g或t10ccccccna8118DNA人工序列PAM11ccccccaa8125DNA人工序列PAM12ccccc5138DNA人工序列PAMmisc_feature6..7n是a、c、g或t13cccccnna8146DNA人工序列PAM14cccccc6156DNA人工序列PAMmisc_feature1..1n是a、c、g或t15nccccc6168DNA人工序列PAMmisc_feature1..1n是a、c、g或tmisc_feature7..7n是a、c、g或t16ncccccna8178DNA人工序列PAMmisc_feature2..2n是a、c、g或t17cnccccac8188DNA人工序列PAM18ccccccag8198DNA人工序列PAM19ccccccat8208DNA人工序列PAM20ccccccac8218DNA人工序列PAM21atccccaa8228DNA人工序列PAM22acggccaa82311PRT人工序列RuvC-1结构域基序23IleGlyLeuAspIleGlyIleThrSerIleGly15102418PRT人工序列RuvC-I结构域基序24IleGlyLeuAspIleGlyIleThrSerIleGlyTrpAlaValIleAsn151015LeuAsp255PRT人工序列桥结构域基序25ArgSerAlaArgArg152625PRT人工序列桥结构域基序26ProArgArgLeuAlaArgSerAlaArgArgArgLeuArgArgArgLys151015HisArgLeuGluArgIleArgArgLeu2025274PRT人工序列α螺旋识别叶结构域基序27TrpGlnLeuArg1287PRT人工序列α螺旋识别叶结构域28HisLeuAlaLysArgArgGly152913PRT人工序列α螺旋识别叶结构域29LeuAlaArgIleLeuLeuHisLeuAlaLysArgArgGly1510305PRT人工序列α螺旋识别叶结构域30IlePheAlaLysGln15319PRT人工序列α螺旋识别叶结构域31GluIleLysLeuIlePheAlaLysGln15326PRT人工序列α螺旋识别叶结构域32IleTrpAlaSerGlnArg153316PRT人工序列α螺旋识别叶结构域基序33LysValGlyPheCysThrPheGluProLysGluLysArgAlaProLys1510153412PRT人工序列α螺旋识别叶结构域基序34PheThrValTrpGluHisIleAsnLysLeuArgLeu15103512PRT人工序列RuvC-II结构域基序35IleAlaAsnProValValMetArgAlaLeuThrGln15103625PRT人工序列RuvC-II结构域基序36IleAlaAsnProValValMetArgAlaLeuThrGlnAlaArgLysVal151015ValAsnAlaIleIleLysLysTyrGly2025374PRT人工序列RuvC-II结构域基序37GluLeuAlaArg1388PRT人工序列RuvC-II结构域基序38IleHisIleGluLeuAlaArgGlu15397PRT人工序列HNH结构域基序39GlnAsnGlyLysCysAlaTyr154016PRT人工序列HNH结构域基序40IleValLysPheLysLeuTrpSerGluGlnAsnGlyLysCysAlaTyr151015416PRT人工序列HNH结构域基序41ValAspHisValIlePro154220PRT人工序列HNH结构域基序42ValAspHisValIleProTyrSerArgSerLeuAspAspSerTyrThr151015AsnLysValLeu204311PRT人工序列RuvC-III结构域基序43AspThrArgTyrIleSerArgPheLeuAlaAsn15104416PRT人工序列RuvC-III结构域基序44ValTyrThrValAsnGlyArgIleThrAlaHisLeuArgSerArgTrp151015456PRT人工序列RuvC-III结构域基序45HisHisAlaValAspAla154610PRT人工序列RuvC-III结构域基序46HisHisAlaValAspAlaAlaIleValAla1510478DNA人工序列PAMmisc_feature1..4n是a、c、g或tmisc_feature6..7n是a、c、g或t47nnnncnna8488DNA人工序列PAMmisc_feature1..4n是a、c、g或t48nnnncvaa8498DNA人工序列PAMmisc_feature1..4n是a、c、g或t49nnnncsaa8508DNA人工序列PAMmisc_feature1..4n是a、c、g或t50nnnncgaa8518DNA人工序列PAMmisc_feature1..4n是a、c、g或t51nnnnccaa8528DNA人工序列PAMmisc_feature1..4n是a、c、g或tmisc_feature6..6n是a、c、g或t52nnnncnaa8538DNA人工序列PAMmisc_feature1..4n是a、c、g或t53nnnncmca85430RNA人工序列tracrRNA5'发夹54aagggcuuucugccuauaggcagacugccc305525RNA人工序列tracrRNA'中间'发夹55guggcguuggggaucgccuaucgcc255636RNA人工序列tracrRNA3'发夹56cgcuuucuucgggcauuccccacucuuaggcguuuu365755RNA人工序列tracrRNA5'发夹和中间发夹57aagggcuuucugccuauaggcagacugcccguggcguuggggaucgccuaucgcc555891RNA人工序列tracrRNA5'发夹、中间发夹和3'发夹。58aagggcuuucugccuauaggcagacugcccguggcguuggggaucgccuaucgcccgcuu60ucuucgggcauuccccacucuuaggcguuuu915981DNA人工序列BG6494misc_feature35..41n是a、c、g或t59tatgcctcatgagattatcaaaaaggatcttcacnnnnnnnctagatccttttaaattaa60aaatgaagttttaaatcaatc816081DNA人工序列BG649560tatgccggatcctcagaccaagtttactcatatatactttagattgatttaaaacttcat60ttttaatttaaaaggatctag816134DNA人工序列BG735661tcgtcggcagcgtcagatgtgtataagagacagt346233DNA人工序列BG735762ctgtctcttatacacatctgacgctgccgacga336316DNA人工序列BG735863tcgtcggcagcgtcag166453DNA人工序列BG735964gtctcgtgggctcggagatgtgtataagagacaggaccatgattacgccaagc536561DNA人工序列BG761665tcgtcggcagcgtcagatgtgtataagagacagggtcatgagattatcaaaaaggatctt60c616682DNA人工序列BG815766tatgcctcatgagattatcaaaaaggatcttcacccccccagctagatccttttaaatta60aaaatgaagttttaaatcaatc826782DNA人工序列BG815867tatgcctcatgagattatcaaaaaggatcttcacccccccaactagatccttttaaatta60aaaatgaagttttaaatcaatc826882DNA人工序列BG815968tatgcctcatgagattatcaaaaaggatcttcacccccccatctagatccttttaaatta60aaaatgaagttttaaatcaatc826982DNA人工序列BG816069tatgcctcatgagattatcaaaaaggatcttcacccccccacctagatccttttaaatta60aaaatgaagttttaaatcaatc827081DNA人工序列BG8161misc_feature35..38n是a、c、g或tmisc_feature40..41n是a、c、g或t70tatgcctcatgagattatcaaaaaggatcttcacnnnntnnctagatccttttaaattaa60aaatgaagttttaaatcaatc817120DNA人工序列BG836371acggttatccacagaatcag207222DNA人工序列BG836472cgggattgacttttaaaaaagg227382DNA人工序列BG876373tatgcctcatgagattatcaaaaaggatcttcaccccccaaactagatccttttaaatta60aaaatgaagttttaaatcaatc827482DNA人工序列BG876474tatgcctcatgagattatcaaaaaggatcttcaccccccatactagatccttttaaatta60aaaatgaagttttaaatcaatc827582DNA人工序列BG876575tatgcctcatgagattatcaaaaaggatcttcaccccccagactagatccttttaaatta60aaaatgaagttttaaatcaatc827682DNA人工序列BG876676tatgcctcatgagattatcaaaaaggatcttcaccccccacactagatccttttaaatta60aaaatgaagttttaaatcaatc827782DNA人工序列BG876777tatgcctcatgagattatcaaaaaggatcttcacccccctaactagatccttttaaatta60aaaatgaagttttaaatcaatc827882DNA人工序列BG876878tatgcctcatgagattatcaaaaaggatcttcaccccccttactagatccttttaaatta60aaaatgaagttttaaatcaatc827982DNA人工序列BG876979tatgcctcatgagattatcaaaaaggatcttcacccccctgactagatccttttaaatta60aaaatgaagttttaaatcaatc828082DNA人工序列BG877080tatgcctcatgagattatcaaaaaggatcttcacccccctcactagatccttttaaatta60aaaatgaagttttaaatcaatc828182DNA人工序列BG877181tatgcctcatgagattatcaaaaaggatcttcaccccccgaactagatccttttaaatta60aaaatgaagttttaaatcaatc828282DNA人工序列BG877282tatgcctcatgagattatcaaaaaggatcttcaccccccgtactagatccttttaaatta60aaaatgaagttttaaatcaatc828382DNA人工序列BG877383tatgcctcatgagattatcaaaaaggatcttcaccccccggactagatccttttaaatta60aaaatgaagttttaaatcaatc828482DNA人工序列BG877484tatgcctcatgagattatcaaaaaggatcttcaccccccgcactagatccttttaaatta60aaaatgaagttttaaatcaatc828582DNA人工序列BG877585tatgcctcatgagattatcaaaaaggatcttcacccccccaactagatccttttaaatta60aaaatgaagttttaaatcaatc828682DNA人工序列BG877686tatgcctcatgagattatcaaaaaggatcttcaccccccctactagatccttttaaatta60aaaatgaagttttaaatcaatc828782DNA人工序列BG877787tatgcctcatgagattatcaaaaaggatcttcacccccccgactagatccttttaaatta60aaaatgaagttttaaatcaatc828882DNA人工序列BG877888tatgcctcatgagattatcaaaaaggatcttcaccccccccactagatccttttaaatta60aaaatgaagttttaaatcaatc828929DNA人工序列BG657489aagcttgaaataatacgactcactatagg299022DNA人工序列BG657690aaaaaagaccttgacgttttcc229157DNA人工序列BG930791aagcttgaaataatacgactcactataggtgagattatcaaaaaggatcttcacgtc579223DNA人工序列BG930992aaaacgcctaagagtggggaatg239319DNA人工序列BG931093aaaaggcgataggcgatcc199423DNA人工序列BG931194aaaacgggtcagtctgcctatag239557DNA人工序列BG930895aagcttgaaataatacgactcactataggtgagattatcaaaaaggatcttcacgtc579656DNA人工序列BG1011896aagcttgaaataatacgactcactataggagattatcaaaaaggatcttcacgtca569760DNA人工序列BG1011997aagcttgaaataatacgactcactataggaagattatcaaaaaggatcttcacgtcatag609858DNA人工序列BG1012098aagcttgaaataatacgactcactataggattatcaaaaaggatcttcacgtcatagt589960DNA人工序列BG1012199aagcttgaaataatacgactcactataggaattatcaaaaaggatcttcacgtcatagtt6010058DNA人工序列BG10122100aagcttgaaataatacgactcactataggttatcaaaaaggatcttcacgtcatagtt5810158DNA人工序列BG10123101aagcttgaaataatacgactcactataggtatcaaaaaggatcttcacgtcatagttc5810257DNA人工序列BG10124102aagcttgaaataatacgactcactataggatcaaaaaggatcttcacgtcatagttc5710351DNA人工序列BG9312103aaaacgcctaagagtggggaatgcccgaagaaagcgggcgataggcgatcc5110421DNA人工序列BG8191104aagcttggcgtaatcatggtc2110520DNA人工序列BG8192105tcatgagttcccatgttgtg2010648DNA人工序列BG8194106tatggcgaatcacaacatgggaactcatgagaacatcctctttcttag4810750DNA人工序列BG8195107gccgatatcaagaccgattttatacttcatttaagttacctcctcgattg5010822DNA人工序列BG8196108atgaagtataaaatcggtcttg2210918DNA人工序列BG8197109taacggacggatagtttc1811055DNA人工序列BG8198110gaaagccggggaaactatccgtccgttataaatcagacaaaatggcctgcttatg5511160DNA人工序列BG8263111gaactatgacactttattttcagaatggacgtataacggtatccattttaagaataatcc6011249DNA人工序列BG8268112accgttatacgtccattctgaaaataaagtgtcatagttcccctgagat4911348DNA人工序列BG8210113aacagctatgaccatgattacgccaagcttccctcccatgcacaatag4811460DNA人工序列BG8261114gaactatgacatcatggagttttaaatccagtataacggtatccattttaagaataatcc6011549DNA人工序列BG8266115accgttatactggatttaaaactccatgatgtcatagttcccctgagat4911660DNA人工序列BG8317116gaactatgaccacccagcttacatcaacaagtataacggtatccattttaagaataatcc6011749DNA人工序列BG8320117accgttatacttgttgatgtaagctgggtggtcatagttcccctgagat4911820DNA人工序列BG9075118ctatcggcattacgtctatc2011919DNA人工序列BG9091119gcgtcgacttctgtatagc1912041DNA人工序列BG9091120tgaagtataaaatcggtcttgctatcggcattacgtctatc4112144DNA人工序列BG9092121caagcttcggctgtatggaatcacagcgtcgacttctgtatagc4412217DNA人工序列BG9077122gctgtgattccatacag1712341DNA人工序列BG9267123ggtgcagtaggttgcagctatgcttgtataacggtatccat4112449DNA人工序列BG9263124aagcatagctgcaacctactgcaccgtcatagttcccctgagattatcg4912522DNA人工序列BG9088125tcatgaccaaaatcccttaacg2212638DNA人工序列BG9089126ttaagggattttggtcatgagaacatcctctttcttag3812728DNA人工序列BG9090127gcaagaccgattttatacttcatttaag2812852DNA人工序列BG9548128ggatcccatgacgctagtatccagctgggtcatagttcccctgagattatcg5212963DNA人工序列BG9601129ttcaatattttttttgaataaaaaatacgatacaataaaaatgtctagaaaaagataaaa60atg6313053DNA人工序列BG9600130ttttttattcaaaaaaaatattgaattttaaaaatgatggtgctagtatgaag5313158DNA人工序列BG9549131ccagctggatactagcgtcatgggatccgtataacggtatccattttaagaataatcc5813220DNA人工序列BG8552132tcgggggttcgtttcccttg2013322DNA人工序列BG8553133cttacacagccagtgacggaac2213420DNA人工序列BG2365134gccggcgtcccggaaaacga2013535DNA人工序列BG2366135gcaggtcgggttcctcgcatccatgcccccgaact3513650DNA人工序列BG2367136ggcttcggaatcgttttccgggacgccggcacggcattggcaaggccaag5013735DNA人工序列BG2368137gacacaggcatcggtgcagggtctcttggcaagtc3513835DNA人工序列BG2369138gccaagagaccctgcaccgatgcctgtgtcgaacc3513950DNA人工序列BG2370139cttggcggaaaacgtcaaggtcttttttacacgcgcatcaacttcaaggc5014048DNA人工序列BG2371140atgacgagctgttcaccagcagcgctattattgaagcatttatcaggg4814123DNA人工序列BG2372141gtaaaaaagaccttgacgttttc2314234DNA人工序列BG2373142tatgaagcgggccatttgaagacgaaagggcctc3414349DNA人工序列BG2374143taatagcgctgctggtgaacagctcgtcatagttcccctgagattatcg4914437DNA人工序列BG2375144tggagtcatgaacatatgaagtataaaatcggtcttg3714535DNA人工序列BG2376145ccctttcgtcttcaaatggcccgcttcataagcag3514639DNA人工序列BG2377146gattttatacttcatatgttcatgactccattattattg3914735DNA人工序列BG2378147gggggcatggatgcgaggaacccgacctgcattgg3514820DNA人工序列BG2381148acacggcggatgcacttacc2014920DNA人工序列BG2382149tggacgtgtacttcgacaac2015020DNA人工序列BG2135150acacggcggatgcacttacc2015120DNA人工序列BG8196151tggacgtgtacttcgacaac2015218DNA人工序列BG8197152taacggacggatagtttc1815331DNA人工序列BG6850153gcctcatgaatgcagcgatggtccggtgttc3115427DNA人工序列BG6849154gcctcatgagttcccatgttgtgattc2715519DNA人工序列BG6769155caatccaactgggcttgac1915620DNA人工序列BG6841156caagaactttattggtatag2015720DNA人工序列BG6840157ttgcagaaatggttgtcaag2015819DNA人工序列BG9215158gagataatgccgactgtac1915919DNA人工序列BG9216159agggctcgcctttgggaag1916017DNA人工序列BG9505160gttgccaacgttctgag1716116DNA人工序列BG9506161aatccacgccgtttag1616220DNA人工序列BG8363162acggttatccacagaatcag2016322DNA人工序列BG8364163cgggattgacttttaaaaaagg22164120DNA人工序列BG9302164aaacttcatttttaatttaaaaggatctagaaccccccgtgaagatcctttttgataatc60tcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaa120165120DNA人工序列BG9303165tttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatga60gattatcaaaaaggatcttcacccccccaactagatccttttaaattaaaaatgaagttt120166120DNA人工序列BG9304166tttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatga60gattatcaaaaaggatcttcacggggggttctagatccttttaaattaaaaatgaagttt12016743DNA人工序列BG7886167tacttccaatccaatgcaaagtataaaatcggtcttgatatcg4316850DNA人工序列BG7887168ttatccacttccaatgttattataacggacggatagtttccccggctttc5016925DNA人工序列BG9665169atgacgaaaggagtttcttattatg2517020DNA人工序列BG9666170aacggtattccgtgattaag20

权利要求:1.至少一种靶向RNA分子和Cas蛋白用于结合、裂解、标记或修饰包含靶核酸序列的双链靶多核苷酸的用途,其中:所述双链靶多核苷酸包含靶核酸链和非靶核酸链,所述靶核酸链包含所述靶核酸序列,所述非靶核酸链包含与所述靶核酸序列互补的前间区核酸序列;所述Cas蛋白具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列;所述至少一种靶向RNA分子识别所述靶序列;所述非靶核酸链还包含与所述前间区核酸序列的3’末端直接地相邻的前间区相邻基序PAM序列,其中所述PAM序列包含5’-NNNNCNN-3’;其中所述用途是在人类细胞中;并且任选地其中所述人类细胞不是胚胎干细胞。2.根据权利要求1所述的用途,其中所述结合、裂解、标记或修饰发生在20℃和100℃之间的温度、30℃和80℃之间的温度、37℃和78℃之间的温度,优选地55℃以上的温度;更优选地55℃和80℃之间的温度;甚至更优选地55℃和65℃之间的温度或60℃和65℃之间的温度。3.根据权利要求1或权利要求2所述的用途,其中包含所述靶核酸序列的所述多核苷酸被所述Cas蛋白裂解,优选地其中所述裂解是DNA裂解。4.根据权利要求1至3中任一项所述的用途,其中包含所述靶序列的所述靶核酸链是双链DNA,并且所述用途引起包含所述靶核酸序列的所述多核苷酸中的双链断裂。5.根据权利要求1或权利要求2所述的用途,其中包含所述靶核酸序列的所述多核苷酸是双链DNA,所述Cas蛋白缺乏切割所述双链DNA的能力,并且所述用途引起所述多核苷酸的基因沉默。6.根据权利要求5所述的用途,其中包含所述多核苷酸的所述Cas蛋白包含突变D8A和H582A。7.根据任一项前述权利要求所述的用途,其中所述PAM序列包含5’-NNNNCNNA-3’[SEQIDNO:47]。8.根据任一项前述权利要求所述的用途,其中所述PAM序列包含5’-NNNNCSAA-3’[SEQIDNO:48]。9.根据权利要求8所述的用途,其中所述PAM序列包含5’-NNNNCCAA-3’[SEQIDNO:50]。10.根据权利要求8或权利要求9所述的用途,其中所述结合、裂解、标记或修饰发生在20℃和70℃之间的温度。11.根据权利要求7至10中任一项所述的用途,其中结合、裂解、标记或修饰发生在25℃和65℃之间的温度。12.根据任一项前述权利要求所述的用途,其中所述Cas蛋白从细菌、古核生物或病毒,优选地从嗜热细菌可获得。13.根据任一项前述权利要求所述的用途,其中所述Cas蛋白从地芽孢杆菌属的种Geobacillussp.,优选地从热脱氮地芽孢杆菌Geobacillusthermodenitrificans可获得。14.根据任一项前述权利要求所述的用途,其中所述靶向RNA分子包含crRNA和tracrRNA。15.根据任一项前述权利要求所述的用途,其中所述至少一种靶向RNA分子的长度是在35-200个核苷酸残基的范围中。16.根据任一项前述权利要求所述的用途,其中所述靶核酸序列的长度是从15个至32个核苷酸残基。17.根据任一项前述权利要求所述的用途,其中所述Cas蛋白还包含至少一个功能部分。18.根据任一项前述权利要求所述的用途,其中所述Cas蛋白作为蛋白复合体的一部分被提供,所述蛋白复合体包含至少一种另外的功能蛋白或非功能蛋白,任选地其中所述至少一种另外的蛋白还包含至少一个功能部分。19.根据权利要求17或权利要求18所述的用途,其中所述Cas蛋白或另外的蛋白包含与所述Cas蛋白或蛋白复合体的N-末端和或C-末端,优选地C-末端融合或连接的至少一个功能部分。20.根据权利要求17至19中任一项所述的用途,其中所述至少一个功能部分是蛋白;任选地选自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签,例如绿色荧光蛋白GFP。21.根据权利要求20所述的用途,其中所述Cas9核酸酶的天然活性被失活并且所述Cas蛋白与至少一个功能部分连接。22.根据权利要求20或权利要求21所述的用途,其中所述至少一个功能部分是核酸酶结构域;优选地FokI核酸酶结构域。23.根据权利要求20至22中任一项所述的用途,其中所述至少一个功能部分是标志物蛋白。24.一种结合、裂解、标记或修饰人类细胞中的双链靶多核苷酸的方法,其中所述双链靶多核苷酸包含靶核酸链和非靶核酸链,所述靶核酸链包含靶核酸序列,所述非靶核酸链包含与所述靶核酸序列互补的前间区核酸序列,所述方法包括:a.设计至少一种靶向RNA分子,其中所述靶向RNA分子识别所述靶链中的所述靶序列,并且所述非靶链还包含与所述前间区序列的3’末端直接地相邻的前间区相邻基序PAM序列,其中所述PAM序列包含5’-NNNNCNN-3’;b.形成包含所述靶向RNA分子和Cas蛋白的核糖核蛋白复合体,其中分离的所述Cas蛋白具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列;和c.所述核糖核蛋白复合体结合、裂解、标记或修饰所述靶多核苷酸;任选地其中所述人类细胞不是胚胎干细胞;并且任选地其中所述方法不改变人类的生殖系遗传同一性。25.根据权利要求24所述的方法,其中所述结合、裂解、标记或修饰发生在20℃和100℃之间的温度、30℃和80℃之间的温度、37℃和78℃之间的温度,优选地55℃以上的温度;更优选地55℃和80℃之间的温度;甚至更优选地55℃和65℃之间的温度或60℃和65℃之间的温度。26.根据权利要求24或权利要求25所述的方法,其中包含所述靶核酸序列的所述双链靶多核苷酸被所述Cas蛋白裂解,优选地其中所述裂解是DNA裂解。27.根据权利要求24至26中任一项所述的方法,其中所述靶多核苷酸是双链DNA,并且所述用途引起所述多核苷酸中的双链断裂。28.根据权利要求24或权利要求25所述的方法,其中包含所述靶核酸序列的所述靶多核苷酸是双链DNA,所述Cas蛋白缺乏切割所述双链DNA的能力,并且所述方法引起所述靶多核苷酸的基因沉默。29.根据权利要求24至28中任一项所述的方法,其中所述PAM序列包含5’-NNNNCNNA-3’[SEQIDNO:47]。30.根据权利要求29所述的方法,其中所述PAM序列包含5’-NNNNCSAA-3’[SEQIDNO:48]。31.根据权利要求30所述的方法,其中所述PAM序列包含5’-NNNNCCAA-3’[SEQIDNO:50]。32.根据权利要求30或权利要求31所述的方法,其中所述结合、裂解、标记或修饰发生在20℃和70℃之间的温度。33.根据权利要求29至32中任一项所述的方法,其中结合、裂解、标记或修饰发生在25℃和65℃之间的温度。34.根据权利要求24至33中任一项所述的方法,其中所述Cas蛋白从细菌、古核生物或病毒,优选地从嗜热细菌可获得。35.根据权利要求24至34中任一项所述的方法,其中所述Cas蛋白从地芽孢杆菌属的种,优选地从热脱氮地芽孢杆菌可获得。36.根据权利要求24至35中任一项所述的方法,其中所述靶向RNA分子包含crRNA和tracrRNA。37.根据权利要求24至36中任一项所述的方法,其中所述至少一种靶向RNA分子的长度是在35-200个核苷酸残基的范围中。38.根据权利要求24至37中任一项所述的方法,其中所述靶核酸序列的长度是从15个至32个核苷酸残基。39.根据权利要求24至39中任一项所述的方法,其中所述Cas蛋白还包含至少一个功能部分。40.根据权利要求24至40中任一项所述的方法,其中所述Cas蛋白作为蛋白复合体的一部分被提供,所述蛋白复合体包含至少一种另外的功能蛋白或非功能蛋白,任选地其中所述至少一种另外的蛋白还包含至少一个功能部分。41.根据权利要求39或40所述的方法,其中所述Cas蛋白或另外的蛋白包含与所述Cas蛋白或蛋白复合体的N-末端和或C-末端,优选地C-末端融合或连接的至少一个功能部分。42.根据权利要求39至41中任一项所述的方法,其中所述至少一个功能部分是蛋白;任选地选自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签,例如绿色荧光蛋白GFP。43.根据权利要求42所述的方法,其中所述Cas9核酸酶的天然活性被失活并且所述Cas蛋白与至少一个功能部分连接。44.根据权利要求42或权利要求43所述的方法,其中所述至少一个功能部分是核酸酶结构域;优选地FokI核酸酶结构域。45.根据权利要求42至44中任一项所述的方法,其中所述至少一个功能部分是标志物蛋白。46.根据权利要求20所述的用途或根据权利要求42所述的方法,其中所述双链靶多核苷酸是dsDNA,所述至少一个功能部分是核酸酶或解旋酶-核酸酶,并且所述修饰是在期望的基因座处的单链断裂或双链断裂。47.根据权利要求20所述的用途或根据权利要求42所述的方法,其中所述双链靶多核苷酸是dsDNA,并且所述功能部分选自DNA修饰酶例如甲基化酶或乙酰基转移酶、转录活化物或转录阻遏物,并且所述结合、裂解、标记或修饰引起基因表达的修饰。48.根据权利要求20所述的用途或根据权利要求42所述的方法,其中所述结合、裂解、标记或修饰发生在体内。49.根据权利要求1至4、7至23或46中任一项所述的用途,或根据权利要求24至27、29至46中任一项所述的方法,其中所述结合、裂解、标记或修饰引起在期望的位置处修饰或缺失和或插入期望的核苷酸序列,和或其中所述结合、裂解、标记或修饰引起使在期望的基因座处的基因表达沉默。50.一种经转化的人类细胞,所述经转化的人类细胞具有包含靶核酸序列的双链靶多核苷酸,其中所述双链靶多核苷酸包含靶核酸链和非靶核酸链,所述靶核酸链包含所述靶核酸序列,所述非靶核酸链包含与所述靶核酸序列互补的前间区核酸序列,所述细胞包含:成簇的规律地间隔的短回文重复CRISPR相关的Cas蛋白,所述成簇的规律地间隔的短回文重复CRISPR相关的Cas蛋白具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列;至少一种靶向RNA分子,所述至少一种靶向RNA分子识别所述靶核酸链中的所述靶核酸序列,其中所述非靶链还包含与所述前间区序列的3’末端直接地相邻的前间区相邻基序PAM序列,其中所述PAM序列包含5’-NNNNCNN-3’;和表达载体,所述表达载体包含编码所述Cas蛋白和所述靶向RNA分子中的至少一种的核酸;任选地其中所述人类细胞不是胚胎干细胞。51.根据权利要求50所述的经转化的细胞,其中所述Cas蛋白和靶向RNA分子使得能够结合、裂解、标记或修饰所述细胞中的所述靶多核苷酸,并且所述结合、裂解、标记或修饰发生在20℃和100℃之间的温度、30℃和80℃之间的温度、37℃和78℃之间的温度,优选地55℃以上的温度;更优选地55℃和80℃之间的温度;甚至更优选地55℃和65℃之间的温度或60℃和65℃之间的温度。52.根据权利要求50或权利要求51所述的经转化的细胞,其中包含所述靶核酸序列的所述靶核酸链被所述Cas蛋白裂解,优选地其中所述裂解是DNA裂解。53.根据权利要求50至52中任一项所述的经转化的细胞,其中包含所述靶序列的所述靶多核苷酸是双链DNA,并且所述结合、裂解、标记或修饰引起所述靶多核苷酸中的双链断裂。54.根据权利要求50或权利要求51所述的经转化的细胞,其中包含所述靶核酸序列的所述靶多核苷酸是双链DNA,所述Cas蛋白缺乏切割所述双链DNA的能力,并且所述结合、裂解、标记或修饰引起所述靶多核苷酸的基因沉默。55.根据权利要求50至54中任一项所述的经转化的细胞,其中所述PAM序列包含5’-NNNNCNNA-3’[SEQIDNO:47]。56.根据权利要求55所述的经转化的细胞,其中所述PAM序列包含5’-NNNNCSAA-3’[SEQIDNO:48]。57.根据权利要求56所述的经转化的细胞,其中所述PAM序列包含5’-NNNNCCAA-3’[SEQIDNO:50]。58.根据权利要求56或权利要求57所述的经转化的细胞,其中所述结合、裂解、标记或修饰发生在20℃和70℃之间的温度。59.根据权利要求55至58中任一项所述的经转化的细胞,其中所述结合、裂解、标记或修饰发生在25℃和65℃之间的温度。60.根据权利要求50至59中任一项所述的经转化的细胞,其中所述Cas蛋白从细菌、古核生物或病毒,优选地从嗜热细菌可获得。61.根据权利要求50至60中任一项所述的经转化的细胞,其中所述Cas蛋白从地芽孢杆菌属的种,优选地从热脱氮地芽孢杆菌可获得。62.根据权利要求50至61中任一项所述的经转化的细胞,其中所述靶向RNA分子包含crRNA和tracrRNA。63.根据权利要求50至62中任一项所述的经转化的细胞,其中所述至少一种靶向RNA分子的长度是在35-200个核苷酸残基的范围中。64.根据权利要求50至63中任一项所述的经转化的细胞,其中所述靶核酸序列的长度是从15个至32个核苷酸残基。65.根据权利要求50至64中任一项所述的经转化的细胞,其中所述Cas蛋白还包含至少一个功能部分。66.根据权利要求50至65中任一项所述的经转化的细胞,其中所述Cas蛋白作为蛋白复合体的一部分被提供,所述蛋白复合体包含至少一种另外的功能蛋白或非功能蛋白,任选地其中所述至少一种另外的蛋白还包含至少一个功能部分。67.根据权利要求65或66所述的经转化的细胞,其中所述Cas蛋白或另外的蛋白包含与所述Cas蛋白或蛋白复合体的N-末端和或C-末端,优选地N-末端融合或连接的至少一个功能部分。68.根据权利要求65至67中任一项所述的经转化的细胞,其中所述至少一个功能部分是蛋白;任选地选自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签,例如绿色荧光蛋白GFP。69.根据权利要求68所述的经转化的细胞,其中所述Cas9核酸酶的天然活性被失活并且所述Cas蛋白与至少一个功能部分连接。70.根据权利要求65至69中任一项所述的经转化的细胞,其中所述至少一个功能部分是核酸酶结构域;优选地FokI核酸酶结构域。71.根据权利要求65至69中任一项所述的经转化的细胞,其中所述至少一个功能部分是标志物蛋白。72.根据权利要求65至70中任一项所述的经转化的细胞,其中所述双链靶多核苷酸是dsDNA,所述至少一个功能部分是核酸酶或解旋酶-核酸酶,并且所述修饰是在期望的基因座处的单链断裂或双链断裂。73.根据权利要求65至69中任一项所述的经转化的细胞或根据权利要求42所述的方法,其中所述双链靶多核苷酸是dsDNA,并且所述功能部分选自DNA修饰酶例如甲基化酶或乙酰基转移酶、转录活化物或转录阻遏物,并且所述结合、裂解、标记或修饰引起基因表达的修饰。74.根据权利要求65至70中任一项所述的经转化的细胞,其中所述Cas蛋白从表达载体表达。75.根据权利要求50至74中任一项所述的经转化的细胞,其中所述结合、裂解、标记或修饰引起在期望的位置处修饰或缺失和或插入期望的核苷酸序列,和或其中所述结合、裂解、标记或修饰引起使在期望的基因座处的基因表达沉默。76.一种核蛋白复合体,所述核蛋白复合体包含Cas蛋白、识别双链靶多核苷酸中的靶核酸序列的至少一种靶向RNA分子、和所述靶多核苷酸,其中所述Cas蛋白具有SEQIDNO:1的氨基酸序列或与SEQIDNO:1具有至少77%同一性的序列;所述双链靶多核苷酸包含靶核酸链和非靶核酸链,所述靶核酸链包含所述靶核酸序列,所述非靶核酸链包含与所述靶核酸序列互补的前间区核酸序列和与所述前间区序列的3’末端直接地相邻的前间区相邻基序PAM序列,其中所述PAM序列包含5’-NNNNCNN-3’;其中所述核蛋白复合体在人类细胞中;并且任选地其中所述细胞不是胚胎干细胞。77.根据权利要求76所述的核蛋白复合体,其中所述核蛋白复合体在20℃和100℃之间的温度、30℃和80℃之间的温度、37℃和78℃之间的温度,优选地55℃以上的温度;更优选地55℃和80℃之间的温度;甚至更优选地55℃和65℃之间的温度或60℃和65℃之间的温度存在。78.根据权利要求76或权利要求77所述的核蛋白复合体,其中包含所述靶核酸序列的所述双链靶多核苷酸被所述Cas蛋白裂解,优选地其中所述裂解是DNA裂解。79.根据权利要求76至78中任一项所述的核蛋白复合体,其中包含所述靶序列的所述靶多核苷酸是双链DNA,并且所述结合、裂解、标记或修饰引起所述靶多核苷酸中的双链断裂。80.根据权利要求76或权利要求77所述的核蛋白复合体,其中包含所述靶核酸序列的所述靶多核苷酸是双链DNA,所述Cas蛋白缺乏切割所述双链DNA的能力,并且所述核蛋白复合体的存在引起所述靶多核苷酸的基因沉默。81.根据权利要求76至80中任一项所述的核蛋白复合体,其中所述PAM序列包含5’-NNNNCNNA-3’[SEQIDNO:47]。82.根据权利要求81所述的核蛋白复合体,其中所述PAM序列包含5’-NNNNCSAA-3’[SEQIDNO:48]。83.根据权利要求82所述的核蛋白复合体,其中所述PAM序列包含5’-NNNNCCAA-3’[SEQIDNO:50]。84.根据权利要求82或权利要求83所述的核蛋白复合体,其中所述结合、裂解、标记或修饰发生在20℃和70℃之间的温度。85.根据权利要求81至84中任一项所述的核蛋白复合体,其中所述结合、裂解、标记或修饰发生在25℃和65℃之间的温度。86.根据权利要求76至85中任一项所述的核蛋白复合体,其中所述Cas蛋白从细菌、古核生物或病毒,优选地从嗜热细菌可获得。87.根据权利要求76至86中任一项所述的核蛋白复合体,其中所述Cas蛋白从地芽孢杆菌属的种,优选地从热脱氮地芽孢杆菌可获得。88.根据权利要求76至87中任一项所述的核蛋白复合体,其中所述靶向RNA分子包含crRNA和tracrRNA。89.根据权利要求76至88中任一项所述的核蛋白复合体,其中所述至少一种靶向RNA分子的长度是在35-200个核苷酸残基的范围中。90.根据权利要求76至89中任一项所述的核蛋白复合体,其中所述靶核酸序列的长度是从15个至32个核苷酸残基。91.根据权利要求76至90中任一项所述的核蛋白复合体,其中所述Cas蛋白还包含至少一个功能部分。92.根据权利要求76至91中任一项所述的核蛋白复合体,其中所述Cas蛋白作为蛋白复合体的一部分被提供,所述蛋白复合体包含至少一种另外的功能蛋白或非功能蛋白,任选地其中所述至少一种另外的蛋白还包含至少一个功能部分。93.根据权利要求91或92所述的核蛋白复合体,其中所述Cas蛋白或另外的蛋白包含与所述Cas蛋白或蛋白复合体的N-末端和或C-末端,优选地C-末端融合或连接的至少一个功能部分。94.根据权利要求91至93中任一项所述的核蛋白复合体,其中所述至少一个功能部分是蛋白;任选地选自解旋酶、核酸酶、解旋酶-核酸酶、DNA甲基化酶、组蛋白甲基化酶、乙酰基转移酶、磷酸酶、激酶、转录共活化物、转录阻遏物、DNA结合蛋白、DNA结构蛋白、标志物蛋白、报告物蛋白、荧光蛋白、配体结合蛋白、信号肽、亚细胞定位序列、抗体表位或亲和纯化标签,例如绿色荧光蛋白GFP。95.根据权利要求94所述的核蛋白复合体,其中所述Cas9核酸酶的天然活性被失活并且所述Cas蛋白与至少一个功能部分连接。96.根据权利要求91至95中任一项所述的核蛋白复合体,其中所述至少一个功能部分是核酸酶结构域;优选地FokI核酸酶结构域。97.根据权利要求91至95中任一项所述的核蛋白复合体,其中所述至少一个功能部分是标志物蛋白。98.根据权利要求91至96中任一项所述的核蛋白复合体,其中所述核酸是dsDNA,所述至少一个功能部分是核酸酶或解旋酶-核酸酶,并且所述靶多核苷酸具有在期望的基因座处的单链断裂或双链断裂。99.根据权利要求91至95中任一项所述的核蛋白复合体,其中所述核酸是dsDNA,并且所述功能部分选自DNA修饰酶例如甲基化酶或乙酰基转移酶、转录活化物或转录阻遏物,并且所述核蛋白复合体的形成引起基因表达的修饰。100.根据权利要求76至99中任一项所述的核蛋白复合体,其中所述核蛋白的形成引起在期望的位置处修饰或缺失和或插入期望的核苷酸序列,和或其中所述核蛋白复合体的形成引起使在期望的基因座处的基因表达沉默。

百度查询: 瓦赫宁根大学;科学技术基金会 热稳定的Cas9核酸酶

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。