买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】用于血友病A的基因治疗的具有增加的表达的编码重组FVIII变体的病毒载体_武田药品工业株式会社_201680067846.4 

申请/专利权人:武田药品工业株式会社

申请日:2016-11-11

公开(公告)日:2023-08-22

公开(公告)号:CN108884145B

主分类号:C07K14/755

分类号:C07K14/755;A61K48/00;C12N15/86

优先权:["20151113 US 62/255,317"]

专利状态码:有效-授权

法律状态:2023.08.22#授权;2018.12.18#实质审查的生效;2018.11.23#公开

摘要:除其他方面外,本公开提供用于在哺乳动物细胞中表达的编码因子VIII变体的密码子改变的多核苷酸。在一些实施方案中,本公开还提供用于治疗血友病A的哺乳动物基因疗法载体和方法。

主权项:1.一种包含编码因子VIII多肽的核苷酸序列的多核苷酸,所述因子VIII多肽包含轻链、重链以及将重链的C端连接至所述轻链的N端的多肽接头,其中所述因子VIII多肽的所述重链由SEQIDNO:3的第一核苷酸序列编码;其中所述因子VIII多肽的所述轻链由SEQIDNO:4的第二核苷酸序列编码;并且其中所述多肽接头包含弗林蛋白酶裂解位点。

全文数据:用于血友病A的基因治疗的具有増加的表达的编码重组FVIII变体的病毒载体[0001]相关申请的交叉引用[0002]本申请要求于2015年11月13日提交的美国临时专利申请号62255,317的优先权,该临时专利申请的内容出于所有目的以全文引用的方式并入本文中。[0003]序列表[0004]本申请含有已经以ASCII格式电子提交并且以全文引用的方式并入本文中的序列表。所述ASCII副本创建于2016年11月9日,命名为008073_5107_TO_Sequence_Listing.txt并且大小为353,479字节。背景技术[0005]血液凝固通过称为凝血级联的相互依赖的生物化学反应的复杂且动态的生物途径进行。凝血因子VIIIFVIII是级联中的关键组分。因子VIII被招募到出血位点,并且与活化的因子IXFIXa和因子XFX形成X酶复合物。X酶复合物活化FX,FX又将凝血酶原活化为凝血酶,然后凝血酶活化凝血级联中的其他组分以产生稳定的凝块在Saenko等,TrendsCardiovasc·Med·,9:185-1921999;Lenting等,Blood,92:3983-39961998·[0006]血友病A是一种以缺乏因子VIII活性为特征的先天性X连锁性出血性病症。降低的因子VIII活性抑制了凝血级联中的正反馈回路。这会导致不完全凝固,表现为持续时间延长、大面积青紫、自发性口腔和鼻腔出血、关节僵硬和慢性疼痛以及严重情况下可能出现内出血和贫血的出血事件Zhang等,Clinic.Rev.Allerg·Immunol·,37:114-1242009。[0007]常规地,通过因子VIII替代疗法来治疗血友病A,所述因子VIII替代疗法由向血友病A个体施用因子VIII蛋白(例如血浆衍生或重组产生的因子VIII组成。预防性地施用因子VIII以预防出血事件或响应于急性出血事件降低其频率,和或围手术期施用以管理手术期间的出血。然而,因子VIII替代疗法有几个不希望的特征。[0008]第一,因子VIII替代疗法是用于治疗或管理血友病A,但不能治愈潜在的因子VIII缺乏。由于这个原因,血友病A个体在其一生中都需要因子VIII替代疗法。持续治疗是昂贵的,并且要求个体保持严格的依从性,因为仅缺少少数预防性剂量就会对严重血友病A的个体产生严重后果。[0009]第二,因为因子VIII在体内的半衰期相对较短,常规预防性因子VIII替代疗法需要每两天或每三天进行施药。这给个体在其生活中保持依从性带来负担。尽管第三代“长效”因子VIII药物可能会降低施用频率,但使用这些药物的预防性因子FVIII替代疗法仍需要永久性地每月、每周或更频繁的进行施药。举例来说,用EL0CTATE™[抗血友病因子(重组),Fc融合蛋白]预防性治疗需要每3到5天施药ELOCTATE™PrescribingInformation,BiogenIdeeInc.,(2015。此外,尚未完全了解化学修饰的生物制剂例如聚乙二醇化多肽的长期影响。[0010]第三,接受因子VIII替代疗法的所有个体中有15%至30%形成抗因子VIII抑制剂抗体,从而导致疗法效率低。可使用因子VIII旁路疗法例如施用血浆衍生或重组产生的凝血酶原复合物浓缩物来治疗形成抑制剂抗体的个体的血友病。然而,因子VIII旁路疗法与因子VIII替代疗法相比不太有效(MannucciP.M·,JThrombHaemost.,17:1349-552003并且可能与心血管并发症的风险增加有关Luu和Ewenstein,Haemophilia,10增刊2:10-162004〇[0011]体细胞基因疗法为血友病A的治疗带来极大的希望,因为它可以补救潜在的低表达功能性因子VIII活性例如归因于错义或无义突变),而不是提供一次剂量的因子VIII活性给个体。由于作用机制的这种差异,与因子VIII替代疗法相比,一次施用因子VIII基因疗法载体可为个体提供几年的因子VIII,从而降低治疗成本并且消除了对持续患者依从性的需要。[0012]凝血因子IXFIX基因疗法已被有效地用于治疗血友病B个体,血友病B是一种以因子IX活性降低为特征的相关凝血病状MannoC.S.等,NatMed.,123:342-472006。然而,因子VIII基因疗法存在几个独特的挑战。举例来说,全长野生型因子VIII多肽2351个氨基酸;UniProt登录号P00451比全长野生型因子IX多肽461个氨基酸;UniProt登录号P00740大五倍。因此,野生型因子VIII的编码序列为7053个碱基对,这太大而不能包装在常规AAV基因疗法载体中。此外,报道的因子VIII的B-结构域缺失变体BDD-FVIII的重组表达是差的。因此,若干小组已试图改变BDD-FVIII构建体的密码子使用,但取得的成功有限。发明内容[0013]因此,对编码序列更高效地包装到基因疗法载体中并且经由基因疗法载体递送的因子VIII变体存在需要。还对更高效地表达因子VIII的合成的密码子改变的核酸存在需要。此类因子VIII变体和密码子改变的核酸允许因子VIII缺乏例如血友病A的改善的治疗。公开的密码子改变的因子VIII变体减少或消除了上述缺乏和与治疗因子VIII缺乏例如血友病A相关的其他问题。[0014]根据一些实施方案,本公开提供编码因子VIII变体的核酸,所述核酸与公开的密码子改变的因子VIII重链(例如CS01-HC-NA、CS04-HC-NA或CS23-HC-NA和轻链CS01-LC-NA、CS04-LC-NA或CS23-LC-NA的序列具有高序列同一性。在一些实施方案中,这些核酸在编码因子VIII重链和轻链的序列之间进一步包括编码接头序列的序列,所述接头序列替代天然因子VIIIB-结构域例如包含弗林蛋白酶裂解位点(furincleavagesite的接头序列)。[0015]在一个方面中,本公开提供一种包括编码因子VIII多肽的核苷酸序列的多核苷酸。因子VIII多肽包括轻链、重链以及将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CS04-HC-NASEQIDN0:3具有至少95%同一性的第一核苷酸序列编码。因子FVIII多肽的轻链是由与CS04-LC-NASEQIDN0:4具有至少95%同一性的第二核苷酸序列编码。多肽接头包含弗林蛋白酶裂解位点。[0016]在上文所描述的多核苷酸的一个实施方案中,多肽接头由与BDL004SEQIDNO:6具有至少95%同一性的第三核苷酸序列编码。[0017]在一个方面中,本公开提供一种包括编码因子VIII多肽的核苷酸序列的多核苷酸。因子VIII多肽包括轻链、重链以及将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CSOl-HC-NASEQIDNO:24具有至少95%同一性的第一核苷酸序列编码。因子FVIII多肽的轻链是由与CSOl-LC-NASEQIDNO:25具有至少95%同一性的第二核苷酸序列编码。多肽接头包含弗林蛋白酶裂解位点。[0018]在上文所描述的多核苷酸的一个实施方案中,多肽接头由与BDL001SEQIDNO:5具有至少95%同一性的第三核苷酸序列编码。[0019]在一个方面中,本公开提供一种包括编码因子VIII多肽的核苷酸序列的多核苷酸。因子VIII多肽包括轻链、重链以及将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CS23-HC-NASEQIDN0:22具有至少95%同一性的第一核苷酸序列编码。因子FVIII多肽的轻链是由与CS23-LC-NASEQIDN0:23具有至少95%同一性的第二核苷酸序列编码。多肽接头包含弗林蛋白酶裂解位点。[0020]在上文所描述的多核苷酸的一个实施方案中,多肽接头由与BDL023SEQIDNO:7具有至少95%同一性的第三核苷酸序列编码。[0021]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与相应重链序列(例如CS04-HC-NASEQIDN0:3、CS01-HC-NASEQIDN0:24或CS23-HC-NASEQIDNO:22具有至少96%的同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与相应轻链序列(例如CS04-LC-NASEQIDN0:4、CS01-LC-NASEQIDNO:25或CS23-LC-NASEQIDN0:23具有至少96%的同一性。[0022]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与相应重链序列(例如CS04-HC-NASEQIDN0:3、CS01-HC-NASEQIDN0:24或CS23-HC-NASEQIDNO:22具有至少97%的同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与相应轻链序列(例如CS04-LC-NASEQIDN0:4、CS01-LC-NASEQIDNO:25或CS23-LC-NASEQIDN0:23具有至少97%的同一性。[0023]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与相应重链序列(例如CS04-HC-NASEQIDN0:3、CS01-HC-NASEQIDN0:24或CS23-HC-NASEQIDNO:22具有至少98%的同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与相应轻链序列(例如CS04-LC-NASEQIDN0:4、CS01-LC-NASEQIDNO:25或CS23-LC-NASEQIDN0:23具有至少98%的同一性。[0024]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与相应重链序列(例如CS04-HC-NASEQIDN0:3、CS01-HC-NASEQIDN0:24或CS23-HC-NASEQIDNO:22具有至少99%的同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与相应轻链序列(例如CS04-LC-NASEQIDN0:4、CS01-LC-NASEQIDNO:25或CS23-LC-NASEQIDN0:23具有至少99%的同一性。[0025]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与相应重链序列(例如CS04-HC-NASEQIDN0:3、CS01-HC-NASEQIDN0:24或CS23-HC-NASEQIDNO:22具有至少99.5%的同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与相应轻链序列(例如CS04-LC-NASEQIDN0:4、CS01-LC-NASEQIDN0:25或CS23-LC-NASEQIDN0:23具有至少99.5%的同一性。[0026]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列与相应重链序列(例如CS04-HC-NASEQIDN0:3、CS01-HC-NASEQIDN0:24或CS23-HC-NASEQIDNO:22具有至少99.9%的同一性,并且编码因子FVIII多肽的轻链的第二核苷酸序列与相应轻链序列(例如CS04-LC-NASEQIDN0:4、CS01-LC-NASEQIDN0:25或CS23-LC-NASEQIDN0:23具有至少99.9%的同一性。[0027]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列为CS04-HC-NASEQIDN0:3,并且编码因子FVIII多肽的轻链的第二核苷酸序列为CS04-LC-NASEQIDN0:4。[0028]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列为CSOl-HC-NASEQIDN0:24,并且编码因子FVIII多肽的轻链的第二核苷酸序列为CSOl-LC-NASEQIDN0:25。[0029]在上文所描述的多核苷酸的一个实施方案中,编码因子VIII多肽的重链的第一核苷酸序列为CS23-HC-NASEQIDN0:22,并且编码因子FVIII多肽的轻链的第二核苷酸序列为CS23-LC-NASEQIDN0:23。[0030]在一个方面中,本公开提供一种包含与CS04-FL-NA具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码因子VIII多肽。[0031]在一个方面中,本公开提供一种包含与CSOI-FL-NA具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码因子VIII多肽。[0032]在一个方面中,本公开提供一种包含与CS23-FL-NA具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码因子VIII多肽。[0033]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-FL-NASEQIDN0:1、CS01-FL-NASEQIDN0:13或CS23-FL-NASEQIDNO:20具有至少96%的同一性。[0034]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-FL-NASEQIDN0:1、CS01-FL-NASEQIDN0:13或CS23-FL-NASEQIDNO:20具有至少97%的同一性。[0035]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-FL-NASEQIDN0:1、CS01-FL-NASEQIDN0:13或CS23-FL-NASEQIDNO:20具有至少98%的同一性。[0036]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-FL-NASEQIDN0:1、CS01-FL-NASEQIDN0:13或CS23-FL-NASEQIDNO:20具有至少99%的同一性。[0037]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-FL-NASEQIDN0:1、CS01-FL-NASEQIDN0:13或CS23-FL-NASEQIDNO:20具有至少99.5%的同一性。[0038]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-FL-NASEQIDN0:1、CS01-FL-NASEQIDN0:13或CS23-FL-NASEQIDNO:20具有至少99.9%的同一性。[0039]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS04-FL-NASEQIDN0:1〇[0040]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS01-FL-NASEQIDNO:13ο[0041]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS23-FL-NASEQIDNO:20〇[0042]在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AASEQIDNO:2具有至少95%同一性的氨基酸序列的因子VIII多肽。[0043]在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AASEQIDNO:2具有至少96%同一性的氨基酸序列的因子VIII多肽。[0044]在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AASEQIDNO:2具有至少97%同一性的氨基酸序列的因子VIII多肽。[0045]在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AASEQIDNO:2具有至少98%同一性的氨基酸序列的因子VIII多肽。[0046]在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AASEQIDNO:2具有至少99%同一性的氨基酸序列的因子VIII多肽。[0047]在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AASEQIDNO:2具有至少99.5%同一性的氨基酸序列的因子VIII多肽。[0048]在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含与CS04-FL-AASEQIDNO:2具有至少99.9%同一性的氨基酸序列的因子VIII多肽。[0049]在上文所描述的多核苷酸的一个实施方案中,多核苷酸编码包含CS04-FL-AASEQIDN0:2的氨基酸序列的因子VIII多肽。[0050]在一个方面中,本公开提供一种包含与CS04-SC1-NASEQIDN0:9具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。[0051]在一个方面中,本公开提供一种包含与CS04-SC2-NASEQIDN0:11具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。[0052]在一个方面中,本公开提供一种包含与CS01-SC1-NASEQIDN0:26具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。[0053]在一个方面中,本公开提供一种包含与CS01-SC2-NASEQIDN0:27具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。[0054]在一个方面中,本公开提供一种包含与CS23-SC1-NASEQIDN0:28具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。[0055]在一个方面中,本公开提供一种包含与CS23-SC2-NASEQIDN0:29具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。[0056]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-SC1-NASEQIDN0:9、CS04-SC2-NASEQIDN0:11、CS01-SC1-NASEQIDN0:26、CS01-SC2-NASEQIDN0:27、CS23-SC1-NASEQIDN0:28或CS23-SC2-NASEQIDNO:29具有至少96%的同一性。[0057]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-SC1-NASEQIDN0:9、CS04-SC2-NASEQIDN0:11、CS01-SC1-NASEQIDN0:26、CS01-SC2-NASEQIDN0:27、CS23-SC1-NASEQIDN0:28或CS23-SC2-NASEQIDNO:29具有至少97%的同一性。[0058]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-SC1-NASEQIDN0:9、CS04-SC2-NASEQIDN0:11、CS01-SC1-NASEQIDN0:26、CS01-SC2-NASEQIDN0:27、CS23-SC1-NASEQIDN0:28或CS23-SC2-NASEQIDNO:29具有至少98%的同一性。[0059]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-SC1-NASEQIDN0:9、CS04-SC2-NASEQIDN0:11、CS01-SC1-NASEQIDN0:26、CS01-SC2-NASEQIDN0:27、CS23-SC1-NASEQIDN0:28或CS23-SC2-NASEQIDNO:29具有至少99%的同一性。[0060]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-SC1-NASEQIDN0:9、CS04-SC2-NASEQIDN0:11、CS01-SC1-NASEQIDN0:26、CS01-SC2-NASEQIDN0:27、CS23-SC1-NASEQIDN0:28或CS23-SC2-NASEQIDNO:29具有至少99.5%的同一性。[0061]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与相应全长多核苷酸序列(例如CS04-SC1-NASEQIDN0:9、CS04-SC2-NASEQIDN0:11、CS01-SC1-NASEQIDN0:26、CS01-SC2-NASEQIDN0:27、CS23-SC1-NASEQIDN0:28或CS23-SC2-NASEQIDNO:29具有至少99.9%的同一性。[0062]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS04-SC1-NASEQIDNO:9〇[0063]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS04-SC2-NASEQIDNO:11〇[0064]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS01-SC1-NASEQIDN0:26。[0065]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS01-SC2-NASEQIDN0:27。[0066]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS23-SC1-NASEQIDN0:28。[0067]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列为CS23-SC2-NASEQIDN0:29。[0068]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由以下各项组成的组的序列具有至少95%的同一性:CSOI-FL-NA、CSOI-HC-NA、CSOI-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01ml-FL-NA、CS01m2-FL-NA、CS01m3-FL-NA、CS01m4-FL-NA、CS01ml2-FL-NA、CS01ml3-FL-NA、CS01m23-FL-NA、CS01m24-FL-NA、CS01m34-FL-NA、CS01ml23-FL-NA、CS01m234-FL-NA、CS04ml-FL-NA、CS04m2-FL-NA、CS04m3-FL-NA、CS04m4-FL-NA、CS04ml2-FL-NA、CS04ml3-FL-NA、CS04m23-FL-NA、CS04m24-FL-NA、CS04m34-FL-NA、CS04ml23-FL-NA、CS04m234-FL-NA、CS23ml-FL-NA、CS23m2-FL-NA、CS23m3-FL-NA、CS23m4-FL-NA、CS23ml2-FL-NA、CS23ml3-FL-NA、CS23m23-FL-NA、CS23m24-FL-NA、CS23m34-FL-NA、CS23ml23-FL-NA、CS23m234-FL-NA、CS01-SCl-NA、CS04-SCl-NA、CS23-SCl-NA、CS01ml-SCl-NA、CS01m2-SCl-NA、CS01m3-SCl-NA、CS01m4-SQ-NA、CS01ml2-SQ-NA、CS01ml3-Sa-NA、CS01m23-Sa-NA、CS01m24-Sa-NA、CS01m34-Sa-NA、CS01ml23-SCl-NA、CS01m234-SCl-NA、CS04ml-SCl-NA、CS04m2-SCl-NA、CS04m3-SCl-NA、CS04m4-SCl-NA、CS04ml2-SCl-NA、CS04ml3-SCl-NA、CS04m23-SCl-NA、CS04m24-SCl-NA、CS04m34-SCl-NA、CS04ml23-SCl-NA、CS04m234-SCl-NA、CS23ml-SCl-NA、CS23m2-SCl-NA、CS23m3-SCl-NA、CS23m4-SCl-NA、CS23ml2-Sn-NA、CS23ml3-Sa-NA、CS23m23-Sa-NA、CS23m24-SCl-NA、CS23m34-SQ-NA、CS23ml23-SCl-NA、CS23m234-SCl-NA、CS01-SC2-NA、CS04-SC2-NA、CS23-SC2-NA、CS01ml-SC2-NA、CS01m2-SC2-NA、CS01m3-SC2-NA、CS01m4-SC2-NA、CS01ml2-SC2-NA、CS01ml3-SC2-NA、CS01m23-SC2-NA、CS01m24-SC2-NA、CS01m34-SC2-NA、CS01ml23-SC2-NA、CS01m234-SC2-NA、CS04ml-SC2-NA、CS04m2-SC2-NA、CS04m3-SC2-NA、CS04m4-SC2-NA、CS04ml2-SC2-NA、CS04ml3-SC2-NA、CS04m23-SC2-NA、CS04m24-SC2-NA、CS04m34-SC2-NA、CS04ml23-SC2-NA、CS04m234-SC2-NA、CS23ml-SC2-NA、CS23m2-SC2-NA、CS23m3-SC2-NA、CS23m4-SC2-NA、CS23ml2-SC2-NA、CS23ml3-SC2-NA、CS23m23-SC2-NA、CS23m24-SC2-NA、CS23m34-SC2-NA、CS23ml23-SC2-NA以及CS23m234-SC2-NA。[0069]在上文所描述的多核苷酸的一个实施方案中,核苷酸序列与选自由以下各项组成的组的序列具有至少96%的同一性厶細234至少99.5%同一的序列。[0111]在所描述的因子VIII多肽的一个实施方案中,因子VIII多肽的重链具有与相应重链序列(例如CSOl-HC-AAm23、CSOI-HC-AAml23或CSOI-HC-AAm234相同的序列,并且因子FVIII多肽的轻链具有与相应轻链序列(例如CS01-LC-AAm23、CS01-LC-AAml23或CSOl-LC-AAm234相同的序列。[0112]在上文所描述的因子VIII多肽的一个实施方案中,多肽接头与BDL-SQ-AASEQIDNO:30具有至少95%的同一性。[0113]在上文所描述的因子VIII多肽的一个实施方案中,多肽接头具有BDL-SQ-AASEQIDNO:30的氨基酸序列。[0114]在上文所描述的因子VIII多肽的一个实施方案中,多肽接头包括氨基酸序列与选自由以下各项组成的组的糖基化肽具有至少92%同一性的糖基化肽:如1^4、如4^4、如5-AA、NG6-AA、NG7-AA、NG9-AA、NGIO-AA、NG16-AA、NG17-AA、NG18-AA、NG19-AA、NG20-AA、NG2卜AA以及NGV-AA。[0115]在上文所描述的因子VIII多肽的一个实施方案中,多肽接头包括选自由以下各项组成的组的糖基化肽:NGI-AA、NG4-AA、NG5-AA、NG6-AA、NG7-AA、NG9-AA、NGIO-AA、NG16-AA、NG17-AA、NG18-AA、NG19-AA、NG20-AA、NG21-AA以及NGV-AA。[0116]在上文所描述的因子VIII多肽的一个实施方案中,多肽接头具有与选自由以下各项组成的组的序列具有至少95%同一性的氨基酸序列:BDLNG1-AA、BDLNG3-AA、BDLNG5-AA、BDLNG6-AA、BDLNG9-AA、BDLNGIO-AA、BDLNG16-AA、BDLNG17-AA、BDLNG18-AA、BDLNG19-AA、BDLNG20-AA以及BDLNG21-AA〇[0117]在上文所描述的因子VIII多肽的一个实施方案中,多肽接头具有选自由以下各项组成的组的氨基酸序列:BDLNG1-AA、BDLNG3-AA、BDLNG5-AA、BDLNG6-AA、BDLNG9-AA、BDLNGIO-NA、BDLNG16-AA、BDLNG17-AA、BDLNG18-AA、BDLNG19-AA、BDLNG20-AA以及BDLNG2卜AA0[0118]在另一方面中,本公开提供一种具有与CS40-FL-AAm23SEQIDN0:104具有至少95%同一性的氨基酸序列的因子VIII多肽。因子VIII多肽包括iI105V、A127S、G151K、M166T以及L171P氨基酸取代,ii氨基酸AIEPR755-759的缺失,相对于FVIII-FL-AASEQIDN0:19以及iiiN754后的氨基酸TTYVNRSLSEQIDN0:33的插入,相对于FVIII-FL-AASEQIDN0:19。[0119]在另一方面中,本公开提供一种具有与CS40-FL-AAml23具有至少95%同一性的氨基酸序列的因子VIII多肽。因子VIII多肽包括11105¥1273、61511、11661'以及1^171?氨基酸取代,ii氨基酸AIEPR755-759的缺失,相对于FVIII-FL-AASEQIDN0:19,iiiN754后的氨基酸TTYVNRSLSEQIDNO:33的插入,相对于FVIII-FL-AASEQIDNO:19以及ivF328S氨基酸取代。[0120]在另一方面中,本公开提供一种具有与CS40-FL-AAm234具有至少95%同一性的氨基酸序列的因子VIII多肽。因子VIII多肽包括11105¥1273、61511、11661'以及1^171?氨基酸取代,ii氨基酸AIEPR755-759的缺失,相对于FVIII-FL-AASEQIDN0:19,iiiN754后的氨基酸TTYVNRSLSEQIDNO:33的插入,相对于FVIII-FL-AASEQIDNO:19以及ivF328SC1918GC1922G氨基酸取代。[0121]在所描述的因子VIII多肽的一个实施方案中,因子VIII多肽具有与相应全长序列例如CS40-FL-AAm23SEQIDN0:104、CS40-FL-AAml23或CS40-FL-AAm234至少96%同一的序列。[0122]在所描述的因子VIII多肽的一个实施方案中,因子VIII多肽具有与相应全长序列例如CS40-FL-AAm23SEQIDN0:104、CS40-FL-AAml23或CS40-FL-AAm234至少97%同一的序列。[0123]在所描述的因子VIII多肽的一个实施方案中,因子VIII多肽具有与相应全长序列例如CS40-FL-AAm23SEQIDN0:104、CS40-FL-AAml23或CS40-FL-AAm234至少98%同一的序列。[0124]在所描述的因子VIII多肽的一个实施方案中,因子VIII多肽具有与相应全长序列例如CS40-FL-AAm23SEQIDN0:104、CS40-FL-AAml23或CS40-FL-AAm234至少99%同一的序列。[0125]在所描述的因子VIII多肽的一个实施方案中,因子VIII多肽具有与相应全长序列例如CS40-FL-AAm23SEQIDN0:104、CS40-FL-AAml23或CS40-FL-AAm234至少99.5%同一的序列。[0126]在所描述的因子VIII多肽的一个实施方案中,因子VIII多肽具有与相应全长序列例如CS40-FL-AAm23SEQIDN0:104、CS40-FL-AAml23或CS40-FL-AAm234相同的序列。附图说明[0127]图1示出了野生型和ReFacto型人因子VIII蛋白构建体的示意图。[0128]图2A和2B示出了根据一些实施方案编码因子VIII变体的CS04密码子改变的核苷酸序列(SEQIDN0:1对于全长编码序列为“CS04-FL-NA”)。[0129]图3示出了根据一些实施方案由CS04密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQIDN0:2对于全长氨基酸序列为“CS04-FL-AA”)。[0130]图4示出了根据一些实施方案编码因子VIII变体的重链的CS04密码子改变的核苷酸序列的一部分(SEQIDN0:3“CS04-HC-NA”)。[0131]图5示出了根据一些实施方案编码因子VIII变体的轻链的CS04密码子改变的核苷酸序列的一部分SEQIDN0:4“CS04-LC-NA”)。[0132]图6示出了根据一些实施方案的B-结构域取代的接头的示例性编码序列(按出现顺序分别为SEQIDN0S5-7和36-48。BDL001SEQIDN0:5、BDL004SEQIDN0:6以及BDL023SEQIDN0:7分别为CS0UCS04以及CS23密码子改变的核苷酸序列中编码B-结构域取代的接头的相应部分。[0133]图7A、7B以及7C示出了根据一些实施方案含有CS04密码子改变的核苷酸序列的AAV载体序列(SEQIDN0:8“CS04-AV-NA”)。[0134]图8A和8B示出了根据一些实施方案编码具有F328S氨基酸取代的因子VIII变体的CSOlml密码子改变的核苷酸序列(SEQIDN0:49“CS01ml-FL-NA”)。[0135]图9A和9B示出了根据一些实施方案编码单链因子VIII变体的CS04Δ760-1667SPI;CS04A741-1648,SPE密码子改变的核苷酸序列(SEQIDN0:9“CS04-SC1-NA”)。[0136]图10示出了根据一些实施方案由CSOlΔ760-1667SPI;CS01Δ741-1648,SPE、CS04Δ760-1667SPI;CS04Δ741-1648,SPE以及CS23Δ760-1667SPI;CS23Δ741-1648,SPE密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQIDNO:10分别为“CS01-SC1-AA”、“CS04-SC1-AA”以及“CS23-SC1-AA”)。[0137]图IlA和IlB示出了根据一些实施方案编码单链因子VIII变体的0304772_1667SPI;CS04A753-1648,SPE密码子改变的核苷酸序列(SEQIDNO:11“CS04-SC2-NA”)。[0138]图12示出了根据一些实施方案由CSOlΔ772-1667SPI;CS01Δ753-1648,SPE、CS04A772-1667SPI;CS04A753-1648,SPE以及CS23A772-1667SPI;CS23Δ753-1648,SPE密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQIDNO:12分别为“CS01-SC2-AA”、“CS04-SC2-AA”以及“CS23-SC2-AA”)。[0139]图13Α和13Β示出了根据一些实施方案插入B-结构域取代的接头中的示例性糖基化肽的氨基酸和核苷酸序列。“NG1”或NG1-AA”为氨基酸序列的密码,在上面一行中示出。“NG1-NA”为核酸序列的密码,在每一组的下面一行中示出。图13Α和13Β以SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75的形式公开氨基酸序列,并且按出现顺序全部分别以SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的形式公开核苷酸序列。[0140]图14示出了野生型因子VIIIB-结构域的体内N-糖基化的计算机模拟预测的结果。该图按出现顺序分别公开了SEQIDNO76和76-82。[0M1]图15示出了V3肽接头的体内N-糖基化的计算机模拟预测的结果。该图按出现顺序分别公开了SEQIDNO83和83-89。[0142]图16A和16B示出了根据一些实施方案编码因子VIII变体的CSOl密码子改变的核苷酸序列(SEQIDN0:13“CS01-FL-NA”)。[0143]图17A和17B示出了根据一些实施方案编码因子VIII变体的CS08密码子改变的核苷酸序列(SEQIDN0:14“CS08-FL-NA”)。[0144]图18A和18B示出了根据一些实施方案编码因子VIII变体的CSlO密码子改变的核苷酸序列(SEQIDN0:15“CS10-FL-NA”)。[0145]图19A和19B示出了根据一些实施方案编码因子VIII变体的CSll密码子改变的核苷酸序列(SEQIDN0:16“CS11-FL-NA”)。[0146]图20A和20B示出了根据一些实施方案的CS40野生型ReFacto编码序列(SEQIDN0:17“CS40-FL-NA”)。[0147]图21A和21B示出了根据一些实施方案编码因子VIII变体的CH25密码子改变的核苷酸序列(SEQIDN0:18“CH25-FL-NA”)。[0148]图22示出了根据一些实施方案的野生型人因子VIII氨基酸序列(SEQIDNO:19“FVIII-FL-AA”)。[0149]图23说明了克隆口054040501、口050440508、口051040511以及口〇125构建体的方案,所述方案是通过将合成的Refacto型BDD-FVIIIDNA序列经由AscI和NotI限制位点插入载体骨架pCh-BBO1中来进行。[0150]图24示出了如通过琼脂糖凝胶电泳所分析的AAV载体基因组制剂的完整性。泳道I,DNA标记物;泳道2,vCS40;泳道3,vCSOl;泳道4,vCS04。AAV载体全部具有相同尺寸的基因组,以约5kb进行迀移箭头,右侧)。左侧的刻度指示DNA片段的大小千碱基,kb。[0151]图25示出了通过PAGE和银染色对AAV载体制剂进行的蛋白质分析。泳道1,蛋白质标记物⑽;泳道2,vCS40,泳道3,vCSOl;以及泳道4,vCS04。构建体全部具有相同的由VPl、VP2以及VP3右侧的箭头组成的AAV8衣壳。左侧的刻度指示蛋白质标记物的大小千道尔顿,kDa。[0152]图26A和26B示出了根据一些实施方案编码因子VIII变体的CS23密码子改变的核苷酸序列(SEQIDN0:20“CS23-FL-NA”)。[0153]图27示出了根据一些实施方案由CS23密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQIDN0:21“CS23-FL-AA”)。[0154]图28示出了根据一些实施方案编码因子VIII变体的重链的CS23密码子改变的核苷酸序列的一部分SEQIDN0:22“CS23-HC-NA”)。[0155]图29示出了根据一些实施方案编码因子VIII变体的轻链的CS23密码子改变的核苷酸序列的一部分SEQIDN0:23“CS23-LC-NA”)。[0156]图30A和30B示出了根据一些实施方案编码具有mlF328S和m3氨基酸取代的因子VIII变体的CS01ml3密码子改变的核苷酸序列(SEQIDN0:90“CS01-FL-NA-ml3”)。[0157]图31A和31B示出了根据一些实施方案编码具有m2和m3突变集合的因子VIII变体的CS01m23密码子改变的核苷酸序列(SEQIDN0:91“CS01-FL-NA-m23”)。[0158]图32A和32B示出了根据一些实施方案编码具有m3氨基酸取代的因子VIII变体的CS01m3密码子改变的核苷酸序列(SEQIDN0:92“CS01-FL-NA-m3”)。[0159]图33A和33B示出了根据一些实施方案编码具有m2突变集合I105VA127SG151KM166TL171PSPI氨基酸取代的因子VIII变体的CS01m2密码子改变的核苷酸序列(SEQIDN0:93“CS01-FL-NA-m2”)。[0160]图34A和34B示出了根据一些实施方案编码具有m2突变体(I105VA127SG151KM166TL171PSPI氨基酸取代的因子VIII变体的CS04m2密码子改变的核苷酸序列(SEQIDN0:94“CS01-FL-NA-m2”)。[0161]图35A和35B示出了根据一些实施方案编码具有m3氨基酸取代的因子VIII变体的CS04m3密码子改变的核苷酸序列(SEQIDN0:95“CS04-FL-NA-m3”)。[0162]图36A和36B示出了根据一些实施方案编码具有m2突变体集合(I105VA127SG151KM166TL171PSPI和m3氨基酸取代的因子¥111变体的050411123密码子改变的核苷酸序列(SEQIDN0:96“CS04-FL-NA-m23”)。[0163]图37六和378示出了根据一些实施方案编码具有1111史3285氨基酸取代的因子¥111变体的CS04ml密码子改变的核苷酸序列(SEQIDN0:97“CS04-FL-NA-ml”)。[0164]图38A和38B示出了根据一些实施方案编码具有ml和m3氨基酸取代的因子VIII变体的CS04ml3密码子改变的核苷酸序列(SEQIDN0:98“CS04-FL-NA-ml3”)。[0165]图39A和39B示出了根据一些实施方案编码具有ml和m3氨基酸取代的因子VIII变体的CS23ml3密码子改变的核苷酸序列(SEQIDN0:99“CS23ml3-FL-NA”)。[0166]图40A和40B示出了根据一些实施方案编码具有m3氨基酸取代的因子VIII变体的CS23m3密码子改变的核苷酸序列(SEQIDN0:100“CS23-FL-NA-m3”)。[0167]图41A和41B示出了根据一些实施方案编码具有m2突变体集合(I105VA127SG151KM166TL171P氨基酸取代)的因子VIII变体的CS23m2密码子改变的核苷酸序列(SEQIDN0:101“CS23-FL-NA-m2”)。[0168]图42六和428示出了根据一些实施方案编码具有1111史3285氨基酸取代的因子¥111变体的CS23ml密码子改变的核苷酸序列(SEQIDN0:102“CS23-FL-NA-ml”)。[0169]图43A和43B示出了根据一些实施方案编码具有m2突变体集合(I105VA127SG151KM166TL171P和m3氨基酸取代的因子VIII变体的CS23m23密码子改变的核苷酸序列SEQIDN0:103“CS23-FL-NA-m23”)。[0170]图44展示了pCS构建体的克隆,这是通过将携带不同突变参见插入的表格)的合成的Refacto型BDD-FVIII经由AscI和NotI限制位点插入载体骨架pCh-BBOl中来实现。[0171]图45展示了通过PAGE和银染色对AAV载体制剂进行的蛋白质分析。泳道1,蛋白质标记物⑽;泳道2,vCSO1,泳道3,vCSl7;泳道4,vCSl9;泳道5,vCS20;泳道6,vCS40;泳道7,vCS04;泳道8,vCS17;泳道9,vCS24构建体。构建体全部具有由VPl、VP2以及VP3右侧的箭头组成的相同AAV8衣壳。左侧的刻度指示蛋白质标记物的大小千道尔顿,kDa。[0172]图46展示了通过琼脂糖凝胶电泳分析的AAV载体基因组制剂的完整性。泳道1,DNA标记物⑽;泳道2,vCS04,泳道3,vCS17;泳道4,vCS20;泳道5,vCS24;泳道6,vCS16;泳道7,vCS40构建体。载体负荷为每一泳道1.5El〇Vg3AAV载体具有相同尺寸的基因组,以约5kb进行迀移箭头,右侧)。左侧的刻度指示DNA片段的大小千碱基,kb。[0173]图47示出了根据一些实施方案编码因子VIII变体的重链的CSOl密码子改变的核苷酸序列的一部分(SEQIDN0:24“CS01-HC-NA”)。[0174]图48示出了根据一些实施方案编码因子VIII变体的轻链的CSOl密码子改变的核苷酸序列的一部分SEQIDN0:25“CS01-LC-NA”)。[OW5]图49A和49B示出了根据一些实施方案编码单链因子VIII变体的0301760_1667SPI;CS01A741-1648,SPE密码子改变的核苷酸序列(SEQIDN0:26“CS01-SC1-NA”)。[0176]图50A和50B示出了根据一些实施方案编码单链因子VIII变体的0301八(772_1667SPI;CSOlA753-1648,SPE密码子改变的核苷酸序列(SEQIDNO:27“CS01-SC2-NA”)。[0177]图51A和51B示出了根据一些实施方案编码单链因子VIII变体的0323760_1667SPI;CS23A741-1648,SPE密码子改变的核苷酸序列(SEQIDN0:28“CS23-SC1-NA”)。[0178]图52A和52B示出了根据一些实施方案编码单链因子VIII变体的0323772_1667SPI;CS23A753-1648,SPE密码子改变的核苷酸序列(SEQIDN0:29“CS23-SC2-NA”)。[0179]图53示出了根据一些实施方案由CS01m23密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQIDN0:104“CS01m23-FL-AA”)。[0180]图54示出了根据一些实施方案由CS04m3密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQIDN0:105“CS01m23-FL-AA”)。[0181]图55示出了根据一些实施方案由CS01ml2密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQIDN0:106“CS01ml2-FL-AA”)。[0182]图56示出了根据一些实施方案由CS04ml2密码子改变的核苷酸序列编码的因子VIII变体氨基酸序列(SEQIDN0:107“CS04ml2-FL-AA”)。[0183]图57A和57B示出了根据一些实施方案编码具有mlF328S和m2氨基酸取代的因子VIII变体的CS01ml2密码子改变的核苷酸序列(SEQIDN0:108“CS01-FL-NAml2”)。[0184]图58A和58B示出了根据一些实施方案编码具有mlF328S和m2氨基酸取代的因子VIII变体的CS04ml2密码子改变的核苷酸序列(SEQIDN0:109“CS04-FL-NAml2”)。具体实施方式[0185]I.引言[0186]基于AAV的基因疗法为血友病患者的治疗带来极大的希望。对于血友病B,最早的临床数据是令人鼓舞的,因为至少在有些患者中FIX水平可在约10%保持1年以上。然而,对于血友病A,由于各种原因,用AAV载体实现5-10%的治疗剂表达水平仍然是具有挑战性的。第一,因子VIII编码序列对于常规的基于AAV的载体来说太大。第二,工程化的B-结构域缺失或截短的因子VIII构建体在体内具有不良表达,即使在密码子优化时也是如此。第三,这些B-结构域缺失或截短的因子VIII变体构建体在体内的半衰期短,从而加剧了不良表达的效果。第四,如同诸如因子IX等其他凝血因子,即使在表达时,FVIII也不能高效地从细胞分泌。[0187]此外,这些挑战不能通过简单地施用更高剂量的基因疗法构建体来解决。根据目前的知识,基于AAV的基因疗法载体的载体剂量应增加到超过每千克体重2xl012vg。这是因为在如此高的剂量下,T细胞免疫应答被触发,从而破坏转导的细胞,并且因此降低或甚至消除转基因表达。因此,需要改善FVIII表达的策略以使FVIII基因疗法成为血友病A患者的可行治疗选择。[0188]本公开涉及发生解决与因子VIII基因疗法相关的这些和其他问题的密码子改变的因子VIII变体编码序列。举例来说,本文所公开的多核苷酸在哺乳动物细胞中提供显著改善的表达,并且因稳定的堆积相互作用而展示改善的病毒体包装。在一些实施方案中,通过使用与密码子改变的CS01、CS04以及CS23构建体具有高序列同一性(例如与CS01-HC、CS04-HC以及CS23-HC重链编码序列中的一种具有高序列同一性并且与CS01-LC、CS04-LC以及CS23-LC轻链编码序列中的一种具有高序列同一性)的因子VIII的重链和轻链的编码序列实现了这些优点。[0189]在一些实施方案中,已通过使野生型B结构域截短、缺失或替换来缩短由本文所描述的多核苷酸编码的因子VIII分子。因此,所述多核苷酸更适合于经由常规基因疗法载体表达因子VIII,所述常规基因疗法载体表达诸如野生型因子VIII等较大多肽的效率低。[0190]有利地,本文显示CSOl、CS04以及CS23密码子改变的因子VIII变体编码序列在体内提供B-结构域缺失的因子VIII构建体的优良表达。举例来说,在实施例2和实施例4中证实在因子VIII敲除小鼠中,静脉内施用具有CS01SEQIDN0:13、CS04SEQIDN0:1以及CS23SEQIDNO:20编码序列的基于AAV的基因疗法载体使得因子VIII表达相对于用野生型多核苷酸序列(SEQIDNO:17编码的相应CS40构建体增加18倍、74倍以及30倍表4和表7。[0191]此外,本文还显示CSOl和CS04密码子改变的因子VIII变体编码序列提供优良的病毒体包装和病毒产量。举例来说,实施例1中证实当从相同量的细胞沉淀分离时,含有CSOl和CS04构建体的AAV载体构建体提供相对于用野生型多核苷酸序列编码的相应CS40构建体高5和7倍的病毒产量。[0192]有利地,申请人还发现,可通过向基础因子VIII多肽序列中引入突变而使由CS01、CS04以及CS23密码子改变的序列产生的改善的因子VIII活性进一步增强。举例来说,如实施例4中证实,单独的和相互组合的F328S、X5以及Xl突变当在体内在CSOl或CS04密码子改变的背景中表达时使FVIII活性相对于野生型密码子改变的构建体进一步增加2至7倍表7。更显著的是,编码突变体因子VIII突变体的这些密码子改变的序列与用野生型多核苷酸序列编码的相应CS40构建体相比提供高达246倍的增加表7。[0193]II.定义[0194]除非另外指明,否则如本文所用,以下术语具有属于它们的含义。[0195]如本文所用,术语“因子VIII”和“FVIII”可互换使用,并且指具有因子VIII活性的任何蛋白质例如活性FVIII,通常称为FVIIIa或具有因子VIII活性,特别是因子IXa辅因子活性的蛋白质的蛋白质前体例如前蛋白或前蛋白原)。在一个示例性实施方案中,因子VIII多肽是指具有与野生型因子VIII多肽的重链和轻链具有高序列同一性(例如至少70%、75%、80%、85%、90%、95%、99%或更高)的序列的多肽。在一些实施方案中,因子VIII多肽的B-结构域为缺失的、截短的或用接头多肽替换以减小编码因子VIII多肽的多核苷酸的尺寸。在一个示例性实施方案中,SEQIDNO:2的氨基酸20-1457构成因子VIII多肽。[0196]野生型因子VIII多肽的非限制性实例包括人前因子VIII原(例如GenBank登录号AAA52485、CAA25619、AAA58466、AAA52484、AAA52420、AAV85964、BAF82636、BAG36452、CAI41660、CAI41666、CAI41672、CAI43241、CA003404、EAW72645、AAH22513、AAH64380、八八!198389、44111968、44111970或44861261、相应前因子¥111以及其天然变体;猪前因子VIII原例如UniProt登录号F1RZ36或K7GSZ5、相应前因子VIII以及其天然变体;小鼠前因子VIII原(例如GenBank登录号AAA37385、CAM15581、CAM26492或EDL29229、相应前因子VIII以及其天然变体;大鼠前因子VIII原例如GenBank登录号AAQ21580、相应前因子VIII以及其天然变体;大鼠前因子VIII原;以及其他哺乳动物因子VIII同源物(例如猴、猿、仓鼠、豚鼠等)。[0197]如本文所用,因子VIII多肽包括具有因子IX辅因子活性的天然变体和人工构建体。如本公开中所用,因子VIII涵盖保留一定的基础因子IX辅因子活性例如相应野生型活性的至少5%、10%、25%、50%、75%或更多)的任何天然变体、替代序列、同种型或突变体蛋白。存在于人类群体中的因子VIII氨基酸变异(相对于FVIII-FL-AASEQIDNO:19的实例包括但不限于S19R、R22T、Y24C、Y25C、L26PR、E30V、W33G、Y35CH、G41C、R48CK、K67EN、L69P、E72K、D75EVY、P83R、G89DV、G92AV、A97P、E98K、V99D、D101GHV、V104D、K108T、M110V、A111TV、H113RY、L117FR、G121S、E129V、G130R、E132D、Y133C、D135GY、T137AI、S138R、E141K、D145H、V147D、Y155H、V159A、N163K、G164DV、P165S、C172W、S176P、S179P、V181EM、K185T、D186GNY、S189L、L191F、G193R、L195P、C198G、S202NR、F214V、L217H、A219DT、V220G、D222V、E223K、G224W、T252I、V253F、N254I、G255V、L261P、P262L、G263S、G266F、C267Y、W274C、H275L、G278R、G280D、E284K、V285G、E291GK、T294I、F295L、V297A、N299I、R301CHL、A303EP、I307S、S308L、F312S、T314AI、A315V、G323E、L326P、L327PV、C329F、I331V、M339T、E340K、V345AL、C348RSY、Y365C、R391CHP、S392LP、A394S、W401G、I405FS、E409G、W412GR、K427I、L431FS、R437PW、I438F、G439DSV、Y442C、K444R、Y450DN、T454I、F455C、G466E、P470LRT、G474ERV、E475K、G477V、D478N、T479R、F484C、A488G、R490G、Y492CH、Y492H、I494T、P496R、G498R、R503H、G513SV、I522Y、K529E、W532G、P540T、T541S、D544N、R546W、R550CGH、S553P、S554CG、V556D、R560T、D561GHY、I567T、P569R、S577F、V578A、D579AH、N583S、Q584HKR、I585RT、M586V、D588GY、L594Q、S596P、N601DK、R602G、S603IR、W604C、Y605HS、N609I、R612C、N631KS、M633I、S635N、N637DIS、Y639C、L644V、L650F、V653AM、L659P、A663V、Q664P、F677L、M681I、V682F、Y683CN、T686R、F698L、M699TV、M701I、G705V、G710W、N713I、R717LW、G720DS、M721IL、A723T、L725Q、V727F、E739K、Y742C、R795G、P947R、V1012L、E1057K、H1066Y、D1260E、K1289Q、Q1336K、N1460K、L1481P、A1610S、I1698T、Y1699CF、E1701K、Q1705H、R1708CH、T1714S、R1715G、A1720V、E1723K、D1727V、Y1728C、R1740G、K1751Q、F1762L、R1768H、G1769R、L1771P、L1775FV、L1777P、G1779ER、P1780L、I1782R、D1788H、M1791T、A1798P、S1799H、R1800CGH、P1801A、Y1802C、S1803Y、F1804S、L1808F、M1842I、P1844S、T1845P、E1848G、A1853TV、S1858C、K1864E、D1865NY、H1867PR、G1869DV、G1872E、P1873R、L1875P、V1876L、C1877RY、L1882P、R1888I、E1894G、I1901F、E1904DK、S1907CR、W1908L、Y1909C、A1939TV、N1941DS、G1942A、M1945V、L1951F、R1960LQ、L1963P、S1965I、M1966IV、G1967D、S1968R、N1971T、H1973L、G1979V、H1980PY、F1982I、R1985Q、L1994P、Y1998C、G2000A、T2004R、M2007I、G2013R、W2015C、R2016PW、E2018G、G2022D、G2028R、S2030N、V2035A、Y2036C、N2038S、2040Y、G2045EV、I2051S、I2056N、A2058P、W2065R、P2067L、A2070V、S2082N、S2088F、D2093GY、H2101D、T2105N、Q2106EPR、G2107S、R2109C、I2117FS、Q2119R、F2120CL、Y2124C、R2135P、S2138Y、T2141N、M2143V、F2145C、N2148S、N2157D、P2162L、R2169CH、P2172LQR、T2173AI、H2174D、R2178CHL、R2182CHP、M2183RV、L2185SW、S2192I、C2193G、P2196R、G2198V、E2200D、I2204T、I2209N、A2211P、A2220P、P2224L、R2228GLPQ、L2229F、V2242M、W2248CS、V2251AE、M2257V、T2264A、Q2265R、F2279CI、I2281T、D2286G、W2290L、G2304V、D2307A、P2319LS、R2323CGHL、R2326GLPQ、Q2330P、W2332R、I2336F、R2339T、G2344CDS以及C2345SY。因子VIII蛋白还包括含有翻译后修饰的多肽。[0198]通常,编码因子VIII的多核苷酸编码非活性单链多肽例如前蛋白原),所述非活性单链多肽经历翻译后加工以形成活性因子VIII蛋白(例如FVIIIa。举例来说,参考图1,首先使野生型人因子VIII前蛋白原裂解以释放编码的信号肽未显示),从而形成第一单链前蛋白(显示为“人野生型FVIII。然后,使前蛋白在B结构域与A3结构域之间裂解以形成包括因子VIII重链例如Al结构域和A2结构域和B-结构域的第一多肽,以及包括因子VIII轻链例如包括A3、C1以及C3结构域的第二多肽。使第一多肽进一步裂解以去除B-结构域,并且还分离Al结构域和A2结构域,所述Al结构域和A2结构域在成熟因子VIIIa蛋白中保持与缔合因子VIII轻链。关于因子VIII成熟过程的综述,参见Graw等,NatRevGenet.,66:488-5012005,该文献的内容出于所有目的以全文引用的方式并入本文中。[0199]然而,在一些实施方案中,因子VIII多肽为单链因子VIII多肽。对单链因子VIII多肽进行工程化以去除天然裂解位点,并且任选去除、截短或替换因子VIII的B-结构域。因此,它们不会因裂解而成熟(除了任选的信号和或前导肽的裂解),并且作为单链具有活性。Zollner等(ThrombRes,1341:125-312014和Donath等(BiochemJ.,312I:49_551995中描述了单链因子VIII多肽的非限制性实例,这些文献的公开内容在此出于所有目的以全文引用的方式并入本文中。[0200]如本文所用,术语“因子VIII重链”或简单地“重链”是指因子VIII多肽的Al和A2结构域的聚集体。在一个示例性实施方案中,CS04-FL-AASEQIDN0:2的氨基酸20-759构成因子VIII重链。[0201]如本文所用,术语“因子VIII轻链”或简单地“轻链”是指因子VIII多肽的A3、Cl以及C2结构域的聚集体。在一个示例性实施方案中,CS04-FL-AASEQIDN0:2的氨基酸774-1457构成因子VIII轻链。在一些实施方案中,因子VIII轻链排除在体内成熟期间释放的酸性a3肽。[0202]通常,因子VIII重链和轻链例如与任选的B-结构域或B-结构域取代的接头一起表达为单一多肽链。然而,在一些实施方案中,因子VIII重链和因子VIII轻链表达为单独的多肽链例如共表达),并且重构以形成因子VIII蛋白(例如体内或体外)。[0203]如本文所用,术语“B-结构域取代的接头”和“因子VIII接头”可互换使用,并且指野生型因子VIIIB-结构域的截短型式例如FVIII-FL-AASEQIDNO:19的氨基酸760-1667或经过工程化以替换因子VIII多肽的B-结构域的肽。如本文所用,根据一些实施方案,在因子VIII变体多肽中,因子VIII接头是定位于因子VIII重链的C端与因子VIII轻链的N端之间。美国专利号4,868,112、5,112,950、5,171,844、5,543,502、5,595,886、5,610,278、5,789,203、5,972,885、6,048,720、6,060,447、6,114,148、6,228,620、6,316,226、6,346,513、6,458,563、6,924,365、7,041,635以及7,943,374;美国专利申请公布号2013024960、20150071883以及20150158930;以及PCT公布号WO2014064277和WO2014127215中公开了B-结构域取代的接头的非限制性实例,这些专利的公开内容在此出于所有目的以全文引用的方式并入本文中。[0204]除非本文另外指明,否则因子VIII氨基酸的编号是指在图22中以SEQIDNO:19形式呈现的全长野生型人因子VIII序列FVIII-FL-AA中的相应氨基酸。因此,当提到本文所公开的因子VIII变体蛋白中的氨基酸取代时,所叙述的氨基酸编号是指在全长野生型因子VIII序列中类似的(例如结构上或功能上等同的)和或同源的(例如在一级氨基酸序列中进化保守的)氨基酸。举例来说,T2105N氨基酸取代是指全长野生型人因子VIII序列FVIII-FL-AA;SEQIDN0:19的位置2105的T到N的取代、由CS04编码的因子VIII变体蛋白CS04-FL-AA;SEQIDN0:2的位置1211的T到N的取代以及由CS04m3编码的因子VIII变体CS04m3-FL-AA;SEQIDN0:105的位置1212的T到N的取代。[0205]如本文所描述,因子VIII氨基酸编号系统是取决于是否包括因子VIII信号肽例如全长野生型人因子VIII序列的氨基酸1-19。在包括信号肽的情况下,编号被称为“信号肽包括性的”或“SPI”。在不包括信号肽的情况下,编号被称为“信号肽排除性的”或“SPE”。举例来说,F328S为与SPE编号中的F309S相同的氨基酸的SPI编号。除非本文另外陈述,否则所有氨基酸编号是指在图22中以SEQIDNO:19形式呈现的全长野生型人因子VIII序列FVIII-FL-AA中的相应氨基酸。[0206]如本文所描述,与由天然编码的因子VIII构建体例如使用野生型人密码子编码相同因子VIII构建体的多核苷酸提供的因子VIII表达水平相比,密码子改变的多核苷酸在体内(例如当作为基因疗法载体的一部分施用时提供增加的转基因因子VIII表达。如本文所用,术语“增加的表达”是指与施用天然编码的因子VIII构建体的动物的血液中的转基因因子VIII活性水平相比,施用编码因子VIII的密码子改变的多核苷酸的动物的血液中的转基因因子VIII活性水平增加。可使用本领域中已知的任何因子VIII活性来测量活性水平。用于测定因子VIII活性的示例性分析为TechnochromeFVIII分析(Technoclone,Vienna,Austria〇[0207]在一些实施方案中,增加的表达是指与施用天然编码的因子VIII多核苷酸的动物的血液中的转基因因子VIII活性水平相比,施用密码子改变的因子VIII多核苷酸的动物的血液中的转基因因子VIII活性高至少25%。在一些实施方案中,增加的表达是指与施用天然编码的因子VIII多核苷酸的动物的血液中的转基因因子VIII活性水平相比,施用密码子改变的因子VIII多核苷酸的动物的血液中的转基因因子VIII活性高至少50%、高至少75%、高至少100%、高至少3倍、高至少4倍、高至少5倍、高至少6倍、高至少7倍、高至少8倍、高至少9倍、高至少10倍、高至少15倍、高至少20倍、高至少25倍、高至少30倍、高至少40倍、高至少50倍、高至少60倍、高至少70倍、高至少80倍、高至少90倍、高至少100倍、高至少125倍、高至少150倍、高至少175倍、高至少200倍、高至少225倍或高至少250倍。[0208]如本文所描述,与由天然编码的因子VIII构建体例如使用野生型人密码子编码相同因子VIII构建体的多核苷酸提供的载体产量水平相比,密码子改变的多核苷酸提供增加的载体产量。如本文所用,术语“增加的病毒产量”是指与接种了天然编码的因子VIII构建体的细胞培养物中的载体产量例如每升培养物的效价相比,接种了编码因子VIII的密码子改变的多核苷酸的细胞培养物中的载体产量增加。可使用本领域中已知的任何载体效价分析来测量载体产量。用于测定载体例如AAV载体产量的示例性分析为祀向AAV2反向末端重复序列的qPCRAurnhammer,HumanGeneTherapyMethods:B部分23:18-282012〇[0209]在一些实施方案中,增加的病毒产量是指与相同类型培养物中的天然编码的因子VIII构建体的产量相比,密码子改变的载体产量高至少25%。在一些实施方案中,增加的载体产量是指与相同类型培养物中的天然编码的因子VIII构建体的产量相比,密码子改变的载体产量高至少50%、高至少75%、高至少100%、高至少3倍、高至少4倍、高至少5倍、高至少6倍、高至少7倍、高至少8倍、高至少9倍、高至少10倍、高至少15倍或高至少20倍。[0210]如本文所用,术语“血友病”是指普遍特征为血液凝结或凝固减少的一组疾病状态。血友病可指A型、B型或C型血友病,或指所有三种疾病类型的复合疾病。A型血友病血友病A是由因子VIIIFVIII活性降低或丧失造成的,并且在血友病亚型中为最突出的。B型血友病血友病B是由因子IXFIX凝结功能丧失或降低引起。C型血友病血友病C是因子XIFXI凝结活性丧失或降低的结果。血友病A和B为X连锁疾病,而血友病C是常染色体病。血友病的常规治疗包括预防性施用和按需施用凝结因子(诸如FVIII、FIX,包括BebulintD-VH和FXI以及ΪΈΙΒΑ-VH、去氨加压素以及血浆输注。[0211]如本文所用,术语“FVIII基因疗法”包括向患者提供编码因子VIII的核酸以缓解、减少或预防与血友病相关的一种或多种症状例如临床因素)的再次发生的任何治疗方法。该术语涵盖施用包含编码因子VIII分子,包括任何修饰形式的因子VIII例如因子VIII变体)的核酸的任何化合物、药物、程序或方案以维持或改善患有血友病个体的健康。本领域技术人员将了解,可例如基于根据本公开所获得的结果改变FVIII疗法的过程或FVIII治疗剂的剂量。[0212]如本文所用,术语“旁路疗法”包括向患者提供非因子VIII止血剂、化合物或凝血因子以缓解、减少或预防与血友病相关的一种或多种症状例如临床因素)的再次发生的任何治疗方法。非因子VIII化合物和凝血因子包括但不限于因子VIII抑制剂旁路活性FEIBA、重组活化因子VIIFVIIa、凝血酶原复合物浓缩物以及活化的凝血酶原复合物浓缩物。这些非因子VIII化合物和凝血因子可为重组的或血浆衍生的。本领域技术人员将了解,可例如基于根据本公开所获得的结果改变旁路疗法的过程或旁路疗法的剂量。[0213]如本文所用,包括施用编码因子VIII分子的核酸和常规血友病A治疗剂的“组合疗法”包括向患者提供编码因子VIII分子的核酸与因子VIII分子和或非因子VIII止血剂例如旁路治疗剂)以缓解、减少或预防与血友病相关的一种或多种症状例如临床因素)的再次发生的任何治疗方法。该术语涵盖施用包括编码因子VIII分子,包括任何修饰形式的因子VIII例如因子VIII变体)的核酸的适用于维持或改善患有血友病个体的健康并且包括任何本文所描述的治疗剂的任何化合物、药物、程序或方案。[0214]术语“治疗有效量或剂量”或“治疗充足量或剂量”或“有效或充足量或剂量”是指产生施用它要达到的治疗效果的剂量。举例来说,适用于治疗血友病的药物的治疗有效量可为能够预防或缓解与血友病相关的一种或多种症状的量。确切的剂量将取决于治疗目的,并且将为本领域技术人员使用已知技术可确定的(参见例如Lieberman,PharmaceuticalDosageForms第1-3卷,1992;Lloyd,TheArt,ScienceandTechnologyofPharmaceuticalCompounding1999;Pickar,DosageCalculations1999;以及Remington:TheScienceandPracticeofPharmacy,第20版,2003,Gennaro编,Lippincott,WilliamsWilkins〇[0215]如本文所用,术语“基因”是指编码多肽链的DNA分子片段例如编码区)。在一些实施方案中,基因是按照紧接在产生多肽链时所涉及的编码区之前、之后和或插入其中的区域进行定位例如调控元件,诸如启动子、增强子、聚腺苷酸化序列、5’-非翻译区、3’-非翻译区或内含子)。[0216]如本文所用,术语“调控元件”是指在细胞中提供编码序列的表达的核苷酸序列,诸如启动子、增强子、终止子、聚腺苷酸化序列、内含子等。[0217]如本文所用,术语“启动子元件”是指帮助控制编码序列的表达的核苷酸序列。通常,将启动子元件定位于基因的翻译起始位点的5’。然而,在某些实施方案中,可将启动子元件定位于内含子序列内或编码序列的3’。在一些实施方案中,适用于基因疗法载体的启动子是来源于靶蛋白的天然基因(例如因子VIII启动子)。在一些实施方案中,适用于基因疗法载体的启动子关于在目标有机体的特定细胞或组织中的表达具特异性例如肝特异性启动子)。在其他实施方案中,将多种充分表征的启动子元件中的一种用于本文所描述的基因疗法载体中。充分表征的启动子元件的非限制性实例包括CMV早期启动子、β-肌动蛋白启动子以及甲基CpG结合蛋白2MeCP2启动子。在一些实施方案中,启动子为组成型启动子,驱动革G蛋白的基本上恒定的表达。在其他实施方案中,启动子为诱导型启动子,响应于特定刺激例如暴露于特定治疗或药剂而驱动靶蛋白的表达。关于设计用于AAV介导的基因疗法的启动子的综述,参见Gray等HumanGeneTherapy22:1143-532011,该文献的内容出于所有目的以全文引用的方式明确并入本文中。[0218]如本文所用,术语“载体”是指用于将核酸例如编码因子VIII基因疗法构建体的核酸转移到宿主细胞中的任何媒介物。在一些实施方案中,载体包括用于复制媒介物以及靶核酸的复制子。适用于基因疗法的载体的非限制性实例包括在体内用作自主复制单元的质粒、噬菌体、粘粒、人工染色体以及病毒。在一些实施方案中,载体为用于引入靶核酸例如编码因子VIII变体的密码子改变的多核苷酸)的病毒媒介物。适用于基因疗法的许多修饰的真核病毒为本领域中已知的。举例来说,腺相关病毒AAV特别适合用于人类基因疗法,因为人是病毒的天然宿主,已知天然病毒不会导致任何疾病,并且这些病毒引起轻度免疫应答。[0219]如本文所用,术语“CpG岛”是指多核苷酸内具有统计学上升高的CpG二核苷酸密度的区域。如本文所用,如果在200-碱基对窗口中:(i多核苷酸例如编码密码子改变的因子VIII蛋白的多核苷酸)的区域的GC含量高于50%,并且ii如通过以下关系所定义,每单位预期CpG二核苷酸观测到的CpS二核苷酸的比率至少为0.6:[0220],那么该区域为CpG岛。[0221]关于鉴定CpG岛的方法的额外信息,参见Gardiner-GardenM.等,JMolBiol.,1962:261-821987,该文献的内容出于所有目的以全文引用的方式明确并入本文中。[0222]如本文所用,术语“核酸”是指呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸和其聚合物以及其互补物。该术语涵盖含有已知核苷酸类似物或修饰的主链残基或键联的核酸,所述核酸为合成的、天然存在的以及非天然存在的,具有与参考核酸相似的结合特性,并且以与参考核酸相似的方式进行代谢。此类类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性-甲基膦酸酯、2-0-甲基核糖核苷酸以及肽-核酸PNA。[0223]术语“氨基酸”是指天然存在和非天然存在的氨基酸,包括以与天然存在的氨基酸相似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸包括由遗传密码编码的那些氨基酸以及后来被修饰的那些氨基酸,例如羟脯氨酸、y-羧基谷氨酸以及0-磷酸丝氨酸。天然存在的氨基酸可包括例如D-氨基酸和L-氨基酸。本文中所用的氨基酸还可包括非天然氨基酸。氨基酸类似物是指与天然存在的氨基酸具有相同的基本化学结构的化合物,所述基本化学结构为结合至氢、羧基、氨基和R基团(例如高丝氨酸、正亮氨酸、蛋氨酸亚砜或蛋氨酸甲基锍的任何碳。此类类似物具有修饰的R基团(例如正亮氨酸或修饰的肽主链,但保留了与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构,但以与天然存在的氨基酸相似的方式起作用的化合物。在本文中可通过通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号来提到氨基酸。同样地,可通过普遍接受的单字母代码来提到核苷酸。[0224]编码本文中的突变体因子VIII构建体的核苷酸序列可与本文中提供的编码序列相同或可为不同的编码序列,其序列因遗传密码的冗余性或简并性而编码与本文中提供的编码序列相同的多肽。本领域的一般技术人员将认识到,可对核酸中的各密码子除了通常是甲硫氨酸的唯一密码子的AUG和通常是色氨酸的唯一密码子的TGG进行修饰以得到功能相同的分子。因此,关于表达产物而不是关于实际的基因疗法构建体的每个所描述的序列中隐含编码相同多肽的核酸的每种变异型式。[0225]关于氨基酸序列,本领域的一般技术人员将认识到,改变、添加或缺失所编码序列中的单一氨基酸或较小百分比氨基酸的对核酸或肽序列的个别取代、缺失或添加是“保守修饰的变体”,其中所述改变导致氨基酸被化学上相似的氨基酸取代。提供功能上相似的氨基酸的保守取代表是本领域中熟知的。此类保守修饰的变体是除了本公开的多态变体、种间同系物以及等位基因以外的变体并且不排除本公开的多态变体、种间同系物以及等位基因。[0226]提供功能上相似的氨基酸的保守氨基酸取代是本领域中熟知的。视特定氨基酸的功能性,例如催化性、结构性或空间上重要的氨基酸而定,不同的氨基酸分组可以被认为是彼此的保守取代。表1提供基于氨基酸的电荷和极性、氨基酸的疏水性、氨基酸的表面暴露结构性质以及氨基酸的二级结构倾向而视为保守取代的氨基酸的分组。[0227]表1.基于蛋白质中残基的功能性的保守氨基酸取代分组.[0228][0229][0230]在两个或更多个核酸或肽序列的背景下,术语“同一”或“同一性”百分比是指如使用BLAST或BLAST2.0序列比较算法用以下所描述的默认参数或通过人工比对和目视检查所测量,两个或更多个序列或子序列为相同的或具有指定百分比的相同的氨基酸残基或核苷酸(即当比较和比对相对于比较窗或指定区的最大对应性时,在指定区内具有约60%的同一性,优选为65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性)。[0231]如本领域中已知的,可使用许多不同程序来鉴定蛋白质或如下文所论述的核酸)是否与已知序列具有序列同一性或相似性。使用本领域已知的标准技术来测定序列同一性和或相似性,所述标准技术包括包括但不限于Smith和Waterman,Adv.Appl.Math.,2:4821981的局部序列同一性算法、通过Needleman和Wunsch,J.Mol.Biol.,48:4431970的序列同一性比对算法、通过卩6^〇]1和1^口1]111,?1'〇3.似1:1.厶〇1.33;[.1].3.厶.,85:24441988的检索相似性方法、通过这些算法的计算机实施方式Wisconsin遗传学软件包中的GAP、BESTFIT、FASTA以及TFASTA,GeneticsComputerGroup,575ScienceDriVe,Madison,WI、由Devereux等,Nucl.AcidRes·,12:387-3951984描述的BestFit序列程序,优选使用默认设置或通过检查来进行。优选地,通过FastDB基于以下参数来计算同一性百分比:错配罚分为1;空位罚分为1;空位尺寸罚分为0.33;并且连接罚分为30,“CurrentMethodsinSequenceComparisonandAnalysis'MacromoleculeSequencingandSynthesis,SelectedMethodsandApplications,第127-149页(1988,AlanR.Liss,Inc,所有这些文献都以引用的方式并入本文中。[0232]适用算法的实例为PILEUPAILEUP使用渐进性成对比对从一组相关序列形成多重序列比对。它还可绘制示出用于形成比对的聚类关系的树形图。PILEUP使用Feng和Doolittle,J.Mol.Evol.35:351-3601987的渐进性比对方法的简化型式;所述方法与Higgins和SharpCABIOS5:151-1531989所描述的方法相似,两个文献均以引用的方式并入本文中。适用的PILEUP参数包括默认空位权重3.00、默认空位长度权重0.10以及加权末端空位。[0233]适用算法的另一实例为以下文献中描述的BLAST算法:Altschul等,J.Mol.Biol.215,403-410,(1990;Altschul等,NucleicAcidsRes.25:3389-34021997;以及Karlin等,Proc.Natl.Acad.Sci.U.S·A.90:5873-57871993,这些文献均以引用的方式并入本文中。特别适用的BLAST程序为从Altschul等,MethodsinEnzymology,266:460-4801996;http:blast·wustledublastREADME·html]获得的WU-BLAST-2程序。WU-BLAST-2使用若干检索参数,其中大部分被设置为默认值。可调节参数被设置为以下数值:重叠跨度=1,重叠分数=0.125,字串阈值⑺=IUHSPS和HSPS2参数为动态值并且通过程序自身根据特定序列的组成和在其中检索所关注的序列的特定数据库的组成来建立;然而,可对所述值进行调节以增加灵敏度。[0234]另一适用算法为如由Altschul等人,Nucl.AcidsRes.,25:3389_3402所报道的带空位的BLAST,该文献以引用的方式并入本文中。带空位的BLAST使用BL0SUM-62取代评分;阈值T参数设置为9;引发无空位延伸的双击法;使空位长度k承担10+k的代价;Xu设置为16,并且对于数据库检索阶段,Xg设置为40,并且对于算法的输出阶段设置为67。通过对应于约22位的评分来引发带空位的比对。[0235]通过用匹配的相同残基数目除以比对区中“较长”序列的残基总数目来测定氨基酸序列同一性%值。“较长”序列为具有比对区中的大部分实际残基的序列(忽略由WU-Blast-2为使比对评分最大化而引入的空位)。以类似方式,将关于所鉴定多肽的编码序列的“核酸序列同一性百分比(%”定义为候选序列中与细胞周期蛋白的编码序列中的核苷酸残基相同的核苷酸残基的百分比。优选方法利用设置为默认参数的WU-BLAST-2的BLASTN模块,其中重叠跨度和重叠分数分别设置为1和〇.125。[0236]比对可包括在所要比对的序列中引入空位。另外,对于含有比由图2的序列(SEQIDNO:1编码的蛋白质更多或更少的氨基酸的序列,应了解,在一个实施方案中,序列同一性百分比将是基于相对于氨基酸或核苷酸总数目的相同氨基酸或核苷酸数目来确定。因此,举例来说,在一个实施方案中,将使用较短的序列中的核苷酸数目来测定如下文所论述比图2中所示的序列(SEQIDNO:1更短的序列的序列同一性。在同一性百分比计算中,未将相对权重分配给序列变异的不同表现形式,诸如插入、缺失、取代等。[0237]在一个实施方案中,仅同一性为正评分+1并且为所有形式的序列变异包括空位分配值“〇”,这排除了对如下文关于序列相似性计算所描述的加权标度或参数的需要。可例如通过用匹配的相同残基的数目除以比对区内“较短”序列的残基总数目并且乘以100来计算序列同一性百分比。“较长”序列为具有比对区内大部分实际残基的序列。[0238]术语“等位基因变体”是指特定遗传基因座处的基因的多态形式,以及来源于所述基因的mRNA转录物的cDNA和由其编码的多肽。术语“优选的哺乳动物密码子”是指如选自以下列表的在哺乳动物细胞中表达的蛋白质中最常用的编码氨基酸的密码子集合中的密码子的子集:GlyGGC,GGG;GluGAG;AspGAC;ValGTG,GTC;AlaGCC,GCT;SerAGC,TCC;LysAAG;AsnAAC;MetATG;IIeATC;ThrACC;TrpTGG;CysTGC;TyrTAT,TAC;LeuCTG;PheTTC;ArgCGC,AGG,AGA;GlnCAG;HisCAC;以及ProCCC〇[0239]如本文所用,术语密码子改变的是指编码多肽例如因子VIII变体蛋白)的多核苷酸序列,其中编码多肽的天然多核苷酸中的至少一个密码子已被改变以改善多核苷酸序列的特性。在一些实施方案中,改善的特性促使编码多肽的mRNA的转录增加、mRNA的稳定性增加例如改善的mRNA半衰期)、多肽的翻译增加和或多核苷酸包装于载体内增加。可用于实现改善的特性的改变的非限制性实例包括改变用于特定氨基酸的密码子的使用和或分布、调整全局和或局部GC含量、去除含AT的序列、去除重复的序列元件、调整全局和或局部CpG二核苷酸含量、去除隐蔽的调控元件例如TATA盒和CCAAT盒元件)、去除内含子外显子剪接位点、改善调控序列(例如引入Kozak共有序列)以及去除能够在转录的mRNA中形成二级结构例如茎环的序列元件。[0240]如本文所论述,存在各种名称来指本文所公开的组分。“CS编号”(例如“CS04”、“CS01”、“CS23”等是指编码FVIII多肽的密码子改变的多核苷酸和或所编码的多肽,包括变体。举例来说,CSOl-FL是指全长FullLength密码子改变的CSOl多核苷酸序列或由CSOl多核苷酸序列编码的氨基酸序列(对于氨基酸AminoAcid序列在本文中有时称为“CSOI-FL-AA”,而对于核酸NucIeicAcid序列则为“CSOI-FL-NA”)。类似地,“CSOI-LC”是指编码FVIII多肽的轻链的密码子改变的核酸序列(“CSO1-LC-NA”)或由CSO1多核苷酸序列编码的FVIII轻链的氨基酸序列(在本文中有时也称为“CS01-LC-AA”)。同样地,CS01-HC、CSOl-HC-AA以及CSOl-HC-NA对于FVIII重链来说也是一样的情况。如本领域技术人员将了解,对于仅发生密码子改变例如与Refacto相比不含额外氨基酸取代)的诸如CSOl、CS04、CS23等构建体,氨基酸序列将为相同的,因为氨基酸序列不因密码子优化而改变。因此,本公开的序列构建体包括但不限于0301呼1^-嫩工501-?1^-44、0501-1^嫩工501-1^44、0501-HC-AA、CSOI-HC-NA、CS04-FL-NA、CS04-FL-AA、CS04-LC-NA、CS04-LC-AA、CS04-HC-AA、CS04-[0241]此命名法还适用于如图13所示的糖基化肽,使得“NGA1-AA”指氨基酸序列,而NGAl-NA指核酸序列。[0242]本公开还包括如下文所描述的使用适当命名法的额外新因子VIII变体。[0243]III.密码子改变的因子VIII变体[0244]在一些实施方案中,本公开提供编码因子VIII变体的密码子改变的多核苷酸。这些密码子改变的多核苷酸当在基于AAV的基因疗法构建体中施用时提供显著改善的因子VIII表达。与常规密码子优化构建体相比,密码子改变的多核苷酸还展示改善的AAV-病毒体包装。如实施例2和实施例4中所证实,申请人已通过发现三种编码因子VIII多肽的密码子改变的多核苷酸(CS01-FL-NA、CS04-FL-NA以及CS23-FL-NA实现了这些优点,所述因子VIII多肽具有人野生型因子VIII重链和轻链以及短的14氨基酸的B-结构域取代的接头“SQ”接头),所述接头含有弗林蛋白酶裂解位点以促进活性FVIIIa蛋白质在体内成熟。如实施例4中进一步证实,将F328S、X5以及Π氨基酸突变的各种组合合并到编码的因子VIII分子中使因子VIII活性的体内表达进一步增加。[0245]在一个实施方案中,本文所提供的密码子改变的多核苷酸具有至少与CSOl、CS04或CS23内编码因子VIII重链和因子VIII轻链的序列(分别为SEQIDNO13、1以及20具有高序列同一性的核苷酸序列。如本领域中已知,因子VIII的B-结构域对于体内活性来说不是必需的。因此,在一些实施方案中,本文所提供的密码子改变的多核苷酸完全缺乏因子VIIIB-结构域。在一些实施方案中,将天然因子VIIIB-结构域替换为含有弗林蛋白酶裂解位点的短氨基酸接头,例如由CS0UCS04或CS23分别为SEQIDNO2、2以及21构建体的氨基酸760-773组成的“SQ”接头。“SQ”接头也称为BDL004如图6中所示,对于氨基酸序列为-AA,而对于核苷酸序列为-NA。[0246]在一个实施方案中,由密码子改变的多核苷酸编码的因子VIII重链和轻链分别为人因子VIII重链和轻链。在其他实施方案中,由密码子改变的多核苷酸编码的因子VIII重链和轻链为来自另一种哺乳动物(例如猪因子VIII的重链和轻链序列。在其他实施方案中,因子VIII重链和轻链为嵌合重链和轻链例如人和第二哺乳动物序列的组合)。在其他实施方案中,因子VIII重链和轻链为来自另一种哺乳动物的重链和轻链的人源化型式,例如其中人残基在所选位置被取代以降低在向人施用时所得肽的免疫原性的来自另一种哺乳动物的重链和轻链序列。[0247]人基因的GC含量变化很大,从低于25%到高于90%。然而,一般来说,具有更高GC含量的人基因以更高的水平表达。举例来说,Kudla等PLoSBiol.,46:802006证实增加基因的GC含量会增加所编码多肽的表达,这主要是通过增加转录和实现mRNA转录物的更高稳态水平来实现。通常,密码子优化的基因构建体的所需GC含量等于或高于60%。然而,天然AAV基因组的GC含量约为56%。[0248]因此,在一些实施方案中,本文所提供的密码子改变的多核苷酸的CG含量更接近于天然AAV病毒体的GC含量例如约56%GC,所述GC含量低于针对在哺乳动物细胞中表达而进行常规密码子优化的多核苷酸的优选CG含量例如等于或超过60%GC。如实施例1中所概述,GC含量为约56%的CS04-FL-NASEQIDN0:1与GC含量更高的类似密码子改变的编码序列相比具有改善的病毒体包装。[0249]因此,在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量低于60%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量低于59%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量低于58%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量低于57%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量不超过56%〇[0250]在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为54%至59%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为55%至59%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56%至59%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为54%至58%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为55%至58%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56%至58%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为54%至57%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为55%至57%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56%至57%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为54%至56%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为55%至56%。[0251]在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56±0.5%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56±0.4%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56±0.3%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56±0.2%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56±0.1%。在一些实施方案中,编码因子VIII多肽的密码子改变的多核苷酸的总GC含量为56%〇[0252]A.因子VIII氨基酸取代[0253]为使本文所描述的因子VIII构建体的基于AAV-载体的表达的效率进一步增加,在一些实施方式中进一步合并了已知改善分泌、增加比活性和或增强因子VIII稳定性的氨基酸取代。鉴定出许多潜在变体,这些潜在变体在给定载体剂量下增加血浆FVIII活性水平。这些变体包括具有更高效的信号肽、阻止BiP相互作用的氨基酸取代、类似于更高效分泌的因子VIII直系同源物例如猪因子VIII的氨基酸取代、单链因子VIII变体以及稳定因子VIII和或减少亚基解离的氨基酸取代的那些变体。[0254]定位于Al结构域与C2结构域之间的界面处的残基A108、R121以及L2302SPE的突变使因子VIII的稳定性增加。举例来说,A108I氨基酸取代引入了疏水性残基,所述疏水性残基更好地填充结构域间的空间,从而稳定相互作用。同样地,R121CL2302CSPE双重氨基酸取代引入了跨越A1-C2结构域的二硫键,进一步稳定相互作用。总之,所有三种氨基酸取代使因子VIII的热稳定性增加3至4倍。关于综述,参见Wakabayashi等,JBiolChem.28629:25748-552011和Wakabayashi等,ThrombHaemost.103:492-952012。因此,在一些实施方案中,编码的因子VIII多肽包括A108I和或R121CL2302C氨基酸取代。[0255]定位于因子VIII的结合钙的结构域内的E113SPE的突变使FVIII凝结比活性增加。举例来说,E113A似乎通过增加的FVIII对因子IXa的亲和力增加了FX酶形成。具体地说,El13A氨基酸取代使FVIII凝结比活性增加两倍,并且使对因子IXa的亲和力增加四倍Biochemistry,41:84852002;J.Biol.Chem.,279:126772004;以及Biochemistry,44:102982005。因此,在一些实施方案中,编码的因子VIII多肽包括El13A氨基酸取代。[0256]因子VIIIAPC裂解位点(残基331-341SPE周围的一个或多个氨基酸残基的取代使因子VIIIa因活化的蛋白C而造成的失活减少,而不会影响FVIII活性。举例来说,PQL333-335VDQSPE氨基酸取代使因子VIII失活减少到116。同样地,MKN336-339GNQ氨基酸取代使因子VIII失活减少到19。当组合时,两种三重氨基酸取代(例如PQLRMKN333-339VDQRGNQ分别为SEQIDNO34和35使因子VIII失活减少到1100C^BiolXhem.,282:202642007。因此,在一些实施方案中,编码的因子VIII多肽包括PQL333-335VDQ和或MKN337-339GNQSPE氨基酸取代。[0257]A2结构域界面内的突变也增加因子VIII稳定性。具体地说,使A1-A2和A2-A3结构域界面中的带电荷残基突变使因子VIIIa中A2亚基的稳定性和保留增加。举例来说,D519、E665以及E1984突变为V或A使因子VIII的稳定性增加高达2倍,并且使VIIIa的稳定性增加高达5倍。具体地说,D519AE665V氨基酸取代使稳定性增加3倍;D519VE665V氨基酸取代使稳定性增加2倍,使A2解离减少到18,并且使产生凝血酶的潜力增加2-4倍;D519VE1984A氨基酸取代使稳定性增加2倍;并且D519VE665VE1984A氨基酸取代使稳定性增加2倍Blood112:2761-692008;J.Thromb.Haemost·,7:438-442009。因此,在一些实施方案中,编码的因子VIII多肽包括以及E1984AV氨基酸取代中的一种或多种。[0258]与本公开特别相关的是可单独地或与本文所描述的其他变体组合包括在内的许多特定突变。这些变体在本文中如下被编码为集合:“ml”是指单个氨基酸改变,“m2”是5个氨基酸变体的集合,“m3”是跨越多肽接头和重链之间的连接的7个氨基酸的缺失与六个氨基酸的插入的组合,“m4”是ml单突变与m5双突变的组合,而“m5”是两处半胱氨酸切除的集合。下文描述这些突变。可将这些突变单独或与其他变体组合包括在任何特定构建体中,并且它们被相应地编码。举例来说,如本文所概述,“m23”为m2和m3变体组合到特定支架上;因此,“CS01m23-FL-NA”或“CS01-FL-NAm23”是指包括编码m2和m3突变的核苷酸的CSOl密码子改变的多核苷酸序列,而“CS01m23-FL-AA”或“CS01-FL-AAm23”是指氨基酸序列。由于CSOl为密码子改变的,但不改变Refacto的氨基酸序列,这些变体可被认为与CS01-FL-AASEQIDNO:2的Refacto氨基酸序列相比在氨基酸层面上为突变。[0259]在许多实施方案中,将本公开的多肽制备成包括“ml”变体。Al结构域中与BiP相互作用的11氨基酸疏水β-折叠内的突变使因子VIII的分泌增加。举例来说,口袋内的F328SSPI,F309SSPE氨基酸取代使因子¥111分泌增加3倍3285变体在本文中被称为“1111”突变并且位于重链内。再次,如本文所描述,可包括信号肽(“信号肽包括性SignalPeptideInclusive”或“SPI”)或者从所加工的最终蛋白序列开始(“信号肽排除性(SignalPeptideExclusive”或“SPE”)来进行变体的编号。因此,使用SPI编号,突变F328S与F309SPE突变体相同。一般来说,本说明书使用SPI编号,但如本领域技术人员将了解,任一编号系统均产生相同的突变。[0260]因此,本公开中包括包含ml突变的多肽,包括〇501-?1^-六六1111、〇501-!10六細1、0504-FL-AAml、CS04-HC-AAmlCS23-FL-AAml、CS23-HC-AAml、CS40-FL-AAml以及CS40-HC-AAml所有这些均编码相同的相应蛋白序列)。[0261]另外,本公开中不仅包括包含ml突变的多肽序列,而且包括那些编码具有ml突变的蛋白质的密码子改变的多核苷酸序列,诸如〇30141^-财1111、0301-!1:-麻1111、0304-卩1^-NAml、CS04-HC-NAml、CS23-FL-NAml、CS23-HC-NA-ml、CS40-FL-NAml以及CS40-HC-NAml。[0262]在许多实施方案中,将本公开的多肽制备成包括“m2”变体集合,所述变体集合为I105VA127SG151KM166TL171P突变(SPI编号;(SPE编号分别为V86IS108AK132GT147MP152Lm2突变集合是基于以下事实;猪氨基酸82-176取代B-结构域缺失的基因疗法构建体中的相应人氨基酸当在HEK293细胞中表达时使因子VIII活性增加W.Xiao,通迅)。11.单个猪氨基酸突变回人BDD-FVIII构建体在Al结构域内鉴定出促成该现象的五种氨基酸:1105¥^1273、61511、11661'以及1^171?3?1。将这些突变的组合引入人构建体中重现了更大的猪取代的改善的活性。Id.因此,在一些实施方案中,编码的因子VIII多肽包括一个或多个选自1105¥^1273、61511、11661'以及1^171?的氨基酸取代加上整个5氨基酸集合m2,从而在许多实施方案中具有特定用途。如同关于ml突变,m2变体位于重链中,并且因此本公开包括包含m2突变的多肽,包括0501砰1^-441112、0501-!1:-441112、0504砰1^-441112、0504-HC-AAm2、CS23-FL-AAm2、CS23-HC-AAm2、CS40-FL-AAm2以及CS40-HC-AAm2所有这些均编码相同的相应蛋白序列)。[0263]另外,本公开中不仅包括包含m2突变的多肽序列,而且包括编码具有m2突变的蛋白质的那些密码子改变的多核苷酸序列,诸如050141^-财1112、0501-»:-麻1112、0504-卩1^-NAm2、CS04-HC-NAm2、CS23-FL-NAm2、CS23-HC-NA-m2、CS40-FL-NAm2以及CS40-HC-NAm2。[0264]在其他实施方案中,本公开的多肽和多核苷酸包括m3突变。m3为在HC-B结构域界面上七个氨基酸取代六个,从而引入靠近界面引入的额外的糖基化位点。因此,在一些实施方案中,m3为相对于FVIII-FL-AASEQIDN0:19的氨基酸AIEPRSF755-761的缺失和N754后的氨基酸^TYVNRSLSEQIDN0:33的插入(例如AIEPRSF755-761TTYVNRSL“TTYVNRSL”以SEQIDN0:33形式公开)。相对于SEQID勵:19,残基六此?1?755-759落在重链的末端内,而残基S760和F761落在B-结构域内。在FVIIIB-结构域缺失、截短或替换的一些实施方案中,残基S760和F761可能不存在于发生突变的基础氨基酸序列中。因此,在一些实施方案中,m3为相对于FVIII-FL-AASEQIDN0:19的氨基酸AIEPR755-759的缺失和N754后的氨基酸TTYVNRSLSEQIDN0:33的插入(例如AIEPR755-759TTYVNRSL“TTYVNRSL”以SEQIDNO:33形式公开)。[0265]m3变体位于重链与B结构域之间的连接处,并且因此本公开包括包含m3突变的多肽,包括CSOl-FL-AAm3、CSOl-HC-AAm3、CS04-FL-AAm3、CS04-HC-AAm3、CS23-FL-AAm3、CS23-HC-AAm3、CS40-FL-AAm3以及CS40-HC-AAm3所有这些均编码相同的相应蛋白序列)。[0266]另外,本公开中不仅包括包含m3突变的多肽序列,而且包括那些编码具有m3突变的蛋白质的密码子改变的多核苷酸序列,诸如〇30141^-财1113、0301-!1:-麻1113、0304-卩1^-NAm3、CS04-HC-NAm3、CS23-FL-NAm3、CS23-HC-NA-m3、CS40-FL-NAm3以及CS40-HC-NAm3。[0267]在其他实施方案中,本公开的多肽和多核苷酸包括m4突变。消除因子VIII中的C1899-C1903二硫键也使分泌增加。此外,因子VIII分泌的增加对于F328SSPI,F309SSPE和C1918GC1922G氨基酸取代的组合为相加性的(Miao等,Blood,103:3412-192004;Selvaraj等,J.Thromb.Haemost·,10:107-152012。因此,在一些实施方案中,编码的因子VΠI多肽包括m4突变,所述m4突变为F328SSPI,F309SSPE和C1918GC1922GSPI氨基酸取代。因为F328S变体位于重链中,而两个半胱氨酸变体位于轻链中,所以包括m4突变的多肽序列为CSOI-FL-AAm4、CSU-HC-AAm4、CSOI-LC-AAm4、CS04-FL-AAm4、CS04-HC-AAm4、CS04-LC-AAm4、CS23-FL-AAm4、CS23-HC-AAm4以及CS23-LC-AAm4。[0268]另外,本公开中不仅包括包含m4突变的多肽序列,而且包括编码具有m4突变的蛋白质的那些密码子改变的多核苷酸序列,诸如030141^-财1114、0301-!1:-麻1114、0301-1^:-NAm4、CS04-FL-NAm4、CS04-HC-NAm4、CS04-LC-NAm4、CS23-FL-NAm4、CS23-HC-NAm4、CS23-LC-NAm4、CS40-FL-NA-m4、CS40-HC-NA-m4以及CS40-LC-NA-m4。[0269]在其他实施方案中,本公开的多肽和多核苷酸包括m5突变。如上所述,消除因子VIII中的C1899-C1903二硫键也使分泌增加。本文中将轻链内所含的C1918GC1922GSPI氨基酸取代称为m5突变集合。[0270]m5变体位于轻链中,并且因此本公开包括包含m5突变的多肽,包括CS01-FL-AAm5、CSOl-LC-AAm5、CS04-FL-AAm5、CS04-LC-AAm5、CS23-FL-AAm5、CS23-LC-AAm5、CS40-FL-AAm5以及CS40-LC-AAm5所有这些均编码相同的相应蛋白序列)。[0271]另外,本公开中不仅包括包含m5突变的多肽序列,而且包括编码具有m5突变的蛋白质的那些密码子改变的多核苷酸序列,诸如050141^-财1115、0501-〇:-麻1115、0504-卩1^-NAm5、CS04-LC-NAm5、CS23-FL-NA-m5、CS23-LC-NA-m5、CS40-FL-NA-m5以及CS40-LC-NA-m5。[0272]除了个别地包括1111、1]12、1]13、1]14以及1]15的特定构建体氨基酸与核酸),可如本文所概述形成突变集合的组合。如本文所指出的,这些组合被指定为ml与m2集合的组合“ml2”或1111、1112以及1113集合的组合“111123”。因此,本公开中包括双重组合,包括11112、11113、11114、11115、11123、11124、11125、11134、11135以及11145。还包括三重组合,111123、111124、111125、111234、111235以及111345。进一步包括四重组合,ml234、ml235、ml345以及ml2345组合。[0273]在一些实施方案中特别关注的是以下突变集合:ml、m2、m3*m4、m23、ml23Wm234〇[0274]B.因子VIIIB-结构域取代的接头[0275]在一些实施方案中,进一步改变FVIII重链与轻链之间的键联(例如野生型因子VIII中的B-结构域)。由于AAV包装容量的尺寸限制,B-结构域缺失、截短和或接头取代的变体会改善FVIII基因疗法构建体的功效。最常用的B-结构域取代的接头是SQFVIII的接头,它仅保留B结构域的14个氨基酸作为接头序列。猪VIII的另一变体美国专利号6,458,563中所描述的“0BI-1”)在CHO细胞中很好地表达,并且具有稍长的24个氨基酸的接头。在一些实施方案中,由本文所描述的密码子改变的多核苷酸编码的因子VIII构建体包括SQ型B-结构域接头序列。在其他实施方案中,由本文所描述的密码子改变的多核苷酸编码的因子VIII构建体包括0BI-1型B-结构域接头序列。[0276]在一些实施方案中,本文所描述的编码的因子VIII多肽包括SQ型B-结构域接头,所述SQ型B-结构域接头包括野生型人因子VIIIB-结构域FVIII-FL-AA;SEQIDN0:19的氨基酸760-7621657-1667Sandberg等Thromb.Haemost.85:932001。在一些实施方案中,SQ型B-结构域接头相对于相应野生型序列具有一个氨基酸取代。在一些实施方案中,SQ型B-结构域接头相对于相应野生型序列具有两个氨基酸取代。在一些实施方案中,将糖基化肽插入SQ型B-结构域接头中。在一些实施方案中,糖基化肽是选自图13中所示的那些糖基化肽(按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75。[0277]在一些实施方案中,本文所描述的编码的因子VIII多肽包括Greengene型B-结构域接头,所述Greengene型B-结构域接头包括野生型人因子VIIIB-结构域FVIII-FL-AA;SEQIDN0:19的氨基酸7601582-1667Oh等,Biotechnol.Prog.,17:19992001。在一些实施方案中,Greengene型B-结构域接头相对于相应野生型序列具有一个氨基酸取代。在一些实施方案中,Greengene型B-结构域接头相对于相应野生型序列具有两个氨基酸取代。在一些实施方案中,将糖基化肽插入Greengene型B-结构域接头中。在一些实施方案中,糖基化肽是选自图13中所示的那些糖基化肽按出现顺序分别为SEQIDN051、53、55、57、59、61、63、65、67、69、71、73以及75。[0278]在一些实施方案中,本文所描述的编码的因子VIII多肽包括延长的SQ型B-结构域接头(SFSQNPPVLKRHQR;BDL-SQ-AA;SEQIDN0:30,所述延长的SQ型B-结构域接头包括野生型人因子VIIIB-结构域FVIII-FL-AA;SEQIDNO:19的氨基酸760-7691657-1667Thim等,Haemophilia,16:3492010。在一些实施方案中,延长的SQ型B-结构域接头相对于相应野生型序列具有一个氨基酸取代。在一些实施方案中,延长的SQ型B-结构域接头相对于相应野生型序列具有两个氨基酸取代。在一些实施方案中,将糖基化肽插入延长的SQ型B-结构域接头中。在一些实施方案中,糖基化肽是选自图13中所示的那些糖基化肽按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75。[0279]在一些实施方案中,本文所描述的编码的因子VIII多肽包括猪0BI-1型B-结构域接头,所述猪0BI-1型B-结构域接头包括来自野生型猪因子VI11B-结构域的氨基酸SFAQNSRPPSASAPKPPVLRRHQRSEQIDN0:31Toschi等,Curr.0pin.Mol.Ther·12:5172010。在一些实施方案中,猪0BI-1型B-结构域接头相对于相应野生型序列具有一个氨基酸取代。在一些实施方案中,猪0BI-1型B-结构域接头相对于相应野生型序列具有两个氨基酸取代。在一些实施方案中,将糖基化肽插入猪0BI-1型B-结构域接头中。在一些实施方案中,糖基化肽是选自图13中所示的那些糖基化肽按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75。[0280]在一些实施方案中,本文所描述的编码的因子VIII多肽包括人0BI-1型B-结构域接头,所述人0BI-1型B-结构域接头包括野生型人因子VIIIB-结构域FVIII-FL-AA;SEQIDNO:19的氨基酸760-7721655-1667。在一些实施方案中,人0BI-1型B-结构域接头相对于相应野生型序列具有一个氨基酸取代。在一些实施方案中,人0BI-1型B-结构域接头相对于相应野生型序列具有两个氨基酸取代。在一些实施方案中,将糖基化肽插入人0BI-1型B-结构域接头中。在一些实施方案中,糖基化肽是选自图13中所示的那些糖基化肽按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75。[0281]在一些实施方案中,本文所描述的编码的因子VIII多肽包括08型B-结构域接头,所述08型8-结构域接头包括来自野生型猪因子¥1118-结构域的氨基酸3?3〇吧1?即4¥1^1«^SEQIDN0:32Toschi等,Curr.0pin.Mol.Ther·12:5172010。在一些实施方案中,猪0BI-1型B-结构域接头相对于相应野生型序列具有一个氨基酸取代。在一些实施方案中,猪0BI-1型B-结构域接头相对于相应野生型序列具有两个氨基酸取代。在一些实施方案中,将糖基化肽插入猪0BI-1型B-结构域接头中。在一些实施方案中,糖基化肽是选自图13中所示的那些糖基化肽(按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75。[0282]从因子VIII构建体去除B-结构域似乎不影响活化酶例如FVIIIa的活性,可能是因为在活化过程中去除了B-结构域。然而,因子VIII的B-结构域含有例如通过N-或0-连接的糖基化而翻译后修饰的若干残基。野生型因子VI11B-结构域的计算机模拟分析PredietionofN-glycosylationsitesinhumanproteins,R.Gupta,E·Jung和S.Brunak,inpreparation2004预测这些位点中至少有四个在体内被糖基化(图14。B-结构域内的这些修饰被认为有助于翻译后调控和或因子VIII在体内的半衰期。[0283]虽然成熟因子VIIIa蛋白中不存在因子VIIIB-结构域,但前体因子VIII分子的B-结构域内的糖基化可增加蛋白质在活化之前的循环半衰期。因此,在一些实施方案中,本文所描述的编码的因子VIII构建体的多肽接头包括一个或多个糖基化序列,以允许体内糖基化。在一些实施方案中,多肽接头包括至少一个共有糖基化序列例如N-或0-连接的糖基化共有序列)。在一些实施方案中,多肽接头包括至少两个共有糖基化序列。在一些实施方案中,多肽接头包括至少三个共有糖基化序列。在一些实施方案中,多肽接头包括至少四个共有糖基化序列。在一些实施方案中,多肽接头包括至少五个共有糖基化序列。在一些实施方案中,多肽接头包括至少6、7、8、9、10或更多个共有糖基化序列。[0284]在一些实施方案中,多肽接头含有至少一个N-连接的糖基化序列N-X-ST,其中X为不是P、S或T任何氨基酸。在一些实施方案中,多肽接头含有至少两个N-连接的糖基化序列N-X-ST,其中X为不是P、S或T任何氨基酸。在一些实施方案中,多肽接头含有至少三个N-连接的糖基化序列N-X-ST,其中X为不是P、S或T任何氨基酸。在一些实施方案中,多肽接头含有至少四个N-连接的糖基化序列N-X-ST,其中X为不是P、S或T任何氨基酸。在一些实施方案中,多肽接头含有至少五个N-连接的糖基化序列N-X-ST,其中X为不是P、S或T任何氨基酸。在一些实施方案中,多肽接头含有至少6、7、8、9、10或更多个N-连接的糖基化序列N-X-ST,其中X为不是P、S或T任何氨基酸。[0285]在一些实施方案中,多肽接头包括与如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有高序列同一性的糖基化肽。在一些实施方案中,糖基化多肽与如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有至少92%的同一性。在一些实施方案中,糖基化肽相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过两个氨基酸取代。在一些实施方案中,糖基化肽相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过一个氨基酸取代。在一些实施方案中,糖基化肽具有选自如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种的氨基酸序列。[0286]在一些实施方案中,糖基化肽与如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有至少92%的同一性,并且由与选自如图13A-13B中所示分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少90%同一性的多核苷酸序列编码。在一些实施方案中,糖基化肽与如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有至少92%的同一性,并且由与选自如图13六-138中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少95%同一性的多核苷酸序列编码。在一些实施方案中,糖基化肽与如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有至少92%的同一性,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少98%同一性的多核苷酸序列编码。[0287]在一些实施方案中,糖基化肽相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过两个氨基酸取代,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少90%同一性的多核苷酸序列编码。在一些实施方案中,糖基化肽相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过两个氨基酸取代,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少95%同一性的多核苷酸序列编码。在一些实施方案中,糖基化肽相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过两个氨基酸取代,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少98%同一性的多核苷酸序列编码。[0288]在一些实施方案中,糖基化肽相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过一个氨基酸取代,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少90%同一性的多核苷酸序列编码。在一些实施方案中,糖基化肽相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过一个氨基酸取代,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少95%同一性的多核苷酸序列编码。在一些实施方案中,糖基化肽相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过一个氨基酸取代,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少98%同一性的多核苷酸序列编码。[0289]在一些实施方案中,糖基化肽具有选自如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种的序列,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少90%同一性的多核苷酸序列编码。在一些实施方案中,糖基化肽具有选自如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种的序列,并且由与选自如图13六-138中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少95%同一性的多核苷酸序列编码。在一些实施方案中,糖基化肽具有选自如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种的序列,并且由与选自如图13A-13B中所示按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74的相应核苷酸序列具有至少98%同一性的多核苷酸序列编码。[0290]在一些实施方案中,由本文所描述的密码子改变的多核苷酸编码的因子VIII多肽具有B-结构域取代的接头,其中糖基化肽被插入SQ接头序列(CS04-FL-AA的氨基酸760_773;SEQIDNO:2中。在一个特定实施方案中,糖基化肽是选自:选自如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种的糖基化肽;与如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有至少92%同一性的糖基化肽;相对于如图13六-138中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过两个氨基酸取代的糖基化肽;以及相对于如图13A-13B中所示按出现顺序分别为SEQIDNO51、53、55、57、59、61、63、65、67、69、71、73以及75中的任一种具有不超过一个氨基酸取代的糖基化肽。在一些实施方案中,将糖基化肽插入残基N768与P769相对于CS04-FL-AA;SEQIDN0:2之间的SQ肽中。[0291]在一些实施方案中,因子VIII构建体的多肽接头是由与图6中所示的那些序列(按出现顺序分别为SEQIDNO5-7和36-48中的任一种具有高序列同一性的第三核苷酸序列编码。在一些实施方案中,第三核苷酸序列与图13中所示的那些序列(按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74中的任一种具有至少95%的同一性。在一些实施方案中,第三核苷酸序列与图13中所示的那些序列按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74中的任一种具有至少96%的同一性。在一些实施方案中,第三核苷酸序列与图13中所示的那些序列按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74中的任一种具有至少97%的同一性。在一些实施方案中,第三核苷酸序列与图13中所示的那些序列按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74中的任一种具有至少98%的同一性。在一些实施方案中,第三核苷酸序列与图13中所示的那些序列按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74中的任一种具有至少99%的同一性。在一些实施方案中,第三核苷酸序列与图13中所示的那些序列按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74中的任一种具有至少99.5%的同一性。在一些实施方案中,第三核苷酸序列与图13中所示的那些序列按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74中的任一种具有至少99.9%的同一性。在一些实施方案中,第三核苷酸序列与图13中所示的那些序列按出现顺序分别为SEQIDNO50、52、54、56、58、60、62、64、66、68、70、72以及74中的任一种相同。[0292]C.具有可裂解接头的编码因子VIII变体的密码子改变的多核苷酸[0293]CS04密码子改变的多核苷酸[0294]在一个实施方案中,本文所提供的密码子改变的多核苷酸包括编码具有在体内可裂解的接头的因子VIII变体多肽的核苷酸序列。因子VIII多肽包括因子VIII轻链、因子VIII重链以及将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CS04-HC-NASEQIDN0:3具有高序列同一性的第一核苷酸序列编码,CS04-HC-NA为编码因子VIII重链的CS04-FL-NASEQIDN0:1的一部分。因子VIII多肽的轻链是由与CS04-LC-NASEQIDN0:4具有高序列同一性的第二核苷酸序列编码,CS04-LC-NA为编码因子VIII轻链的CS04-FL-NASEQIDN0:1的一部分。多肽接头包括弗林蛋白酶裂解位点,所述弗林蛋白酶裂解位点允许体内成熟例如在前体多肽在体内表达或施用之后)。[0295]在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少95%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少96%的序列同一"性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少97%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少98%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDN03和4具有至少99%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少99.5%的序列同一"性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDN03和4具有至少99.9%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4相同。[0296]在一些实施方案中,因子VIII构建体的多肽接头是由与BDL004SEQIDN0:6具有高序列同一性的第三核苷酸序列编码,BDL004编码对应于CS04-FL-AASEQIDN0:2的氨基酸760-773的14-氨基酸接头。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少95%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少96%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少97%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少98%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6相同。[0297]在一些实施方案中,密码子改变的多核苷酸具有与CS04-FL-NASEQIDN0:1具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS04-FL-NASEQIDNO:1具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS04-FL-NASEQIDN0:1具有至少96%的同一性。在一些实施方案中,核苷酸序列与CS04-FL-NASEQIDNO:1具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS04-FL-NASEQIDN0:1具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS04-FL-NASEQIDN0:1具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS04-FL-NASEQIDN0:1具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS04-FL-NASEQIDN0:1具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS04-FL-NASEQIDN0:1相同。[0298]在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与0504_FL-AASEQIDNO:2具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS04-FL-AASEQIDN0:2具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS04-FL-AASEQIDN0:2具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS04-FL-AASEQIDN0:2具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS04-FL-AASEQIDN0:2具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS04-FL-AASEQIDN0:2具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与CS04-FL-AASEQIDN0:2相同。[0299]在一些实施方案中,由CS04多核苷酸编码的与CS04-FL-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99.5%或99.9%的同一性)的因子¥111变体包含一个或多个选自1111、1]12、1]13、1]14以及1]15的氨基酸取代。[0300]在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含ml氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m2氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m3氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m4氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m5氨基酸取代。[0301]在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含ml2氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含ml3氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m23氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m24氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m25氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m34氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m35氨基酸取代。[0302]在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含ml23氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m234氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含ml25氨基酸取代。[0303]CSOl密码子改变的多核苷酸[0304]在一个实施方案中,本文所提供的密码子改变的多核苷酸包括编码具有在体内可裂解的接头的因子VIII变体多肽的核苷酸序列。因子VIII多肽包括因子VIII轻链、因子VIII重链以及将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CSOl-HC-NASEQIDNO:24具有高序列同一性的第一核苷酸序列编码,CSOl-HC-NA为编码因子VIII重链的CSOI-FL-NASEQIDNO:13的一部分。因子VIII多肽的轻链是由与CSO1-LC-NASEQIDN0:25具有高序列同一性的第二核苷酸序列编码,CSOl-LC-NA为编码因子VIII轻链的CSOl-FL-NASEQIDNO:13的一部分。多肽接头包括弗林蛋白酶裂解位点,所述弗林蛋白酶裂解位点允许体内成熟例如在前体多肽在体内表达或施用之后)。[0305]在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CSOl-HC-NA和CSOI-LC-NASEQIDNO24和25具有至少95%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CSOl-HC-NA和CSOl-LC-NASEQIDNO24和25具有至少96%的序列同一"性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少97%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少98%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少99%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少99.5%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少99.9%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CSOl-HC-NA和CSOl-LC-NASEQIDNO24和25相同。[0306]在一些实施方案中,因子VIII构建体的多肽接头是由与BDL004SEQIDN0:6具有高序列同一性的第三核苷酸序列编码,BDL004编码对应于CSOl-FL-AASEQIDNO:2的氨基酸760-773的14-氨基酸接头。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少95%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少96%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少97%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少98%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6相同。[0307]在一些实施方案中,密码子改变的多核苷酸具有与CS01-FL-NASEQIDNO:13具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS01-FL-NASEQIDNO:13具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS01-FL-NASEQIDNO:13具有至少96%的同一性。在一些实施方案中,核苷酸序列与CS01-FL-NASEQIDNO:13具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS01-FL-NASEQIDNO:13具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS01-FL-NASEQIDNO:13具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS01-FL-NASEQIDNO:13具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS01-FL-NASEQIDN0:13具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS01-FL-NASEQIDN0:13相同。[0308]在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与0501_FL-AASEQIDNO:2具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS01-FL-AASEQIDNO:2具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS01-FL-AASEQIDNO:2具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS01-FL-AASEQIDNO:2具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS01-FL-AASEQIDN0:2具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS01-FL-AASEQIDN0:2具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与CS01-FL-AASEQIDNO:2相同。[0309]在一些实施方案中,由CSOl多核苷酸编码的与CS01-FL-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99.5%或99.9%的同一性)的因子¥111变体包含一个或多个选自1111、1]12、1]13、1]14以及1]15的氨基酸取代。[0310]在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含ml氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m2氨基酸取代。在一个实施方案中,由CSO1多核苷酸编码的因子VIII变体包含m3氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m4氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m5氨基酸取代。[0311]在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含ml2氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含ml3氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m23氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m24氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m25氨基酸取代。在一个实施方案中,由CSO1多核苷酸编码的因子VIII变体包含m34氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m35氨基酸取代。[0312]在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含ml23氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m234氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含ml25氨基酸取代。[0313]CS23密码子改变的多核苷酸[0314]在一个实施方案中,本文所提供的密码子改变的多核苷酸包括编码具有在体内可裂解的接头的因子VIII变体多肽的核苷酸序列。因子VIII多肽包括因子VIII轻链、因子VIII重链以及将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CS23-HC-NASEQIDN0:22具有高序列同一性的第一核苷酸序列编码,CS23-HC-NA为编码因子VIII重链的CS23-FL-NASEQIDN0:20的一部分。因子VIII多肽的轻链是由与CS23-LC-NASEQIDN0:23具有高序列同一性的第二核苷酸序列编码,CS23-LC-NA为编码因子VIII轻链的CS23-FL-NASEQIDN0:20的一部分。多肽接头包括弗林蛋白酶裂解位点,所述弗林蛋白酶裂解位点允许体内成熟例如在前体多肽在体内表达或施用之后)。[0315]在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDN022和23具有至少95%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少96%的序列同一"性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少97%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少98%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少99%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少99.5%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDN022和23具有至少99.9%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23相同。[0316]在一些实施方案中,因子VIII构建体的多肽接头是由与BDL004SEQIDN0:6具有高序列同一性的第三核苷酸序列编码,BDL004编码对应于CS23-FL-AASEQIDN0:21的氨基酸760-773的14-氨基酸接头。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少95%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少96%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少97%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6具有至少98%的同一性。在一些实施方案中,第三核苷酸序列与BDL004SEQIDNO:6相同。[0317]在一些实施方案中,密码子改变的多核苷酸具有与CS23-FL-NASEQIDN0:20具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS23-FL-NASEQIDNO:20具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS23-FL-NASEQIDNO:20具有至少96%的同一性。在一些实施方案中,核苷酸序列与CS23-FL-NASEQIDNO:20具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS23-FL-NASEQIDN0:20具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS23-FL-NASEQIDN0:20具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS23-FL-NASEQIDN0:20具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS23-FL-NASEQIDN0:20具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS23-FL-NASEQIDN0:20相同。[0318]在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与CS23-FL-AASEQIDN0:21具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS23-FL-AASEQIDN0:21具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS23-FL-AASEQIDN0:21具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS23-FL-AASEQIDN0:21具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS23-FL-AASEQIDN0:21具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS23-FL-AASEQIDN0:21具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与CS23-FL-AASEQIDN0:21相同。[0319]在一些实施方案中,由CS23多核苷酸编码的与CS23-FL-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99.5%或99.9%的同一性)的因子¥111变体包含一个或多个选自1111、1]12、1]13、1]14以及1]15的氨基酸取代。[0320]在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含ml氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m2氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m3氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m4氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m5氨基酸取代。[0321]在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含ml2氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含ml3氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m23氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m24氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m25氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m34氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m35氨基酸取代。[0322]在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含ml23氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m234氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含ml25氨基酸取代。[0323]D.编码单链因子VIII蛋白的密码子改变的多核苷酸[0324]尽管不能发生因子VIII分子的正常成熟,但定位于B-结构域的C末端的弗林蛋白酶裂解位点被去除的因子VIII构建体保留如单链多肽的活性Leyte等(1991。类似地,具有减弱的弗林蛋白酶位点(含有R1664H氨基酸取代)的B-结构域缺失的因子VIII构建体比具有野生型弗林蛋白酶裂解位点的相应因子VIII构建体更具生物活性Siner等2013。因此,在一些实施方案中,本文所提供的密码子改变的多核苷酸包括编码单链因子VIII变体多肽的核苷酸序列。单链因子VIII多肽包括因子VIII轻链、因子VIII重链以及将重链的C端连接至轻链的N端的多肽接头。多肽接头不包括弗林蛋白酶裂解位点。[0325]单链CS04密码子改变的多核苷酸[0326]在一个实施方案中,本文所提供的密码子改变的多核苷酸包括编码单链因子VIII变体多肽的核苷酸序列。因子VIII多肽包括因子VIII轻链、因子VIII重链以及任选的将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CS04-HC-NASEQID勵:3具有高序列同一性的第一核苷酸序列编码504-!1:-嫩为编码因子¥111重链的0504-FL-NASEQIDN0:1的一部分。因子VIII多肽的轻链是由与CS04-LC-NASEQIDN0:4具有高序列同一性的第二核苷酸序列编码,CS04-LC-NA为编码因子VIII轻链的CS04-FL-NASEQIDNO:1的一部分。任选的多肽接头不包括弗林蛋白酶裂解位点。[0327]在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少95%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少96%的序列同一"性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少97%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少98%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDN03和4具有至少99%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4具有至少99.5%的序列同一"性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDN03和4具有至少99.9%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS04-HC-NA和CS04-LC-NASEQIDNO3和4相同。[0328]在一些实施方案中,密码子改变的多核苷酸具有与CS04-SC1-NASFQIDN0:9具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS04-SC1-NASEQIDN0:9具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS04-SC1-NASEQIDNO:9具有至少96%的同一性。在一些实施方案中,核苷酸序列与CS04-SC1-NASFQIDN0:9具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS04-SC1-NASEQIDNO:9具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS04-SC1-NASEQIDN0:9具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS04-SC1-NASEQIDN0:9具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS04-SC1-NASEQIDN0:9具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS04-SC1-NASEQIDN0:9相同。[0329]在一些实施方案中,密码子改变的多核苷酸具有与CS04-SC2-NASEQIDN0:11具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS04-SC2-NASEQIDNO:11具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS04-SC2-NASEQID冊:11具有至少96%的同一性。在一些实施方案中,核苷酸序列与0304-302-财3?〇10NO:11具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS04-SC2-NASEQIDNO:11具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS04-SC2-NASEQIDNO:11具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS04-SC2-NASEQIDNO:11具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS04-SC2-NASEQIDNO:11具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS04-SC2-NASEQIDNO:11相同。[0330]在一些实施方案中,由密码子改变的多核苷酸编码的单链因子VIII变体具有与CS04-SC1-AASEQIDN0:10;人因子VIIIA760-1667SPI;HsFVIIIA741-1648,SPE具有高序列同一性的氨基酸序列。在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与CS04-SC1-AASEQIDN0:10具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS04-SC1-AASEQIDN0:10具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS04-SC1-AASEQIDN0:10具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS04-SC1-AASEQIDN0:10具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS04-SC1-AASEQIDN0:10具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS04-SC1-AASEQIDN0:10具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与〇304-3:1^4规〇10从:10相同。[0331]在一些实施方案中,由CS04-SC1多核苷酸编码的与CS04-SC1-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99·5%或99·9%的同一性的因子VIII变体包含一个或多个选自ml、1112、1]13、1]14以及1]15的氨基酸取代。[0332]在一些实施方案中,由密码子改变的多核苷酸编码的单链因子VIII变体具有与CS04-SC2-AASEQIDN0:12;人因子VIIIA772-1667SPI;HsFVIIIA753-1648,SPE具有高序列同一性的氨基酸序列。在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与CS04-SC2-AASEQIDN0:12具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS04-SC2-AASEQIDN0:12具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS04-SC2-AASEQIDN0:12具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS04-SC2-AASEQIDN0:12具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS04-SC2-AASEQIDN0:12具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS04-SC2-AASEQIDN0:12具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与CS04-SC2-AASEQIDN0:12相同。[0333]在一些实施方案中,由CS04-SC2多核苷酸编码的与CS04-SC2-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99·5%或99·9%的同一性的单链因子VIII变体包含一个或多个选自ml、1112、1]13、1]14以及1]15的氨基酸取代。[0334]在一个实施方案中,由CS04多核苷酸编码的单链因子VIII变体包含ml氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m2氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m3氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m4氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m5氨基酸取代。[0335]在一个实施方案中,由CS04多核苷酸编码的单链因子VIII变体包含ml2氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含ml3氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m23氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m24氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m25氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m34氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m35氨基酸取代。[0336]在一个实施方案中,由CS04多核苷酸编码的单链因子VIII变体包含ml23氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含m234氨基酸取代。在一个实施方案中,由CS04多核苷酸编码的因子VIII变体包含ml25氨基酸取代。[0337]单链CSOl密码子改变的多核苷酸[0338]在一个实施方案中,本文所提供的密码子改变的多核苷酸包括编码单链因子VIII变体多肽的核苷酸序列。因子VIII多肽包括因子VIII轻链、因子VIII重链以及任选的将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CSOI-HC-NASEQIDNO:24具有高序列同一性的第一核苷酸序列编码,CSOl-HC-NA为编码因子VIII重链的CSOl-FL-NASEQIDNO:13的一部分。因子VIII多肽的轻链是由与CSOl-LC-NASEQIDNO:25具有高序列同一性的第二核苷酸序列编码,CSOl-LC-NA为编码因子VIII轻链的CSOl-FL-NASEQIDNO:13的一部分。任选的多肽接头不包括弗林蛋白酶裂解位点。[0339]在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CSOl-HC-NA和CSOI-LC-NASEQIDNO24和25具有至少95%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少96%的序列同一"性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少97%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少98%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少99%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少99.5%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25具有至少99.9%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS01-HC-NA和CS01-LC-NASEQIDNO24和25相同。[0340]在一些实施方案中,密码子改变的多核苷酸具有与CS01-SC1-NASEQIDN0:26具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS01-SC1-NASEQIDNO:26具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS01-SC1-NASEQIDNO:26具有至少96%的同一性。在一些实施方案中,核苷酸序列与CS01-SC1-NASEQIDNO:26具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS01-SC1-NASEQIDNO:26具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS01-SC1-NASEQIDNO:26具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS01-SC1-NASEQIDNO:26具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS01-SC1-NASEQIDNO:26具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS01-SC1-NASEQIDNO:26相同。[0341]在一些实施方案中,密码子改变的多核苷酸具有与CS01-SC2-NASEQIDN0:27具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS01-SC2-NASEQIDNO:27具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS01-SC2-NASEQIDNO:27具有至少96%的同一性。在一些实施方案中,核苷酸序列与CS01-SC2-NASEQIDNO:27具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS01-SC2-NASEQIDNO:27具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS01-SC2-NASEQIDNO:27具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS01-SC2-NASEQIDN0:27具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS01-SC2-NASEQIDNO:27具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS01-SC2-NASEQIDNO:27相同。[0342]在一些实施方案中,由密码子改变的多核苷酸编码的单链因子VIII变体具有与CS01-SC1-AASEQIDN0:10;人因子VIIIA760-1667SPI;HsFVIIIA741-1648,SPE具有高序列同一性的氨基酸序列。在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与CS01-SC1-AASEQIDN0:10具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS01-SC1-AASEQIDN0:10具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS01-SC1-AASEQIDN0:10具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS01-SC1-AASEQIDN0:10具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS01-SC1-AASEQIDN0:10具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS01-SC1-AASEQIDN0:10具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与CS01-SC1-AASEQIDN0:10相同。[0343]在一些实施方案中,由CSOl-SCl多核苷酸编码的与CS01-SC1-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99·5%或99·9%的同一性的因子VIII变体包含一个或多个选自ml、1112、1]13、1]14以及1]15的氨基酸取代。[0344]在一些实施方案中,由密码子改变的多核苷酸编码的单链因子VIII变体具有与CS01-SC2-AASEQIDN0:12;人因子VIIIA772-1667SPI;HsFVIIIA753-1648,SPE具有高序列同一性的氨基酸序列。在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与CS01-SC2-AASEQIDN0:12具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS01-SC2-AASEQIDN0:12具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS01-SC2-AASEQIDN0:12具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS01-SC2-AASEQIDN0:12具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS01-SC2-AASEQIDN0:12具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS01-SC2-AASEQIDN0:12具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与〇301-302^六规〇10从:12相同。[0345]在一些实施方案中,由CS01-SC2多核苷酸编码的与CS01-SC2-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99·5%或99·9%的同一性的单链因子VIII变体包含一个或多个选自ml、1112、1]13、1]14以及1]15的氨基酸取代。[0346]在一个实施方案中,由CSOl多核苷酸编码的单链因子VIII变体包含ml氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m2氨基酸取代。在一个实施方案中,由CSO1多核苷酸编码的因子VIII变体包含m3氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m4氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m5氨基酸取代。[0347]在一个实施方案中,由CSOl多核苷酸编码的单链因子VIII变体包含ml2氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含ml3氨基酸取代。在一个实施方案中,由CSO1多核苷酸编码的因子VIII变体包含m23氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m24氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m25氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m34氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m35氨基酸取代。[0348]在一个实施方案中,由CSOl多核苷酸编码的单链因子VIII变体包含ml23氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含m234氨基酸取代。在一个实施方案中,由CSOl多核苷酸编码的因子VIII变体包含ml25氨基酸取代。[0349]单链CS23密码子改变的多核苷酸[0350]在一个实施方案中,本文所提供的密码子改变的多核苷酸包括编码单链因子VIII变体多肽的核苷酸序列。因子VIII多肽包括因子VIII轻链、因子VIII重链以及任选的将重链的C端连接至轻链的N端的多肽接头。因子VIII多肽的重链是由与CS23-HC-NASEQIDNO:22具有高序列同一性的第一核苷酸序列编码,CS23-HC-NA为编码因子VIII重链的CS23-FL-NASEQIDN0:20的一部分。因子VIII多肽的轻链是由与CS23-LC-NASEQIDNO:23具有高序列同一性的第二核苷酸序列编码,CS23-LC-NA为编码因子VIII轻链的CS23-FL-NASEQIDN0:20的一部分。任选的多肽接头不包括弗林蛋白酶裂解位点。[0351]在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDN022和23具有至少95%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少96%的序列同一"性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少97%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少98%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少99%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23具有至少99.5%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDN022和23具有至少99.9%的序列同一性。在一些实施方案中,第一核苷酸序列和第二核苷酸序列分别与CS23-HC-NA和CS23-LC-NASEQIDNO22和23相同。[0352]在一些实施方案中,密码子改变的多核苷酸具有与CS23-SC1-NASEQIDN0:28具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS23-SC1-NASEQIDNO:28具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS23-SC1-NASEQIDNO:28具有至少96%的同一性。在一些实施方案中,核苷酸序列与CS23-SC1-NASEQIDNO:28具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS23-SC1-NASEQIDNO:28具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS23-SC1-NASEQIDNO:28具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS23-SC1-NASEQIDNO:28具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS23-SC1-NASEQIDNO:28具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS23-SC1-NASEQIDNO:28相同。[0353]在一些实施方案中,密码子改变的多核苷酸具有与CS23-SC2-NASEQIDN0:29具有高序列同一性的核苷酸序列。在一些实施方案中,核苷酸序列与CS23-SC2-NASEQIDNO:29具有至少95%的同一性。在一些实施方案中,核苷酸序列与CS23-SC2-NASEQIDNO:29具有至少96%的同一性。在一些实施方案中,核苷酸序列与CS23-SC2-NASEQIDNO:29具有至少97%的同一性。在一些实施方案中,核苷酸序列与CS23-SC2-NASEQIDNO:29具有至少98%的同一性。在一些实施方案中,核苷酸序列与CS23-SC2-NASEQIDNO:29具有至少99%的同一性。在一些实施方案中,核苷酸序列与CS23-SC2-NASEQIDN0:29具有至少99.5%的同一性。在一些实施方案中,核苷酸序列与CS23-SC2-NASEQIDNO:29具有至少99.9%的同一性。在一些实施方案中,核苷酸序列与CS23-SC2-NASEQIDNO:29相同。[0354]在一些实施方案中,由密码子改变的多核苷酸编码的单链因子VIII变体具有与CS23-SC1-AASEQIDN0:10;人因子VIIIA760-1667SPI;CS04A741-1648,SPE具有高序列同一性的氨基酸序列。在一些实施方案中,由密码子改变的多核苷酸编码的因子VΠI变体具有与CS23-SC1-AASEQIDN0:10具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS23-SC1-AASEQIDN0:10具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS23-SC1-AASEQIDN0:10具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS23-SC1-AASEQIDN0:10具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS23-SC1-AASEQIDN0:10具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS23-SC1-AASEQIDN0:10具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与CS23-SC1-AASEQIDN0:10相同。[0355]在一些实施方案中,由CS23-SC1多核苷酸编码的与CS23-SC1-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99·5%或99·9%的同一性的因子VIII变体包含一个或多个选自ml、1112、1]13、1]14以及1]15的氨基酸取代。[0356]在一些实施方案中,由密码子改变的多核苷酸编码的单链因子VIII变体具有与CS23-SC2-AASEQIDN0:12;人因子VIIIA772-1667SPI;HsFVIIIA753-1648,SPE具有高序列同一性的氨基酸序列。在一些实施方案中,由密码子改变的多核苷酸编码的因子VIII变体具有与CS23-SC2-AASEQIDN0:12具有高序列同一性的氨基酸序列。在一些实施方案中,氨基酸序列与CS23-SC2-AASEQIDN0:12具有至少97%的同一性。在一些实施方案中,氨基酸序列与CS23-SC2-AASEQIDN0:12具有至少98%的同一性。在一些实施方案中,氨基酸序列与CS23-SC2-AASEQIDN0:12具有至少99%的同一性。在一些实施方案中,氨基酸序列与CS23-SC2-AASEQIDN0:12具有至少99.5%的同一性。在一些实施方案中,氨基酸序列与CS23-SC2-AASEQIDN0:12具有至少99.9%的同一性。在一些实施方案中,氨基酸序列与CS23-SC2-AASEQIDN0:12相同。[0357]在一些实施方案中,由CS23-SC2多核苷酸编码的与CS23-SC2-AA具有高序列同源性例如至少95%、96%、97%、98%、99%、99·5%或99·9%的同一性的单链因子VIII变体包含一个或多个选自ml、1112、1]13、1]14以及1]15的氨基酸取代。[0358]在一个实施方案中,由CS23多核苷酸编码的单链因子VIII变体包含ml氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m2氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m3氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m4氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m5氨基酸取代。[0359]在一个实施方案中,由CS23多核苷酸编码的单链因子VIII变体包含ml2氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含ml3氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m23氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m24氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m25氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m34氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m35氨基酸取代。[0360]在一个实施方案中,由CS23多核苷酸编码的单链因子VIII变体包含ml23氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含m234氨基酸取代。在一个实施方案中,由CS23多核苷酸编码的因子VIII变体包含ml25氨基酸取代。[0361]E.因子VIII表达载体[0362]在一些实施方案中,将本文所描述的密码子改变的多核苷酸整合至表达载体中。表达载体的非限制性实例包括病毒载体例如适合于基因疗法的载体)、质粒载体、噬菌体载体、粘粒、噬菌粒、人工染色体等。[0363]病毒载体的非限制性实例包括:逆转录病毒,例如莫洛尼鼠白血病病毒Moloneymurineleukemiavirus,MMLV、哈维鼠肉瘤病毒(Harveymurinesarcomavirus、鼠乳腺肿瘤病毒以及劳斯肉瘤病毒Roussarcomavirus;腺病毒、腺相关病毒;SV40型病毒;多瘤病毒;愛泼斯坦-巴尔病毒Epstein-Barrviruse;乳头瘤病毒;疱瘆病毒;牛痘病毒;以及脊髓灰质炎病毒。[0364]在一些实施方案中,将本文所描述的密码子改变的多核苷酸整合至基因疗法载体中。在一些实施方案中,基因疗法载体为逆转录病毒,并且特别地为复制缺陷型逆转录病毒。用于制备复制缺陷型逆转录病毒的方案是本领域中已知的。关于综述,参见Kriegler,M.,GeneTransferandExpression,ALaboratoryManual,ff.H.FreemanCo.,NewYork1990以及Murry,E.J.,MethodsinMolecularBiology,第7卷,HumanaPress,Inc·,Cliffton,N.J.1991〇[0365]在一个实施方案中,基因疗法载体为基于腺相关病毒AAV的基因疗法载体。AAV系统先前已有描述,并且总体上是本领域中熟知的(KeIleher和Vos,Biotechniques,176:1110-171994;Cotten等,ProcNatlAcadSciUSA,8913:6094-981992;Curiel,NatImmun,132-3:141-641994;Muzyczka,CurrTopMicrobiolImmunol,158:97-1291992;以及AsokanA等,Mol.Ther.,204:699-7082012,这些文献各自出于所有目的以全文引用的方式并入本文中)。例如美国专利号5,139,941和4,797,368中描述了关于rAAV载体的产生和使用的细节,这些专利各自出于所有目的以全文引用的方式并入本文中。在一个特定实施方案中,AAV载体为AAV-8载体。[0366]在一些实施方案中,将本文所描述的密码子改变的多核苷酸整合至逆转录病毒表达载体中。这些系统先前已有描述,并且总体上是本领域中熟知的Mann等,Cell,33:153-159,1983;Nicolas和Rubinstein,Vectors:Asurveyofmolecularcloningvectorsandtheiruses,Rodriguez和Denhardt编,Stoneham:Butterworth,第494-513页,1988;丁6!11;[11,661161'抑118作1',11131161'1卩1:;[编),如¥¥0『13个单位ml的水平并且相较于wtvCS40对照增加121倍。[0418]载体vCS17、vCS29以及vCS31分别在CS0UCS04以及CS23密码子改变的背景中含有Π和F328SSPI,F309SSPE突变的组合表6WCS17和vCS29构建体在小鼠研究中实现非常高的表达水平相较于vCS40对照增加115至246倍)。值得注意的是,在所用的FVIIIKO小鼠模型中,用VCS17构建体处理的小鼠中大多数随时间推移不产生中和抗体,这由在更晚的时间点(例如第28天和第42天;数据未显示不断增加的FVIII水平得到证实。这是一个意外的发现,因为在一些其他构建体中,由于形成中和抗体,表达水平随时间推移开始降低。CSOl背景与增强分泌的突变F328SSPI,F309SSPE和Xl组合产生低免疫原性诱导。[0419]载体vCS18、vCS27以及vCS35分别在CS0UCS04以及CS23密码子改变的背景中含有Xl和X5突变的组合。这两种突变的组合也非常高效。例如在VCS18情况下可实现相较于vCS40对照增加145倍表7。[0420]载体vCS48和vCS49分别在CSOl和CS04密码子改变的背景中含有X5和F328SSPI,F309SSPE突变的组合。这两种突变的组合也非常高效。所有突变体中增加极多的中的一种是在vCS49情况下可实现相较于vCS40对照增加239倍,这证实了包括F328SSPI,F309SSPE突变的组合的特殊价值。[0421]另一个令人惊讶的观察结果是突变体AAV载体基本上比具有野生型BDD-FVIII密码子的vCS40构建体生长得更好。序列优化使得载体制备时的产量增加若干倍。在一些表达极佳的构建体例如vCS29、vCSl7、vCS20以及vCS26中,归因于密码子改变和或突变序列的产量增加为与野生型载体相比高约3-5倍表8。[0422]表7中示出了在FVIII-敲除小鼠的血浆中由不同的AAV载体构建体诱导的BDD-FVIII表达。构建体具有相同的载体骨架,然而,编码不同类型的突变的FVIII,包括不同的密码子优化背景。选择第14天的表达水平,因为在此时间点抑制性抗体的影响极小,所述抑制性抗体在更晚的时间在小鼠模型中在一些动物中可被观察到。n.d.,未检出。[0423]表7-vCS构建体的体内生物效能数据.[0424][0425][0426]表8-使用不同的AAV载体构建体获得的每升细胞培养物的产量包装效率).将载体从细胞沉淀中纯化出来;n.d.,未检出。[0427][0428][0429]应当理解,本文所描述的实施例和实施方案仅是用于说明的目的,并且据其进行的各种修改或变化将对本领域技术人员作出提示,并且包括在本申请的精神和权限以及所附权利要求书的范围内。本文所引用的所有出版物、专利以及专利申请在此出于所有目的以全文引用的方式并入本文中。

权利要求:1.一种包含与CSOl-FL-NASEQIDN0:13具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码因子VIII多肽。2.如权利要求1所述的多核苷酸,其中所述核苷酸序列与CSOl-FL-NASEQIDNO:13具有至少99%的同一性。3.如权利要求1所述的多核苷酸,其中所述核苷酸序列为CSOl-FL-NASEQIDNO:13。4.一种包含编码因子VIII多肽的核苷酸序列的多核苷酸,所述因子VIII多肽包含轻链、重链以及将所述重链的C端连接至所述轻链的N端的多肽接头,其中所述因子VIII多肽的所述重链是由与CSOl-HC-NASEQIDNO:24具有至少95%同一1性的第一核苷酸序列编码;其中所述因子FVIII多肽的所述轻链是由与CSOl-LC-NASEQIDNO:25具有至少95%同一性的第二核苷酸序列编码;并且其中所述多肽接头包含弗林蛋白酶裂解位点。5.如权利要求4所述的多核苷酸,其中所述多肽接头是由与BDLOOlSEQIDN0:5具有至少95%同一性的第三核苷酸序列编码。6.如权利要求4或5所述的多核苷酸,其中:所述第一核苷酸序列与CSOI-HC-NASEQIDNO:24具有至少99%同一性;并且所述第二核苷酸序列与CSOl-LC-NASEQIDN0:25具有至少99%的同一性。7.如权利要求4或5所述的多核苷酸,其中:所述第一核苷酸序列为CSOl-HC-NASEQIDN0:24;并且所述第二核苷酸序列CSOl-LC-NASEQIDN0:25。8.—种包含与CS04-FL-NASEQIDN0:1具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码因子VIII多肽。9.如权利要求4所述的多核苷酸,其中所述核苷酸序列与CS04-FL-NASEQIDN0:1具有至少99%的同一性。10.如权利要求4所述的多核苷酸,其中所述核苷酸序列为CS04-FL-NASEQIDN0:1。11.一种包含编码因子VIII多肽的核苷酸序列的多核苷酸,所述因子VIII多肽包含轻链、重链以及将所述重链的C端连接至所述轻链的N端的多肽接头,其中所述因子VIII多肽的所述重链是由与CS04-HC-NASEQIDN0:3具有至少95%同一性的第一核苷酸序列编码;其中所述因子FVIII多肽的所述轻链是由与CS04-LC-NASEQIDN0:4具有至少95%同一性的第二核苷酸序列编码;并且其中所述多肽接头包含弗林蛋白酶裂解位点。12.如权利要求11所述的多核苷酸,其中所述多肽接头是由与BDL004SEQIDN0:6具有至少95%同一性的第三核苷酸序列编码。13.如权利要求11或12所述的多核苷酸,其中:所述第一核苷酸序列与CS04-HC-NASEQIDN0:3具有至少99%的同一性;并且所述第二核苷酸序列与CS04-LC-NASEQIDN0:4具有至少99%的同一性。14.如权利要求11或12所述的多核苷酸,其中:所述第一核苷酸序列为CS04-HC-NASEQIDN0:3;并且所述第二核苷酸序列CS04-LC-NASEQIDN0:4。15.—种包含与CS23-FL-NA具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码因子VIII多肽。16.如权利要求15所述的多核苷酸,其中所述核苷酸序列与CS23-FL-NASEQIDNO:20具有至少99%的同一性。17.如权利要求15所述的多核苷酸,其中所述核苷酸序列为CS23-FL-NASEQIDNO:20〇18.—种包含编码因子VIII多肽的核苷酸序列的多核苷酸,所述因子VIII多肽包含轻链、重链以及将所述重链的C端连接至所述轻链的N端的多肽接头,其中所述因子VIII多肽的所述重链是由与CS23-HC-NASEQIDN0:22具有至少95%同一1性的第一核苷酸序列编码;其中所述因子FVIII多肽的所述轻链是由与CS23-LC-NASEQIDN0:23具有至少95%同一性的第二核苷酸序列编码;并且其中所述多肽接头包含弗林蛋白酶裂解位点。19.如权利要求18所述的多核苷酸,其中所述多肽接头是由与BDL023SEQIDN0:7具有至少95%同一性的第三核苷酸序列编码。20.如权利要求18或19所述的多核苷酸,其中:所述第一核苷酸序列与CS23-HC-NASEQIDN0:22具有至少99%的同一性;并且所述第二核苷酸序列与CS23-LC-NASEQIDN0:23具有至少99%的同一性。21.如权利要求18或19所述的多核苷酸,其中:所述第一核苷酸序列为CS23-HC-NASEQIDN0:22;并且所述第二核苷酸序列CS23-LC-NASEQIDN0:23。22.如权利要求4、11以及18中任一项所述的多核苷酸,其中编码的多肽接头包含氨基酸序列与选自由以下各项组成的组的糖基化肽具有至少92%同一性的糖基化肽:NG1-AA、NG4-AA、NG5-AA、NG6-AA、NG7-AA、NG9-AA、NG10-AA、NG16-AA、NG17-AA、NG18-AA、NG19-AA、NG20-AA、NG21-AA以及NGV-AA。23.如权利要求4、11以及18中任一项所述的多核苷酸,其中所述编码的多肽接头包含选自由以下各项组成的组的糖基化肽:NG1-AA、NG4-AA、NG5-AA、NG6-AA、NG7-AA、NG9-AA、NGIO-AA、NG16-AA、NG17-AA、NG18-AA、NG19-AA、NG20-AA、NG21-AA以及NGV-AA。24.如权利要求22或23所述的多核苷酸,其中所述糖基化肽是由核苷酸序列与选自由以下各项组成的组的序列具有至少95%同一性的多核苷酸编码:NG1-NA、NG4-NA、NG5-NA、NG6-NA、NG7-NA、NG9-NA、NGIO-NA、NG16-NA、NG17-NA、NG18-NA、NG19-NA、NG20-NA、NG21-NA以及NGV-NA。25.如权利要求22或23所述的多核苷酸,其中所述糖基化肽是由核苷酸序列选自以下各项中的一种的多核苷酸编码:NGI-NA、NG4-NA、NG5-NA、NG6-NA、NG7-NA、NG9-NA、NGIO-NA、NG16-NA、NG17-NA、NG18-NA、NG19-NA、NG20-NA、NG21-NA以及NGV-NA。26.如权利要求4、11以及18中任一项所述的多核苷酸,其中所述多肽接头是由与选自由以下各项组成的组的序列具有至少95%同一性的第三核苷酸序列编码:BDLNG1-NA、BDLNG3-NA、BDLNG5-NA、BDLNG6-NA、BDLNG9-NA、BDLNG10-NA、BDLNG16-NA、BDLNG17-NA、BDLNG18-NA、BDLNG19-NA、BDLNG20-NA以及BDLNG21-NA。27.如权利要求I至21中任一项所述的多核苷酸,其中所述多核苷酸编码包含与0504_FL-AASEQIDNO:2具有至少95%同一性的氨基酸序列的因子VIII多肽。28.如权利要求1至21中任一项所述的多核苷酸,其中所述多核苷酸编码包含030441^-AASEQIDNO:2的氨基酸序列的因子VIII多肽。29.—种包含与CS01-SC1-NASEQIDN0:26具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。30.如权利要求29所述的多核苷酸,其中所述核苷酸序列与CS01-SC1-NASEQIDNO:26具有至少99%的同一性。31.如权利要求29所述的多核苷酸,其中所述核苷酸序列为CS01-SC1-NASEQIDNO:26〇32.—种包含与CS04-SC1-NASEQIDN0:9具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。33.如权利要求29所述的多核苷酸,其中所述核苷酸序列与CS04-SC1-NASEQIDNO:9具有至少99%的同一性。34.如权利要求29所述的多核苷酸,其中所述核苷酸序列为CS04-SC1-NASEQIDNO:9〇35.—种包含与CS23-SC1-NASEQIDNO:28具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。36.如权利要求29所述的多核苷酸,其中所述核苷酸序列与CS23-SC1-NASEQIDNO:28具有至少99%的同一性。37.如权利要求29所述的多核苷酸,其中所述核苷酸序列为CS23-SC1-NASEQIDNO:28〇38.如权利要求29至37中任一项所述的多核苷酸,其中所述多核苷酸编码包含与0501_SCl-AASEQIDNO:10具有至少95%同一性的氨基酸序列的单链因子VIII多肽。39.如权利要求29至37中任一项所述的多核苷酸,其中所述多核苷酸编码包含0301_SCl-AASEQIDNO:10的氨基酸序列的单链因子VIII多肽。40.—种包含与CS01-SC2-NASEQIDN0:27具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。41.如权利要求40所述的多核苷酸,其中所述核苷酸序列与CS01-SC2-NASEQIDNO:27具有至少99%的同一性。42.如权利要求40所述的多核苷酸,其中所述核苷酸序列为CS01-SC2-NASEQIDNO:27。43.—种包含与CS04-SC2-NASEQIDN0:11具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。44.如权利要求43所述的多核苷酸,其中所述核苷酸序列与CS04-SC2-NASEQIDNO:11具有至少99%的同一性。45.如权利要求43所述的多核苷酸,其中所述核苷酸序列为CS04-SC2-NASEQIDNO:11〇46.—种包含与CS23-SC2-NASEQIDN0:29具有至少95%同一性的核苷酸序列的多核苷酸,其中所述多核苷酸编码单链因子VIII多肽。47.如权利要求43所述的多核苷酸,其中所述核苷酸序列与CS23-SC2-NASEQIDNO:29具有至少99%的同一性。48.如权利要求43所述的多核苷酸,其中所述核苷酸序列为CS23-SC2-NASEQIDNO:29〇49.如权利要求40至48中任一项所述的多核苷酸,其中所述多核苷酸编码包含与0301_SC2-AASEQIDNO:12具有至少95%同一性的氨基酸序列的单链因子VIII多肽。50.如权利要求40至48中任一项所述的多核苷酸,其中所述多核苷酸编码包含0301_SC2-AASEQIDN0:12的氨基酸序列的单链因子VIII多肽。51.—种包含与选自由以下各项组成的组的序列具有至少95%同一性的序列的多核苷酸:CSOI-HC-NA、CSOI-LC-NA、CS04-HC-NA、CS04-LC-NA、CS23-HC-NA、CS23-LC-NA。52.—种包含与选自由以下各项组成的组的序列具有至少99%同一性的序列的多核苷酸:CSOI-HC-NA、CSOI-LC-NA、CS04-HC-NA、CS04-LC-NA、CS23-HC-NA、CS23-LC-NA。53.—种包含选自由以下各项组成的组的序列的多核苷酸:CS01-HC-NA、CS01-LC-NA、CS04-HC-NA、CS04-LC-NA、CS23-HC-NA、CS23-LC-NA。54.如权利要求51至53中任一项所述的多核苷酸,其中所述多核苷酸编码包含与0301_FL-AASEQIDNO:2具有至少95%同一性的氨基酸序列的因子VIII多肽。55.如权利要求51至53中任一项所述的多核苷酸,其中所述多核苷酸编码包含0301_FL-AASEQIDNO:2的氨基酸序列的因子VIII多肽。56.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽相对于FVIII-FL-AASEQIDNO:19包含F328S氨基酸取代。57.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽相对于FVIII-FL-AASEQIDNO:19包含1105¥、厶1275、61511、]\11661'以及1^171?氨基酸取代。58.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽包含:a氨基酸缺失AIEPRSF755-761,相对于FVIII-FL-AASEQIDNO:19;以及bN754后的氨基酸插入TTYVNRSLSEQIDN0:33,相对于FVIII-FL-AASEQIDNO:19〇59.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽包含:aF328S氨基酸取代,相对于FVIII-FL-AASEQIDN0:19;以及bC1918G和C1922G氨基酸取代,相对于FVIII-FL-AASEQIDNO:19。60.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽相对于FVIII-FL-AASEQIDNO:19包含1105¥、厶1275、61511、]\11661'、1^171?以及卩3285氨基酸取代。61.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽包含:aF328S氨基酸取代,相对于FVIII-FL-AASEQIDNO:19;b氨基酸缺失AIEPRSF755-761,相对于FVIII-FL-AASEQIDNO:19;以及cN754后的氨基酸插入TTYVNRSLSEQIDN0:33,相对于FVIII-FL-AASEQIDNO:19〇62.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽包含:aI105V、A127S、G151K、M166T以及L171P氨基酸取代,相对于FVIII-FL-AASEQIDN0:19;b氨基酸缺失AIEPRSF755-761,相对于FVIII-FL-AASEQIDNO:19;以及cN754后的氨基酸插入TTYVNRSLSEQIDN0:33,相对于FVIII-FL-AASEQIDNO:19〇63.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽包含:aF328S氨基酸取代,相对于FVIII-FL-AASEQIDNO:19;bC1918G和C1922G氨基酸取代,相对于FVIII-FL-AASEQIDNO:19;以及cI105V、A127S、G151K、M166T以及L171P氨基酸取代,相对于FVIII-FL-AASEQIDN0:19〇64.如权利要求1至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽包含:aF328S氨基酸取代,相对于FVIII-FL-AASEQIDNO:19;bC1918G和C1922G氨基酸取代,相对于FVIII-FL-AASEQIDNO:19;c氨基酸缺失AIEPRSF755-761,相对于FVIII-FL-AASEQIDNO:19;以及dN754后的氨基酸插入TTYVNRSLSEQIDN0:33,相对于FVIII-FL-AASEQIDNO:19〇65.如权利要求I至55中任一项所述的多核苷酸,其中所述编码的因子VIII多肽包含:aI105V、A127S、G151K、M166T以及L171P氨基酸取代,相对于FVIII-FL-AASEQIDN0:19;bF328S氨基酸取代,相对于FVIII-FL-AASEQIDNO:19;cC1918G和C1922G氨基酸取代,相对于FVIII-FL-AASEQIDNO:19;d氨基酸缺失AIEPRSF755-761,相对于FVIII-FL-AASEQIDNO:19;以及eN754后的氨基酸插入TTYVNRSLSEQIDN0:33,相对于FVIII-FL-AASEQIDNO:19〇66.如权利要求I至65中任一项所述的多核苷酸,其进一步包含可操作地连接至编码所述因子VIII多肽的所述多核苷酸的启动子元件。67.如权利要求66所述的多核苷酸,其中所述启动子元件为编码所述因子VIII多肽的所述核苷酸序列上游的肝特异性启动子序列。68.如权利要求67所述的多核苷酸,其进一步包含位于所述肝特异性启动子序列与编码所述因子VIII多肽的所述核苷酸序列之间的内含子序列。69.—种腺相关病毒AAV载体,所述腺相关病毒载体包含如权利要求1至68中任一项所述的多核苷酸。70.—种腺相关病毒AAV粒子,所述腺相关病毒粒子包含如权利要求1至68中任一项所述的多核苷酸。71.—种宿主细胞,所述宿主细胞用包含如权利要求1至68中任一项所述的多核苷酸的腺相关病毒AAV粒子感染。72.—种制备腺相关病毒AAV粒子的方法,所述方法包括将如权利要求1至68中任一项所述的多核苷酸引入哺乳动物宿主细胞中,其中所述多核苷酸能够在所述哺乳动物宿主细胞中复制。73.—种治疗血友病A的方法,所述方法包括向有需要的患者施用如权利要求70所述的腺相关病毒AAV粒子。74.—种转导宿主细胞的方法,所述方法包括使所述宿主细胞与如权利要求70所述的腺相关病毒AAV粒子接触。

百度查询: 武田药品工业株式会社 用于血友病A的基因治疗的具有增加的表达的编码重组FVIII变体的病毒载体

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。