买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】发现替代性抗原特异性抗体变体的方法_豪夫迈·罗氏有限公司_201880016187.0 

申请/专利权人:豪夫迈·罗氏有限公司

申请日:2018-03-05

公开(公告)日:2024-04-19

公开(公告)号:CN110382696B

主分类号:C12N15/10

分类号:C12N15/10;G16B20/00;G16B30/00;C12Q1/6811;C07K16/00

优先权:["20170307 EP 17159617.4"]

专利状态码:有效-授权

法律状态:2024.04.19#授权;2019.11.19#实质审查的生效;2019.10.25#公开

摘要:本文报道了选择亲本抗体可变结构域编码核酸的变体的方法,其中由所述编码核酸编码的亲本抗体可变结构域氨基酸序列具有至少一个可开发性热点,该方法包括以下步骤i提供多个含DNA样品分泌抗体的B细胞的基因组材料,每个样品包括一个或多个抗体可变结构域编码核酸;ii使用共有序列特异性引物对i的所述抗体可变结构域编码核酸进行PCR扩增以获得扩增产物其中所述共有序列特异性引物结合遗传基因座组中多个基因的共同的共有序列,从而产生扩增产物库;iii对步骤ii中获得的多个所述扩增产物进行测序,以确定在测序读取中每个位置的每个核苷酸的相对比例;iv在iii的测序读取结果和亲本抗体可变结构域编码核酸之间进行序列比对;v在所述序列比对中对抗体可变结构域编码核酸进行基于序列同一性同源性的排序,其中亲本抗体可变结构域编码核酸作为完美模板参照序列;和vi基于步骤v的序列排序选择变体抗体可变结构域编码核酸,其中选择步骤vi中选择的变体,使得除去可开发性热点。

主权项:1.一种鉴定特异性结合相同靶或抗原的参照抗体的变体抗体的方法,所述方法包括以下步骤:i产生特异性结合与参照抗体相同的靶或抗原的参照抗体变体抗体的多个氨基酸序列或核酸序列的一组或多组VH或和VL序列,其已通过二代测序确定,其中基于以下比对所述序列与作为模板的参照抗体的氨基酸序列或核酸序列,其中从来自与参照抗体相同的免疫活动的B细胞获得特异性结合与参照抗体相同的靶或抗原的变体抗体的多个氨基酸序列或核酸序列,其中对表达抗原特异性抗体的B细胞进行B细胞富集,其中参照抗体特异性结合靶或抗原,αVH或和VL的相同长度,和β所有β-片层框架区的相同长度,和γ所有HVRCDR的相同长度,和δ允许框架和HVRCDR中的突变;ii根据以下对i的一组或多组中的比对序列排序α与参照抗体序列不同的氨基酸的数量,和β由与参照抗体序列不同的氨基酸产生的AB角距离≤0.5的VHVL方向的不同;iii鉴定最佳10个比对和排序的抗体之一作为参照抗体的变体抗体,其中变体抗体确实除去了以下至少一个的氨基酸残基:i可变结构域或HVR中未配对的Cys残基,ii糖基化位点,和iii降解热点Asp、Asn或Met。

全文数据:发现替代性抗原特异性抗体变体的方法本发明属于抗体技术的领域。更确切地说,本文报道了一种将B细胞克隆BCC的多功能性与二代测序NGS的能力相结合,以鉴定从一种或多种免疫动物获得的B细胞群中存在的参照结合物的变体结合物的方法。背景技术现今,通常通过噬菌体展示或通过免疫实验室动物并从中分离产生抗体的B细胞来产生抗体。在后一种情况下,待处理的B细胞数量基于B细胞或相应分泌的抗体的性质而减少。然后,获得序列信息。因此,候选物选择主要基于抗体的结合和功能特性进行,但在氨基酸序列方面是“不知情的”,因此,例如,在可开发性方面,如未配对的Cys-残基、不寻常的糖基化位点、降解热点Asp、Asn、Met等是“不知情的”。在WO2015070191中,报道了用于检测基因组变体的系统和方法。WO2015155035报道了用于鉴定和绘制由抗体应答靶向的表位的方法。在WO2015164757中报道了病毒中和抗体表位绘制的方法。WO2016023962报道了基于共有的等位基因检测。而在WO2016118883中报道了罕见序列变体的检测、方法和组合物。在当前免疫方法中获得的大量B细胞阻止了由此产生的所有分离抗体的详细表征。必须选择和减少克隆数量,降低特征性免疫应答的多样性。Wu等人公开了通过结构和深度测序揭示的HIV-1中和抗体的集中进化Science33320111593-1602。Zhu等人公开了通过B细胞转录物的二代测序从头鉴定VRCO1类HIV-1中和抗体Proc.Natl.Acad.Sci.USA1102013E4088-E4097。Wu等人和Zhu等人各公开了用于鉴定来自与参照结合物相同或不同物种的给定参照结合序列的“新”同源抗体cognateantibody变体的方法。Fridy等人公开了一种用于快速生产多功能纳米抗体库的稳健通路Nat.Meth.1120141253-1260+SI。如Wu等人和Zhu等人一样,Fridy等人所进行的方法没有公开任何使用序列库搜索抗体变体的结果或方法或方式。Glanville等公开了文库选择项目中深度测序所带来的见解Curr.Opin.Struct.Biol.332015146-160。因此,需要提供基于免疫应答多样性中包含的序列信息鉴定结合相同抗原但具有不同特性的另外的或变体抗体的方法。发明内容然而,本发明人已经发现,通过利用二代测序的定量性质,可以克服上述特征性免疫应答多样性丧失所带来的挑战。本发明人已经发现,通过将B细胞克隆BCC的多功能性与二代测序NGS的能力相结合,可以鉴定从一种或多种针对相同抗原的免疫动物中获得的B细胞群中存在的参照结合物的变体结合物。本文报道的方法将B细胞克隆的效率与二代测序的能力合并,提供了用于鉴定参照抗体的抗体变体的高度简化的方法,而无需进行深入的基于筛选的免疫或细胞测定。已经发现,利用本文报道的方法,可以鉴定抗体可变结构域以及具有至少一个可开发性热点的完整VHVL对即具有至少一个易于发生翻译后修饰的氨基酸残基、不包含所述可开发性热点的变体即具有的至少一个易于发生翻译后修饰的氨基酸残基改变为不易于发生相同的翻译后修饰的不同氨基酸残基。本文报道的方法的另一个结果是能够提供用相同抗原免疫的一个动物个体或一组动物独特的抗体反应谱。该谱可以是有价值信息的来源。本文报道的一个方面是用于选择参照抗体可变结构域编码核酸的变体的方法,其中与所述参照编码核酸编码的参照抗体可变结构域氨基酸序列相比,所述参照抗体可变结构域编码核酸的变体编码的变体抗体可变结构域氨基酸序列具有改善的可开发性,或其中在所述参照抗体可变结构域编码核酸的变体编码的变体抗体可变结构域氨基酸序列中,翻译后修饰的至少一个氨基酸残基与所述参照编码核酸编码的参照抗体可变结构域氨基酸序列相比,已经改变,其中当变体和参照抗体可变结构域与相应的其他结构域配对时,形成与相同抗原结合的抗体结合位点,该方法包括以下步骤:i提供多个含DNA的样品,每个样品包括一个或多个抗体可变结构域编码核酸;ii使用共有序列特异性引物对i的多个抗体可变结构域编码核酸进行PCR扩增以获得扩增产物;iii对步骤ii中获得的多个扩增产物进行测序,以确定每个核苷酸在每个位置的相对比例在测序读取中;iv在iii的测序读取结果和参照抗体可变结构域编码核酸之间进行序列比对;v在iv的所述序列比对中进行基于序列同一性或同源性的抗体可变结构域编码核酸的排序,其中参照抗体可变结构域编码核酸是模板序列;和vi从步骤v的序列排序的前10个序列之一中选择变体抗体可变结构域编码核酸;从而选择在步骤vi中选择的变体以使得可开发性得到改善和或至少一个翻译后修饰的氨基酸残基已经改变。本文报道的一个方面是用于选择参照抗体可变结构域的变体的方法,其中参照抗体可变结构域具有至少一个翻译后修饰的氨基酸残基,该方法包括以下步骤:-接收通过测序来自多个B细胞克隆的核酸产生的测序数据,每个B细胞克隆产生特异性结合与参照抗体相同的靶的抗体;-将测序数据与作为模板序列的参照抗体的序列比对;-选择与参照序列具有最高结构功能同一性相似性的序列,但其不具有参照抗体可变结构域的至少一个翻译后修饰的氨基酸残基。本文报道的一个方面是用于鉴定与相同靶抗原特异性结合的参照抗体的变体抗体的方法,所述方法包括以下步骤:i提供α参照抗体的氨基酸序列或核酸序列,其中参照抗体与靶抗原特异性结合,β所述参照抗体的至少一种生物学特性和任选的一种或多种测定法以测定至少一种生物学特性,γ特异性结合与参照抗体相同的靶的变体抗体的多个氨基酸序列或核酸序列,其已经通过二代测序确定,ii产生一组或多组相关的VH或和VL序列,其中基于以下进行序列比对αVH或和VL的相同长度,或和β所有β-片层框架区的相同长度,或和γ所有HVRCDR的相同长度,或和δ相同的HVR3CDR3序列、框架和或其他HVRCDR中允许的多至3个氨基酸交换的突变,或和ε允许的多至2个氨基酸交换的同源HVRCDR3序列和相同的HVRCDR1和2,或和ζ允许框架和HVRCDR中的突变;iii根据以下对ii的一组或多组中的比对序列排序α与参照抗体序列不同的氨基酸的数量,和或β与参照抗体序列不同的氨基酸的位置,和或γ由与参照抗体序列不同的氨基酸产生的物理化学性质的变化,和或δ由与参照抗体序列不同的氨基酸产生的VHVL方向的不同;iv将最好的10个比对和排序的抗体之一鉴定为参照抗体的变体抗体,从而变体抗体具有至少一个比参照抗体少翻译后修饰的氨基酸残基。在该方面的一个实施方案中,步骤ii还包括用相同的编号方案注释序列,该编号方案是Wolfguy编号方案。在该方面的一个实施方案中,序列中的不同以以下形式注释:参照抗体氨基酸残基-位置-变体抗体氨基酸残基,并且被分组为突变元组。在该方面的一个实施方案中,物理化学性质的变化由电荷、疏水性和或大小的变化决定。在该方面的一个实施方案中,使用突变风险评分确定物理化学性质的变化。在该方面的一个实施方案中,基于下表确定突变风险评分,其中在该表中未明确给出的残基用值1加权:其中,位置101至125对应于重链可变结构域框架1,位置151至199对应于CDR-H1,位置201至214对应于重链可变结构域框架2,位置251至299对应于CDR-H2,位置301至332对应于重链可变结构域框架3,位置351至399对应于CDR-H3,位置401至411对应于重链可变结构域框架4。在该方面的一个实施方案中,特异性结合与参照抗体相同的靶的变体抗体的多个氨基酸序列或核酸序列从来自与参照抗体相同的免疫活动的B细胞获得,其中对表达抗原特异性抗体的B细胞进行B细胞富集在所有方面的一个实施方案中,在变体中除去以下一个或多个:i可变结构域或HVR中的未配对Cys-残基,ii糖基化位点,和iii降解热点Asp、Asn或Met。本文报道的一个方面是用于选择参照抗体可变结构域的变体的方法,其中参照抗体可变结构域具有至少一个翻译后修饰的氨基酸残基,该方法包括根据前述方面中任一项的方法的步骤。本文报道的一个方面是用于产生抗体的方法,其包括以下步骤:-培养包含根据前述方面中任一项的方法获得的核酸和表达功能性抗体所需的所有其他核酸的细胞,-从细胞或培养基中回收抗体。本文报道的一个方面是包含根据前述方面中任一项的方法获得的核酸的细胞。本文报道的一个方面是用于鉴定特异性结合相同靶抗原的参照抗体的变体抗体与参照抗体具有相当的生物学特性的方法,所述方法包括以下步骤:i提供α参照抗体的氨基酸序列或核酸序列,其中参照抗体与靶抗原特异性结合,β所述参照抗体的至少一种生物学特性和任选的一种或多种测定法以测定至少一种生物学特性,γ特异性结合与参照抗体相同的靶的变体抗体的多个至少10、至少100、至少1000、至少10000个氨基酸序列或核酸序列任选地在从与参照抗体相同的免疫活动中获得,其通过二代测序确定,ii产生一组或多组相关的VH或和VL序列,其中基于以下进行序列比对αVH或和VL的相同长度,或和β所有β-片层框架区的相同长度,或和γ所有HVRCDR的相同长度,或和δ相同的HVR3CDR3序列、允许的框架和或HVRCDR中1或21至3个氨基酸交换突变,或和ε高度同源的HVRCDR3序列允许1或2个氨基酸交换和相同的HVRCDR1和2在框架区允许突变,或和ζ允许框架和HVRCDR中的突变;iii根据以下对ii的一组或多组中的比对序列排序α与参照抗体序列不同的氨基酸的数量,和或β与参照抗体序列不同的氨基酸的位置,和或γ由与参照抗体序列不同的氨基酸产生的物理化学性质的变化,和或δ由与参照抗体序列不同的氨基酸产生的VHVL方向角度的不同;iv将最好的10个或最好的5个、最好的3个或最好的比对和排序的抗体之一鉴定为参照抗体的变体抗体。在一个实施方案中,步骤ii还包括用相同的编号方案注释序列并注释不同。在一个实施方案中,编号方案是KabatEU编号或Wolfguy编号方案。在一个优选的实施方案中,编号方案是Wolfguy编号方案。在一个实施方案中,不同以以下形式注释:参照抗体氨基酸残基-位置-变体抗体氨基酸残基。在一个实施方案中,变体抗体相对于参照抗体的突变被分组在突变元组中。在一个实施方案中,步骤ii进一步包括去除与参照抗体和或变体抗体之一的序列相同的序列,或者相对于参照抗体在不同氨基酸的数量、位置和或类型方面相同或相似的序列。在一个实施方案中,物理化学性质的变化由总电荷、疏水性和或大小的变化确定。在一个实施方案中,使用突变风险评分确定物理化学性质的变化。在一个实施方案中,基于下表确定风险评分,其中在该表中未明确给出的残基用值1加权:其中,WolfGuy索引位置101至125对应于重链可变结构域框架1,位置151至199对应于CDR-H1,位置201至214对应于重链可变结构域框架2,位置251至299对应于CDR-H2,位置301至332对应于重链可变结构域框架3,位置351至399对应于CDR-H3,位置401至411对应于重链可变结构域框架4。在一个实施方案中,突变风险评分取负值,其中较大的负值表示较大的功能丧失风险。在一个实施方案中,特异性结合与参照抗体相同的靶的变体抗体的多个至少10个、至少100个、至少1,000个、至少10,000个氨基酸序列或核酸序列从来自与参照抗体相同的免疫活动的B细胞获得,其中对表达抗原特异性抗体的B细胞进行B细胞富集。在一个实施方案中,富集通过抗原特异性分选或和细胞淘选或和非抗原特异性抗体产生B细胞耗尽进行。本文报道的一个方面是用于鉴定特异性结合相同靶抗原的参照抗体的变体抗体与参照抗体具有相当的生物学特性的方法,所述方法包括以下步骤:i确定生成测量α参照抗体的氨基酸序列或核酸序列,其中参照抗体特异性结合靶抗原,β参照抗体的至少一种生物学特性,γ通过对多个至少10个、至少100个、至少1,000个、至少10,000个变体抗体进行二代测序氨基酸序列或核酸序列,其中变体抗体与参照抗体特异性结合相同的靶抗原,任选地在从与参照抗体相同的免疫活动中获得;ii基于以下比对VH或和VL序列,以产生一组或多组相关的VHVL序列αVH或和VL的相同长度,或和β所有β-片层框架区的相同长度,或和γ所有HVRCDR的相同长度,或和δ相同的HVR3CDR3序列、框架和或HVRCDR1或2中允许的突变1至3个氨基酸交换,或和ε高度同源的HVR3CDR3序列允许的1或2个氨基酸交换和相同的HVRCDR1和2带有框架中带有允许的突变,或和ζ允许框架和HVRCDR中的突变;iii根据以下对ii的一组或多组中的比对序列排序α与参照抗体序列不同的氨基酸的数量,和或β与参照抗体序列不同的氨基酸的位置,和或γ由与参照抗体序列不同的氨基酸产生的物理化学性质的变化,和或δ由与参照抗体序列不同的氨基酸产生的VHVL方向角度的不同;iv将10个或5个或3个或最好的比对和排序的抗体之一鉴定为参照抗体的变体抗体。在一个实施方案中,步骤ii还包括用相同的编号方案注释序列并注释不同。在一个实施方案中,编号方案是KabatEU编号或Wolfguy编号方案。在一个优选实施方案中,编号方案是Wolfguy编号方案。在一个实施方案中,以以下形式注释不同:参照抗体氨基酸残基-位置-变体抗体氨基酸残基。在一个实施方案中,变体抗体相对于参照抗体的突变被分组在突变元组中。在一个实施方案中,步骤ii进一步包括去除与参照抗体和或变体抗体之一的序列相同的序列,或者相对于参照抗体在不同氨基酸的数量、位置和类型方面相同或相似的序列。在一个实施方案中,物理化学性质的变化由电荷、疏水性和或大小的变化确定。在一个实施方案中,使用突变风险评分确定物理化学性质的变化。在一个实施方案中,基于下表确定风险评分,其中在该表中未明确给出的残基用值1加权:其中Wolf-Guy索引位置101至125对应于重链可变结构域框架1,位置151至199对应于CDR-H1,位置201至214对应于重链可变结构域框架2,位置251至299对应于CDR-H2,位置301至332对应于重链可变结构域框架3,位置351至399对应于CDR-H3,位置401至411对应于重链可变结构域框架4位置501至523对应于轻链可变结构域框架1,位置551至599对应于CDR-L1,位置601至615对应于轻链可变结构域框架2,位置651至699对应于CDR-L2,位置701至734对应于轻链可变结构域框架3,位置751至799对应于CDR-L3,位置801至810对应于轻链可变结构域框架4。在一个实施方案中,突变风险评分取负值,其中较大的负值表示较大的功能丧失风险。在一个实施方案中,特异性结合与参照抗体相同的靶的变体抗体的多个至少10个、至少100个、至少1,000个、至少10,000个氨基酸序列或核酸序列从与参照抗体相同免疫活动的B细胞获得,其中对表达抗原特异性抗体的B细胞进行B细胞富集。在一个实施方案中,通过抗原特异性分选或和细胞淘选或和产生非抗原特异性抗体的B细胞的耗尽进行富集。本文报道的一个方面是用于鉴定特异性结合相同靶抗原的参照抗体的变体抗体具有与参照抗体相当的生物学特性的方法,所述方法包括以下步骤:a提供产生表达与参照抗体结合相同靶抗原的多个不同抗体的多个B细胞从与参照抗体相同的动物物种获得;b从多个B细胞中分离和扩增抗体编码核酸;c通过二代测序方法对编码抗体的核酸进行测序;d通过以下产生编码抗体的核酸序列的序列比对i基于以下比对VH或和VL序列,以生成一组或多组相关的VHVL序列:αVH或和VL的相同长度,或和β所有β-片层框架区的相同长度,或和γ所有HVRCDR的相同长度,或和δ相同的HVR3CDR3序列、允许的框架和或HVRCDR1或2中的突变1至3个氨基酸交换,或和ε高同源的HVR3CDR3序列允许的1或2个氨基酸交换和相同的HVRCDR1和2带有框架中允许的突变,或和ζ允许框架和HVRCDR中的突变;ii通过以下对ii的一组或多组中的比对序列排序α与参照抗体序列不同的氨基酸的数量,和或β与参照抗体序列不同的氨基酸的位置,和或γ由与参照抗体序列不同的氨基酸产生的物理化学性质的变化,和或δ由与参照抗体序列不同的氨基酸产生的VHVL方向角度的不同;e鉴定参照抗体的一个或多个变体抗体;f确定变体抗体的一种或多种生物学特性;和g选择具有相当的或改善的一种或多种生物学特性的变体抗体,从而鉴定参照抗体的变体抗体。本文报道的一个方面是用于鉴定特异性结合相同靶抗原的参照抗体的变体抗体具有与参照抗体相当的生物学特性的方法,所述方法包括以下步骤:i提供一个或多个含有DNA的样品,其包含多个编码抗体的核酸;ii使用共有序列特异性引物对i的每个样品中的编码抗体的核酸的区域进行PCR扩增,其中共有序列特异性引物结合多个编码抗体的核酸中的多个基因共同的共有序列,从而产生扩增产物的库;iii对所述扩增产物进行测序以确定每个核苷酸在每个位置的相对比例在测序读取中;iv在iii的测序读取结果和至少一个参照序列之间进行序列比对基于序列同一性,该参照序列对应于具有所需特性的抗体;和v鉴定参照抗体的一个或多个变体抗体。本文报道的一个方面是用于鉴定特异性结合相同的靶抗原的参照抗体的变体抗体具有与参照抗体相当的生物学特性的方法,所述方法包括以下步骤:a从包含编码抗体可变结构域的核酸的生物样品中扩增一个或多个感兴趣的区域,其中对于每个感兴趣的区域产生多个扩增子;b将适体和随机组分连接到a中产生的每个扩增子上并扩增每个所述延伸的扩增子;c对b中产生的包含随机组分的扩增子进行测序,其中产生冗余读取,并且其中冗余读取通过随机组分分组,并鉴定共有序列;d比较共有序列与参照序列,其中与参照序列不同的共有序列包含突变变异;和e基于步骤d的结果鉴定一个或多个变体抗体。在一个实施方案中,步骤a至c是a使包含一个或多个特异于生物样品中一个或多个感兴趣区域的引物对的引物库杂交,所述生物样品包含编码抗体可变结构域的核酸,从引物对的上游引物延伸至引物对的下游引物,将延伸产物连接到引物对的下游引物上,其中产生包含侧翼为扩增所需序列的感兴趣区域的产物;b连接包含随机组分的适体并将包含索引序列的适体连接到a的产物上并扩增每个所述延伸序列;c对b中产生的包含随机组分的产物进行测序,其中产生冗余读取,并且其中冗余读取通过随机组分分组,并鉴定共有序列。本文报道的一个方面是用于选择参照抗体可变结构域编码核酸的变体的方法,其中由所述编码核酸编码的参照抗体可变结构域氨基酸序列具有至少一个可开发性热点即包含至少一个翻译后修饰的氨基酸残基,其导致在其结合位点之一中包含所述参照抗体可变结构域的参照抗体的生物学特性的改变对其靶抗原的结合亲和力降低,该方法包括以下步骤:i提供多个含DNA样品分泌抗体的B细胞的基因组物质,每个样品包括一个或多个编码抗体可变结构域的核酸;ii使用共有序列特异性引物对i的编码抗体可变结构域的核酸进行PCR扩增,以获得扩增产物其中所述共有序列特异性引物结合对核酸中多个基因是共同的共有序列,从而产生扩增产物的库;iii对步骤ii中获得的多个扩增产物进行测序,以确定每个核苷酸在每个位置的相对比例在测序读取中;iv在iii的测序读取结果和参照抗体可变结构域编码核酸之间进行序列比对基于序列同一性;v在参照抗体可变结构域编码核酸作为完美模板参照序列的序列比对中,进行基于序列同一性同源性的编码抗体可变结构域的核酸的排序;和vi基于步骤v的序列排序选择编码变体抗体可变结构域的核酸,其中选择步骤vi中选择的变体抗体可变结构域,以便除去可开发性热点即,使其与参照抗体相比,包含少至少一个翻译后修饰的氨基酸残基,从而导致降低参照抗体的生物学特性的变化减少对其靶抗原的结合亲和力的降低,所述参照抗体在其结合位点之一中包含所述参照抗体可变结构域。在所有方面的一个实施方案中,可开发性热点翻译后修饰的氨基酸残基选自可变结构域中或HVR之一中的一个或多个未配对的Cys-残基、一个或多个糖基化位点、N-或O-糖基化位点中的氨基酸残基、或和一个或多个降解热点Asp、Asn或Met。本文报道的一个方面是用于选择参照抗体可变结构域的变体的方法,其中所述参照抗体可变结构域具有至少一个可开发性热点,该方法包括以下步骤:-接收通过测序来自多个B细胞克隆的核酸产生的测序数据,每个B细胞克隆产生特异性结合与参照抗体相同的靶的抗体;-比对测序数据与作为完美模板参照序列的参照抗体可变结构域的序列;-选择与参照抗体可变结构域序列具有最高结构功能同一性相似性但不具有可开发性热点的序列。在一个实施方案中,可开发性热点翻译后修饰的氨基酸残基选自可变结构域中或HVR之一中的一个或多个未配对的Cys-残基、一个或多个糖基化位点、N-或O-糖基化位点中的氨基酸残基、或和一个或多个降解热点Asp、Asn或Met。本文报道的一个方面是用于选择参照抗体可变结构域的变体的方法,其中所述参照抗体可变结构域具有至少一个可开发性热点,该方法包括本文报道的方法之一的步骤。本文报道的一个方面是用于产生抗体的方法,其包括以下步骤:-培养包含编码参照抗体的变体抗体的核酸的细胞,其中用本文报道的方法之一和表达功能性抗体所需的所有其他核酸获得所述核酸,-从细胞或培养基中回收抗体。本文报道的一个方面是包含用本文报道的方法之一获得的核酸的细胞。明确指出,每个方面也可以是不同方面的实施方案。本文报道的方法可用于鉴定不具有可开发性议题的参照抗体的替代性抗原特异性抗体变体。本文报道的方法甚至可以与多克隆血清一起使用,如通过使用这些“单克隆化的”NGS。发明的详细描述容易理解的是,如本文一般描述的实施方案是示例性的。以下对各种实施方案的更详细描述并非旨在限制本公开的范围,而是仅代表各种实施方案。此外,在不脱离本公开的范围的情况下,本领域技术人员可以改变本文公开方法的步骤或动作的顺序。换句话说,除非为了实施方案的正确操作需要特定的步骤或动作顺序,否则可以修改特定步骤或动作的顺序或使用。定义关于人免疫球蛋白轻链和重链的核苷酸序列的一般信息在以下文献中给出:Kabat,E.A.等人,SequencesofProteinsofImmunologicalInterest,第5版,PublicHealthService,NationalInstitutesofHealth,Bethesda,MD1991。如本文所用,重链和轻链所有恒定区和结构域的氨基酸位置根据Kabat等人,SequencesofProteinsofImmunologicalInterest,第5版,PublicHealthService,NationalInstitutesofHealth,Bethesda,MD1991中描述的Kabat编号系统编号,在文中称为“根据Kabat编号”。具体地,Kabat等人SequencesofProteinsofImmunologicalInterest,第5版,PublicHealthService,NationalInstitutesofHealth,Bethesda,MD1991的Kabat编号系统参见第647-660页用于kappa和lambda同种型的轻链恒定结构域CL,并且KabatEU索引编号系统参见第661-723页用于恒定重链结构域CH1、铰链、CH2和CH3,在本文中通过称为“根据KabatEU索引编号”进一步阐明。必须注意的是,如本文和所附权利要求中所使用的,单数形式“一a”,“一an”和“该the”包括复数指代,除非上下文另有明确说明。因此,例如,提及“一a细胞”包括多个这样的细胞及其本领域技术人员已知的等同物,等等。同样,术语“一a”或“一an”、“一个或多个”和“至少一个”在本文中可互换使用。还应注意,术语“包含”、“包括”和“具有”可互换使用。对于本领域技术人员来说,将氨基酸序列例如多肽的氨基酸序列转换为编码该氨基酸序列的相应核酸序列是众所周知的。因此,核酸的特征在于由各个核苷酸组成的其核酸序列,并且同样还在于由其编码的多肽的氨基酸序列。重组DNA技术的使用使得能够产生核酸的衍生物。例如,这些衍生物可以通过取代、改变、交换、缺失或插入在个别或几个核苷酸位置进行修饰。修饰或衍生化可以例如通过定点诱变的方法进行。这些修饰可以由本领域技术人员容易地进行参见例如Sambrook,J.等人,MolecularCloning:Alaboratorymanual1999ColdSpringHarborLaboratoryPress,NewYork,USA;Hames,B.D.,和Higgins,S.G.,Nucleicacidhybridization–apracticalapproach1985IRLPress,Oxford,England。用于实施本发明的有用方法和技术描述于例如Ausubel,F.M.编辑,CurrentProtocolsinMolecularBiology,VolumesItoIII1997;Glover,N.D.,和Hames,B.D.,编辑,DNACloning:APracticalApproach,第I和II卷1985,OxfordUniversityPress;Freshney,R.I.编辑,AnimalCellCulture–apracticalapproach,IRLPressLimited1986;Watson,J.D.等人,RecombinantDNA,第2版,CHSLPress1992;Winnacker,E.L.,FromGenestoClones;N.Y.,VCHPublishers1987;Celis,J.编辑,CellBiology,第2版,AcademicPress1998;Freshney,R.I.,CultureofAnimalCells:AManualofBasicTechnique,第2版,AlanR.Liss,Inc.,N.Y.1987。术语“约”表示其后跟随的数值的+-20%的范围。在一个实施方案中,术语“约”表示其后跟随的数值的+-10%的范围。在一个实施方案中,术语“约”表示其后跟随的数值的+-5%的范围。术语“聚糖”表示多糖或寡糖。本文还使用聚糖来指糖缀合物的碳水化合物部分,糖缀合物如糖蛋白、糖脂、糖肽、糖蛋白质组、肽聚糖、脂多糖或蛋白聚糖。聚糖通常仅由单糖之间的为β糖苷键的单糖组成。聚糖可以是单糖残基的均聚物或杂聚物,并且可以是直链或支链的。本文的术语“抗体”以最广泛的含义使用,并且包括各种抗体结构,包括但不限于单克隆抗体、多克隆抗体和多特异性抗体例如双特异性抗体,只要它们表现出所需的抗原结合活性即可。如本文所用的术语“二代测序”表示一种包括大规模平行测序的方法,其提供比传统测序例如传统的Sanger测序高得多的序列输出。该术语通常也被定义为“深度测序”或“第二代测序”Metzker,M.L.,Nat.Rev.Genet.11201031-46;Mardis,E.R.,Annu.Rev.Genom.Hum.Genet.92008387-402。使用二代测序方法允许在非常短的时间内获得测序数据。可商购获得用于进行二代测序的不同技术,例如焦磷酸测序454LifeSciences,RocheDiagnosticsCorp.,Basel,Switzerland、通过合成测序HiSeqTM和MiSeqTM,Illumina,Inc.,SanDiego,CA、通过连接测序SOLiDTM,LifeTechnologiesCorp.Logan,UT、Polonator测序、离子半导体测序IonPGMTM,和IonProtonTM,LifeTechnologiesCorp.,Logan,UT、IonTorrent测序、纳米孔测序、单分子实时测序SMRTTM,PacificBiosciences,MenloPark,CA、HeliScope单分子测序、隧道电流测序、杂交测序、质谱测序、微流体Sanger测序、RNA聚合酶RNAP测序等等。术语“测序平台”表示用于测序核酸的系统,包括基因组DNAgDNA、互补DNAcDNA和RNA。该系统可包括一个或多个机器或设备例如,扩增机器、测序机器、检测设备等、数据存储和分析设备例如,硬盘驱动器、远程存储系统、处理器等、试剂例如,引物、探针、接头、标签、NTP等及用于它们使用的特定方法。例如,通过合成测序和焦磷酸测序和不同平台。术语“读取read”表示确定特定多核苷酸中核苷酸的特定位置或序列的核苷酸同一性的单个实例。如果在测序分析中确定核苷酸或多核苷酸序列X次,则对于该核苷酸或多核苷酸存在“X读取”或“X的读取深度”或“X的读取覆盖率”。如本文所用,术语“高变区”或“HVR”是指抗体可变结构域的每个区域,其在序列上高变“互补决定区”或“CDR”和或形成结构上限定的环“高变环”的氨基酸残基区段,和或含有抗原接触残基“抗原接触”的氨基酸残基区段。通常,抗体包含六个HVR;三个在VH中H1、H2、H3和三个在VL中L1、L2、L3。本文的HVR包括a在氨基酸残基26-32L1、50-52L2、91-96L3、26-32H1、53-55H2和96-101H3处存在的高变环Chothia,C.和Lesk,A.M.,J.Mol.Biol.1961987901-917;b在氨基酸残基24-34L1、50-56L2、89-97L3、31-35bH1、50-65H2和95-102H3处存在的CDRKabat,E.A.等人,SequencesofProteinsofImmunologicalInterest,第5版PublicHealthService,NationalInstitutesofHealth,Bethesda,MD1991,NIHPublication91-3242;c在氨基酸残基27c-36L1、46-55L2、89-96L3、30-35bH1、47-58H2和93-101H3处存在的抗原接触MacCallum等人J.Mol.Biol.262:732-7451996;和da、b和或c的组合,包括HVR氨基酸残基46-56L2、47-56L2、48-56L2、49-56L2、26-35H1、26-35bH1、49-65H2、93-102H3和94-102H3。除非另有说明,否则可变结构域中的HVR残基和其他残基例如FR残基在本文中根据Kabat等人,同上编号。“分离的”抗体是一种已经从其天然环境的组分分离的抗体。在一些实施方案中,将抗体纯化至大于95%或99%的纯度,如,例如通过电泳例如,SDS-PAGE、等电聚焦IEF、毛细管电泳或色谱法例如,离子交换或反相HPLC测定的。关于评估抗体纯度的方法的综述,参见,例如,Flatman,S.等人,J.Chromatogr.B848200779-87。“分离的”核酸是指已经从其天然环境的组分分离的核酸分子。分离的核酸包括通常含有核酸分子的细胞中含有的核酸分子,但核酸分子存在于染色体外或不同于其天然染色体位置的染色体位置。如本文所用的术语“单克隆抗体”是指从基本上同质的抗体群获得的抗体,即,组成群的各个抗体是相同的和或结合相同的表位,除了可能的变体抗体,例如,含有天然发生的突变或在单克隆抗体制剂的生产过程中产生的突变,这些变体通常以少量存在。与通常包括针对不同决定簇表位的不同抗体的多克隆抗体制剂相反,单克隆抗体制剂的每种单克隆抗体针对抗原上的单一决定簇。因此,修饰语“单克隆”表示抗体的特征是从基本上同质的抗体群获得的,并且不应解释为需要通过任何特定方法产生抗体。例如,根据本发明使用的单克隆抗体可以通过多种技术制备,包括但不限于杂交瘤方法、重组DNA方法、噬菌体展示方法和利用含有全部或部分人免疫球蛋白基因座的转基因动物的方法。抗体的“类别”是指其重链具有的恒定结构域或恒定区的类型。存在抗体的五种主要类型:IgA、IgD、IgE、IgG和IgM,并且这些中的一些可以进一步分为亚类同种型,例如IgG1、IgG2、IgG3、IgG4、IgA1和IgA2。对应于不同类别免疫球蛋白的重链恒定结构域分别称为α、δ、ε、γ和μ。术语“N-连接的寡糖”表示通过天冬酰胺-N-乙酰基葡糖胺键在天冬酰胺氨基酸残基上与肽主链连接的寡糖。N-连接的寡糖也称为“N-聚糖”。所有N-连接的寡糖具有Man3GlcNAc2的共同五糖核心。它们在外周糖的存在和支链也称为触角数量方面不同,所述外周糖如N-乙酰基葡糖胺、半乳糖、N-乙酰半乳糖胺、岩藻糖和唾液酸。任选地,该结构还可含有核心岩藻糖分子和或木糖分子。N-连接的寡糖与天冬酰胺或精氨酸侧链的氮连接。N-糖基化基序,即N-糖基化位点,包含Asn-X-SerThr共有序列,其中X是除脯氨酸之外的任何氨基酸。因此,N-糖基化位点中的氨基酸残基可以是Asn-X-SerThr共有序列中的任何氨基酸残基,其中X是除脯氨酸之外的任何氨基酸。在一个实施方案中,是N-糖基化位点中的氨基酸残基Asn、Ser或Thr。术语“O-连接的寡糖”表示在苏氨酸或丝氨酸氨基酸残基处与肽主链连接的寡糖。在一个实施方案中,是O-糖基化位点中的氨基酸残基Ser或Thr。术语“糖基化状态”表示抗体的特定或所需的糖基化模式。“糖型”是包含特定糖基化状态的抗体。此类糖基化模式包括,例如,在抗体Fc区的N-297位置根据Kabat编号连接一个或多个糖,其中所述糖是天然、重组、合成或半合成产生的。可通过本领域已知的许多方法测定糖基化模式。例如,在US20060057638和US20060127950中报道了分析蛋白质上碳水化合物的方法其公开内容通过引用整体并入本文。术语“可变区”或“可变结构域”是指抗体重链或轻链的结构域,其参与抗体与抗原的结合。天然抗体的重链和轻链分别为VH和VL的可变结构域通常具有相似的结构,每个结构域包含四个保守构架区FR和三个高变区HVR。参见,例如,Kindt,T.J.等人KubyImmunology,第6版,W.H.FreemanandCo.,N.Y.2007,第91页。单个VH或VL结构域可足以赋予抗原结合特异性。此外,可以使用来自结合抗原的抗体的VH或VL结构域分离结合特定抗原的抗体,以筛选分别互补VL或VH结构域的文库。参见,例如,Portolano,S.等人,J.Immunol.1501993880-887;Clackson,T.等人,Nature3521991624-628。可以基于“百分比%序列同一性”进行变体氨基酸序列或变体核酸序列相对于参照氨基酸序列或参照核酸序列的比对。“百分比%序列同一性”定义为在比对序列并且如果需要引入缺口以实现最大百分比序列同一性后,变体序列中与参照序列中的残基相同的残基的百分比。可以以本领域技术范围内的各种方式实现比对,例如,使用可公开获得的计算机软件,如BLAST、BLAST-2、ALIGN或MegalignDNASTAR软件。本领域技术人员可确定用于比对序列的适当参数,包括在所比较的序列全长上实现最大比对所需的任何算法。然而,为了本文的目的,使用序列比较计算机程序ALIGN-2产生%序列同一性值。ALIGN-2序列比较计算机程序由Genentech,Inc.授权,并且源代码已经在美国版权局华盛顿特区,20559在用户文档中提交,其在美国版权登记号TXU510087下注册。ALIGN-2程序可从加利福尼亚州南旧金山的Genentech,Inc.公开获得,或者可以从源代码编译。应编译ALIGN-2程序以在UNIX操作系统上使用,包括数字UNIXV4.0D。所有序列比较参数均由ALIGN-2程序设置,没有改变。在使用ALIGN-2进行序列比较的情况下,如下计算给定变体序列A与、和、或相对于给定参照序列B的%序列同一性或者可以表述为给定变体序列A具有或包含与、和、或相对于给定参照序列B的某一%序列同一性:100乘以XY的分数其中X是序列比对程序ALIGN-2其中程序比对A和B评分为相同匹配的残基数,其中Y是B中总的残基数。可以理解,序列A的长度不等于序列B的长度时,A与B的%序列同一性不等于B与A的%序列同一性。本申请中使用的术语“糖结构”表示在特定氨基酸残基处的单个、限定的N-或O-连接的寡糖。因此,术语“具有G1糖结构的抗体”表示根据Kabat编号方案在约氨基酸位置297处包含天冬酰胺氨基酸残基的抗体或在FAB区中包含双触角寡糖的抗体,其在寡糖的非还原端仅包含一个末端半乳糖残基。本申请中使用的术语“寡糖”表示包含两个或更多个共价连接的单糖单元的聚合糖。术语“可开发性热点”表示多肽的氨基酸序列例如,抗体可变结构域内的氨基酸残基,其是翻译后修饰的,即易于发生翻译后修饰。这种翻译后修饰导致一种生物学特性例如,在抗体可变结构域的情况下抗原结合改变,例如,减少或丧失。术语“翻译后修饰”表示生物合成后多肽内氨基酸残基的共价修饰。通过修饰现有的官能团或引入新的官能团,可以在氨基酸侧链上发生翻译后修饰。常见翻译后修饰为:对于Ala是N-乙酰化;对于Arg是脱亚氨基化、甲基化;对于Asn是脱酰胺化、N-连接糖基化;对于Asp是异构化;对于Cys是二硫键形成、氧化、棕榈酰化、N-乙酰化、S-亚硝基化;对于Gln是环化;对于Glu是环化、γ-羧化;对于Gly是N-豆蔻酰化、N-乙酰化;对于His是磷酸化;对于Lys是乙酰化、泛素化、SUMO化、甲基化、羟基化;对于Met是N-乙酰化、氧化;对于Pro是羟基化;对于Ser是磷酸化、O-连接糖基化、N-乙酰化;对于Thr是磷化、O-连接糖基化、N-乙酰化;对于Trp是氧化、犬尿氨酸形成;对于Tyr是硫酸化、磷酸化;对于Val是N-乙酰化。术语“抗体的结合位点”表示轻链可变结构域和重链可变结构域的对。抗体糖基化人抗体主要在重链CH2结构域或FAB区中的约297位置Asn297上的天冬酰胺残基上糖基化,其中具有或多或少岩藻糖基化的双触角复合寡糖抗体氨基酸残基根据Kabat,同上编号。在每个臂中双触角糖结构可以以至多两个连续的半乳糖Gal残基终止。臂根据与中心甘露糖残基的糖苷键表示为1,6和1,3。表示为G0的糖结构不包含半乳糖残基。表示为G1的糖结构在一个臂中含有一个或多个半乳糖残基。表示为G2的糖结构在每个臂中含有一个或多个半乳糖残基Raju,T.S.,BioprocessInt.1200344-53。人恒定重链区详细报道在Kabat,同上和Brueggemann,M.等人,J.Exp.Med.16619871351-1361;Love,T.W.等人,MethodsEnzymol.1781989515-527。抗体Fc区的CHO型糖基化描述于例如Routier,F.H.,GlycoconjugateJ.141997201-207。抗体通常包含两个所谓的全长轻链多肽轻链和两个所谓的全长重链多肽重链。全长重链和轻链多肽中的每一个含有可变结构域可变区通常是全长多肽链的氨基末端部分,其包含与抗原相互作用的结合区。全长重链和轻链多肽中的每一个包含恒定区通常是羧基末端部分。全长重链的恒定区介导抗体i与携带Fcγ受体FcγR的细胞如吞噬细胞或ii携带新生儿Fc受体FcRn也称为Brambell受体的细胞的结合。其还介导与某些因子的结合,包括经典补体系统的因子,如组分C1q。全长抗体的轻链或重链的可变结构域又包含不同的区段,即四个框架区FR和三个高变区CDR。“全长抗体重链”是在N末端至C末端方向上由抗体重链可变结构域VH、抗体恒定结构域1CH1、抗体铰链区、抗体恒定结构域2CH2、抗体恒定结构域3CH3和任选地在亚类IgE抗体的情况下,抗体恒定结构域4CH4组成的多肽。“全长抗体轻链”是在N末端至C末端方向上由抗体轻链可变结构域VL和抗体轻链恒定结构域CL组成的多肽。全长抗体链通过CL结构域和CH1结构域之间以及全长抗体重链的铰链区之间的多肽间二硫键连接在一起。近年来已经报道,抗体的糖基化模式,即糖组成和多种连接的糖结构,对生物学性质具有强烈影响参见例如Jefferis,R.,Biotechnol.Prog.21200511-16。由哺乳动物细胞产生的抗体含有2-3质量%的寡糖Taniguchi,T.等人,Biochem.2419855551-5557。例如,在G类抗体IgG中这等同于小鼠源IgG中的2.3个寡糖残基Mizuochi,T.等人,Arch.Biochem.Biophys.2571987387-394,以及人源IgG中的2.8个寡糖残基Parekh,R.B.等人,Nature3161985452-457,其中通常两个位于Fc区中的Asn297上,剩余的在可变区中Saba,J.A.等人,Anal.Biochem.305200216-31。对于不同N-或O-连接的寡糖的注释,从寡糖分子的非还原端到还原端列出各个糖残基。选择最长的糖链作为表示的基本链。N-或O-连接的寡糖的还原端是单糖残基,其直接与抗体氨基酸主链的氨基酸结合,而位于基本链还原端的相对末端的N-或O-连接的寡糖末端,被称为非还原端。所有寡糖描述为非还原糖的名称或缩写即Gal,然后是糖苷键α或β、环键1或2、参与键合的还原糖的环位置2、3、4、6或8、然后是还原糖的名称或缩写即GlcNAc的配置。各糖优选为吡喃糖。有关标准糖生物学命名法的综述,参见EssentialsofGlycobiologyVarki等人编辑,1999,CSHL出版社。术语“确定的糖结构”在本申请中表示糖结构,其中糖结构的非还原端的单糖残基是特定种类。术语“确定的糖结构”在本申请中表示糖结构,其中糖结构的非还原端的单糖残基被确定并且是特定种类。翻译后易于修饰的氨基酸残基Asn和Asp残基在形成环状琥珀酰亚胺中间体之前共享共同的降解途径。在后续氨基酸的主链氮对AsnAsp侧链γ-羰基的亲核攻击引起Asn的脱酰胺化或Asp脱水后,由分子内重排导致琥珀酰亚胺的形成。亚稳态环状酰亚胺可以在其两个羰基中的任一个上水解,以不同的比例形成天冬氨酰或异天冬氨酰键,这取决于水解条件和构象限制。此外,提出了替代的降解机制,如通过主链羰基氧的亲核攻击形成环状异酰亚胺或直接水辅助水解Asn至Asp。本领域技术人员已知几种分析方法,主要是电荷敏感方法,如离子交换色谱法或等电聚焦,用于检测任一降解产物,即琥珀酰亚胺、Asp或isoAsp。最适合用于蛋白质中降解位点的定量和定位的是通过液相色谱串联质谱LC-MSMS进行的分析。Wolfguy编号方案Wolfguy编号将CDR区定义为Kabat和Chothia定义的集合并。此外,编号方案基于CDR长度并且部分地基于序列注释CDR环尖端,使得CDR位置的索引指示CDR残基是否是升序或降序环的一部分。与已建立的编号方案的比较如下表所示。表:使用ChothiaKabatCh-Kb、Honegger和Wolfguy编号方案的CDR-L3和CDR-H3的编号。后者具有从N末端基部到CDR峰的递增编号和从C末端CDR端开始的递减编号。Kabat方案固定最后两个CDR残基,并引入字母以适应CDR长度。与Kabat命名法相反,Honegger编号不使用字母,并且对于VH和VL是共同的。设计Wolfguy使得结构上等同的残基即在Fv结构中保守空间定位方面非常相似的残基尽可能用等同的索引编号。这在图1中说明。Wolfguy编号的全长VH和VL序列的实例可以在下表中找到。表:用Wolfguy、Kabat和Chothia编号的具有PDBID3PP421的晶体结构的VH左和VL右序列。在Wolfguy中,CDR-H1-H3、CDR-L2和CDR-L3仅根据长度编号,而CDR-L1根据环长度和典型聚簇成员编号。后者通过计算与不同共有序列的序列相似性来确定。在这里,我们仅给出CDR-L1编号的单个示例,因为它对于生成我们的VH-VL方向序列指纹并不重要。二代测序NGSa样品制备在某些方面,本文报道的方法部分地包括从包含核酸的生物样品中扩增一个或多个感兴趣区域。对于每个感兴趣区域,扩增产生多个扩增子。扩增在一个或多个引物对的存在下发生。引物对的第一引物包含与感兴趣区域的上游部分互补的序列,引物对的第二引物包含与感兴趣区域的下游部分互补的序列。设计引物对使其与核酸的互补链退火即引物对的一个引物与正义链退火,引物对的一个引物与反义链退火。可以基于待扩增的感兴趣区域改变互补序列。引物对的互补序列可包含与感兴趣区域互补的约10至约100个核苷酸。使一个或多个引物对与包含核酸的样品接触。核酸可以是例如RNA或DNA。可以使用修饰形式的RNA或DNA。在一个示例性实施方案中,核酸是cDNA。通常,使用聚合酶链反应PCR进行感兴趣区域的扩增。PCR反应可在单个反应小瓶中包含样品其包含核酸、一个或多个引物对、聚合酶、水、缓冲液和三磷酸脱氧核苷酸dNTP。可以根据本领域的标准方法进行PCR。作为非限制性实例,PCR反应可包括变性,然后进行约15至约30个循环的变性、退火和延伸,然后进行最终延伸。b测序文库制备在某些方面,本文报道的方法部分地包括将适体和或索引序列连接至部分a中产生的每个扩增子或产物。在一个实施方案中,通过PCR将包含适体、随机组分和或索引序列的核苷酸序列与扩增子或产物连接。例如,可以使扩增子或产物与包含适体和索引序列的核苷酸序列接触,并进行PCR反应。然后,使该产物与包含适体的核苷酸序列接触,并进行PCR反应。所得产物是包含适体、感兴趣区域、索引序列和下游适体的核苷酸序列。或者,可以使扩增子或产物与包含适体和随机组分的核苷酸序列接触,并进行PCR反应。然后,使该产物与包含适体和索引序列的核苷酸序列接触,并进行PCR反应。所得产物是包含适体、索引序列、感兴趣区域、随机组分和下游适体的核苷酸序列。然后对包含适体、随机组分和或索引序列的产物或扩增子进行指数PCR。在一个实施方案中,指数PCR反应可以在单个反应小瓶中包含产物或扩增子其包含适体、随机组分和或索引序列、引物、聚合酶、水、缓冲液和脱氧核苷酸三磷酸dNTP。可以根据本领域的标准方法进行指数PCR。作为非限制性实例,指数PCR反应可包括变性,然后进行约15-30个循环的变性、退火和延伸,然后进行最终延伸。在进行指数PCR时,扩增包含适体和或索引序列的产物或扩增子。指数PCR产物包含适体、感兴趣区域、下游适体和索引序列。c测序在某些方面,本文报道的方法部分包括对指数PCR产物进行测序。对指数PCR产物的测序产生冗余读取。冗余读取按随机组分分组,并鉴定共有序列,使得冗余读取减少序列错误。可以根据本领域的标准方法进行测序。优选在大规模平行测序平台上进行测序,这些测序平台中的许多是商业上可获得的,包括但不限于Illumina、Roche454、IonTorrent和PacBIO。在示例性实施方案中,使用Illumina测序。读取可以通过索引序列分开并修剪以去除引物序列。可以通过随机组分对读取进行分组。在某些实施方案中,可以除去具有少于三个、少于四个或少于五个读取的读取组。为了消除模糊序列,可以按丰度对随机组分进行分类,并以约85%的同一性聚簇。或者,可以按丰度对随机组分进行分类,并以约65%至约95%的同一性聚簇。可以从最大丰度到最小丰度对随机组分聚簇。鉴于大多数测序错误是随机的,并且正确的序列应该比具有测序错误的变体更频繁地发生,丰度加权聚簇提供了消除最有可能由于测序错误导致的假随机组分、同时保留丰度更高并且很可能是真正阳性的随机组分的方法。每个扩增子或产物的这种冗余测序允许每个扩增子或产物的错误校正。例如,通过在每个碱基位置对核苷酸进行评分和加权,为每个随机组分组产生共有序列。保留具有与相同随机组分相关的最高丰度序列相同的共有序列的序列;这个过程称为质量过滤。具体地,在每个位置,比较每个序列读取所调用的核苷酸,如果读取之间存在至少约90%的一致性,则调用共有核苷酸。如果一致性小于约90%,则在该位置的共有序列中调用“N”。d与参照序列比较在鉴定错误校正的共有序列ECCS之后,可以将ECCS与参照序列进行比较以确定一个或多个不同的存在。参照序列可以是抗体序列,其中搜索具有相同生物学特性但没有负性特征的变体,如搜索可开发性议题热点。本文报道的方法在本领域中,通常通过以下方法来鉴定备用替代候选物:在氨基酸序列中引入突变以解决例如原始候选物的可开发性责任或对没有选择de-selected的抗体进行从头筛选。在第一种情况下,不能排除由于去除可开发性责任也可能影响抗体的结合和或治疗性质。在后一种情况下,是否可以找到真正的替代候选物是值得怀疑的。通过使用二代测序NGS,与先前方法相比,可测序的B细胞克隆的数量显著增加。但是,只有在早期筛选中显示出有前途特性的克隆才会被进一步探索。对于其他克隆,将简单地存储序列数据。也就是说,并非所有测序的克隆都将被表达和完全表征。现在已经发现,在项目中获得的NGS数据的这种未使用的潜力可以用于鉴定lead候选物的一个或多个替代候选物,其中替代候选物不具有例如原始lead抗体的一种或多种可开发性责任,例如,易于发生翻译后修饰的氨基酸残基或分离的半胱氨酸残基。通过使用NGS序列信息基于氨基酸核苷酸序列鉴定与所选候选物密切相关的抗体并且同时保持lead候选物的至少一种生物学结合特性来实现这种鉴定和选择,即包含可开发性热点的参照抗体。在所有方面的一个实施方案中,高度多样性文库包括在原始抗原特异性文库中,以增加文库多样性并允许更好的测序。例如,可以使用IlluminaInc.出售的基因组PhiX文库。在所有方面的一个实施方案中,使用Illumina技术进行扩增和测序步骤。在这种情况下,在扩增步骤期间,根据Illumina的说明,将称为适体并且是后续测序步骤所需的特定子序列添加到核苷酸片段中。在所有方面的一个优选实施方案中,在测序前进行两次PCR。在一个实施方案中,使用市售的MiSeq试剂盒IlluminaInc.进行测序。在所有方面的一个实施方案中,使用配对末端测序方法进行测序,其中同时测序核苷酸片段的两端。这允许更快速的测序,并且在长片段的情况下特别有用。在所有方面的一个实施方案中,使用多重技术,使得可以在相同的运行期间对不同的样品进行测序,从而允许快速和同时分析样品文库的许多组合。为了进行多重测序,通常在使用特异性PCR引物的扩增步骤期间添加特定序列条形码或索引。例如,市售的MiSeq试剂盒提供配对末端测序和多重测序。可以通过能够处理由测序产生的数据的软件来进行测序数据的分析。合适的软件工具是市售的。合适软件的一个例子是BWABurrows-WheelerAligner,参见LiH.和DurbinR.2009LiH.和DurbinR.2009FastandaccurateshortreadalignmentwithBurrows-WheelerTransform.Bioinformatics,25:1754-60的工作。另一个合适的软件是FastQC参见网站:www.bioinformatics.babraham.ac.ukprojectsfastqc,这是一种分析和控制高通量序列数据的工具。在其他情况下,根据本文报道的方法,一个或多个共有序列特异性引物可进一步包含标签和或适体。当前方法在一个具体实施方案中包括以下一般步骤:-组装配对的IlluminaMiSeq读取,例如,通过计算机程序可选地包括校正:MolecularIdentifierGroup-basedErrorCorrectionMiGec软件流水,其允许UMI条形码提取和基于完整VH序列的共有构建的错误校正;-抗体可变结构域的提取,任选地包括校正:序列复制校正,仅考虑n≥3个CDR3簇、信号肽检测和质量评估;-结构指导的抗体变体的聚簇和排序;和-就其保留VHVL配对、结合和功能的能力,相对于参照序列排序突变,任选地,排序基于矩阵并且还取决于突变的保守性。结构指导的抗体变体的聚簇和排序SCaRAb抗体可变区变体表征本文报道的方法基于给定的参照抗体,其中重链可变区VH序列和轻链可变区VL序列是已知的随后表示为“参照”或“参照抗体”。另外,存在一组已知的VH和或VL序列,其可被认为与参照抗体的VH和或VL序列相关随后表示为“变体”或“变体抗体”,例如,衍生自在与参照抗体相同的免疫活动中获得的B细胞。参照及其变体之间的关系是可以基于,例如,iVH和VL序列的相同长度,ii所有β-片层框架区的相同长度,或和iii所有互补决定区CDR的相同长度。比对选择各序列的标准取决于可获得的数据库。如果可获得有限数量的变体,则标准应该减低严格性,而当可获得大量变体时,标准可以应该更严格以便鉴定最可能的变体。例如,整个VH和或VL中的突变数可以用作允许小于10、小于9、小于8、小于7、小于6、小于5、小于4的标准。但必须注意的是,随着允许的突变数,变体与参照抗体不具有相同相当的结合特性的可能性正在增加。或者,可以使用如在氨基酸或和核酸水平上HVR3CDR3中小于“x”个突变、所有HVRCDR中小于“y”个突变、所有FR中小于“z”个突变、总共小于“n”个突变或其组合作为标准。如果选择的标准是去除可开发性热点,则比对选择标准可以是:-在HVRCDR中没有游离半胱氨酸;-在可变结构域中没有降解倾向的Asp、Asn、Met残基基序。然后使用建立的注释方案注释参照序列及其变体,例如,Wolfguy抗体编号方案Bujotzek,A.等人,Prot.Struct.Funct.Bioinform.,832015681-695。这在整个方法中使用,即它用于本文报道的方法中的所有和任何位置的注释。Wolfguy注释的VH参照序列及其变体的示例可以在图1中找到。一旦基于残基索引对注释的VH和VL序列进行比对,可以在紧凑的“突变元组”方面描述变体,其仅描述相对于参照的序列不同即,取代氨基酸的类型和位置。使用抗体763的VH变体在下表中说明该原理。表:参照抗体763的六种VH变体的突变元组符号也参见图1。突变元组是串联的一系列字符串,每个字符串指定i参照序列中存在的氨基酸类型1字母代码,ii氨基酸所在的Wolfguy位置,和iii序列变体的氨基酸类型1字母代码,如果它不与参照序列之一匹配。聚簇因为给定的一组序列变体可以是大且冗余的,所以进行聚簇以鉴定在相应氨基酸取代的数量、位置和类型方面相同或相似的变体是有意义的。为此目的,例如,可以使用成熟确立的k-medoids聚簇算法。对于当前情况抗体可变结构域,k的合适下限是数据组中不同突变元组长度的数量。例如,如果要聚簇的数据组由变体T322P、R306K、E211A,R306K和Q102P,S103P,S125P,Y196S,R306K组成,则k的最小值应设置为3,允许对元组长度1、2和5进行分别聚簇。如果需要,可以进一步增加k的值以基于氨基酸取代的位置实现更精细的聚簇。为了对由突变元组描述的序列变体进行基于k-medoids的聚簇,可以设计新的距离度量,其结合了氨基酸取代的抗体特异性位置以及交换的近似物理化学性质。后者使用BLOSUM62氨基酸取代矩阵定量Henikoff,S.和Henikoff,J.G.,Proc.Nat.Acad.Sci.,89199210915-10919。这是按照以下概述完成的。给出两个示例性突变元组E211A,R306K和Y293D,S295N,T322P:1.计算两个元组之间基于位置的距离矩阵残基编号中的距离:293-211=82等:2.挑取具有最小距离的突变对:S295N和R306K残基编号距离为11。该对的距离贡献是11+absBLOSUM62S,N-BLOSUM62R,K2。更新距离矩阵,以便删除所采用的对:重复步骤步骤2,直到所有突变都配对。3.如果每个元组的突变数不匹配,则保留未配对的突变在本实施例中为T322P。为了解释未配对突变T322P,向距离添加310+absBLOSUM62T,T-BLOSUM62T,P2根据VHWolfguy索引411-101,值310是理论最大距离。重复步骤3直到考虑所有未配对的突变。在该实施例中,两个突变元组之间的距离为:mutation_tuple_dist[E211A,R306K,Y293D,S295N,T322P]=sqrt11+absBLOSUM62S,N–BLOSUM62R,K2+82+absBLOSUM62Y,D–BLOSUM62E,A2+310+absBLOSUM62T,T–BLOSUM62T,P2=sqrt122+842+3162≈327.194突变风险评分突变风险评分是定量由上述突变元组指定的抗体变体将失去参照抗体显示的功能的风险的手段其中该功能通常是对给定靶抗原的结合亲和力。突变风险评分总是取负值,较大的负值表示较大的功能丧失风险。突变风险评分结合BLOSUM62矩阵,根据所产生的生化特性如电荷、疏水性和大小变化评级氨基酸取代的严重性。此外,突变风险评分包含抗体可变区位置特异性加权因子,以解释发生氨基酸取代的位置。例如,属于通常参与抗原结合的CDR的残基的权重高于不太可能参与抗原结合的外周残基。对于由XiposiYi形式的n个突变串组成的给定突变元组,突变风险评分计算如下:下表指定了VH结构域保守位置的抗体特异性权重。未在此表中明确给出的残基用值1加权。残基用Wolfguy编号方案编号。表:框架左和CDR区右的VH结构域的保守位置的抗体特异性权重。ABangle距离除了定量给定变体的突变风险之外,评估变体是否可能保留参照抗体的VH-VL方向是有意义的。目的是获得保留与参照抗体相同的抗原结合特性和稳定性的抗体变体。为此目的,使用由Dunbar等人Prot.Eng.Des.Sel.262013611-620定义的六个ABangle方向量度HL、HC1、LC1、HC2、LC2和dc五个角度和一个线性距离量度来表征VH-VL方向。使用Bujotzek等人Bujotzek,A.等人,Prot.Struct.Funct.Bioinform.,832015681-695描述的基于机器学习的方法预测参照抗体及其变体的各个ABangle值。在该方法中,从VH和VL结构域之间的结构域界面上影响残基的序列指纹预测VH-VL方向的参数。ABangle的概念当在任何两个基于氨基酸的结构之间进行比较时,通常使用基于距离的度量,如等同原子的均方根偏差RMSD。为了表征任何两个三维对象之间的方向,需要定义:-每个对象的参照框架。-测量关于方向参数的轴。-描述和定量这些参数的术语。ABangle的概念是一种使用五个角度HL、HC1、LC1、HC2和LC2和距离dc以一致和绝对意义完全表征VH-VL方向的方法。抗体的一对可变结构域VH和VL统称为抗体Fv片段。在第一步中,从数据库例如蛋白质数据库,PDB提取抗体结构。将Chothia抗体编号Chothia和Lesk,1987应用于每个抗体链。成功编号的链配对形成Fv区域。这通过应用约束重链的H37位置Cα坐标重链可变结构域位置37处的氨基酸残基的α碳原子必须在轻链的L87位置Cα坐标的内来完成。使用CDHITLi,W.和Godzik,A.Bioinformatics,2220061658–1659产生非冗余的抗体组,在99%的Fv区框架上应用序列同一性截止值。重链结构域和轻链结构域中结构上最保守的残基位置用于定义结构域位置。这些位置表示为VH和VL核心组。这些位置主要位于框架的β-链上,并形成每个结构域的核心。核心组位置如下表所示:核心组位置用于将参照框架登记到抗体Fv区结构域上。使用例如CDHIT对非冗余数据组中的VH结构域进行聚簇,在结构域中的框架位置上应用80%的序列同一性截止值。从30个最大簇的每一个中随机选择一种结构。该结构域组在VH核心组位置上比对,例如使用Mammoth-multLupyan,D.等人,Bioinf.2120053255–3263。从该比对中,提取对应于β-片层界面中的八个结构上保守的位置H36、H37、H38、H39、H89、H90、H91和H92的Cα坐标。通过得到的240个坐标拟合平面。对于VL结构域,位置L35、L36、L37、L38、L85、L86、L87和L88用于拟合平面。上述步骤允许将两个参照框架平面绘制到任何Fv结构上。因此,测量VH-VL方向可以等同于测量两个平面之间的方向。为了完全这样做,绝对意义上需要至少六个参数:距离、扭转角度和四个弯曲角度。必须针对连接平面的一致定义的向量测量这些参数。该向量在下面表示为C。为了鉴定C,将参照框架平面登记到如上所述的非冗余组中的每个结构上,并且将网格放置在每个平面上。因此,每个结构具有等同的网格点,因此具有等同的VH-VL网格点对。对每个结构中的每对网格点测量Euclidean距离。鉴定其间隔距离中具有最小方差的点对。连接这些点的向量定义为C。使用向量完全定义坐标系,该向量位于每个平面中并且在对应于C的点中央。H1是平行于VH平面的第一主组分的向量,而H2平行于第二主组分。L1和L2类似地定义在VL结构域上。HL角是两个结构域之间的扭转角。HC1和LC1弯曲角度等同于一个结构域相对于另一个结构域的倾斜状变化。HC2和LC2弯曲角描述了一个结构域与另一个结构域的扭曲状变化。为了描述VH-VL方向,使用六个量度,距离和五个角度。这些在坐标系中定义如下:-C的长度,dc-关于C测量的从H1到L1的扭转角HL,-H1和C之间的弯曲角HC1,-H2和C之间的弯曲角HC2,-L1和C之间的弯曲角LC1,和-L2和C之间的弯曲角LC2。术语“VH-VL方向”根据其在本领域中的通常含义使用,如本领域技术人员将理解的参见,例如,Dunbar等人,Prot.Eng.Des.Sel.262013611-620;和Bujotzek,A.,等人,Proteins,Struct.Funct.Bioinf.,832015681-695。它表示VH和VL结构域相对于彼此如何定向。因此,VH-VL方向由下式定义-C的长度,dc,-关于C测量的从H1到L1的扭转角HL,-H1和C之间的弯曲角HC1,-H2和C之间的弯曲角HC2,-L1和C之间的弯曲角LC1,和-L2和C之间的弯曲角LC2,其中参照框架平面通过以下登记:i比对与VH的八个位置H36、H37、H38、H39、H89、H90、H91和H92相对应的Cα坐标并通过它们拟合平面,和ii比对与VL的八个位置L35、L36、L37、L38、L85、L86、L87和L88相对应的Cα坐标并通过它们拟合平面,iii放置在每个平面上,由此每个结构具有等同的网格点和等同的VH-VL网格点对,和iv测量每个结构中每对网格点的Euclidean距离,由此向量C以其间隔距离的最小方差连接点对,其中H1是平行于VH平面的第一主组分的向量,H2是平行于VH平面的第二主组分的向量,L1是平行于VL平面的第一主组分的向量,L2是平行于VL平面的第二主分量的向量,HL角是两个结构域之间的扭转角,HC1和LC1是等同于一个结构域相对于另一个结构域的倾斜状变化的弯曲角,并且HC2和LC2弯曲角等同于一个结构域与另一个结构域的扭曲状变化。根据Chothia索引确定这些位置。选择向量C以在非冗余结构组上具有最保守的长度。距离dc是这个长度。它的平均值为标准偏差仅为下表列出了随机森林算法鉴定的对于确定VH-VL方向的每个角度量度是重要的前10个位置和残基。表:X代表可变L36VL38EL42HL43LL44FL45TL46GL49GL95H更详细的信息参见Dunbar,J.等人,ProteinEng.Des.Sel.,262013611-620和Bujotzek,A.等人,Prot.Struct.Funct.Bioinf.832015681-695,其全部内容通过引用并入本文。从而提供了预测VH-VL-结构域间方向的基于快速序列的预测器。根据六个绝对ABangle参数描述VH-VL方向,以精确地分离VH-VL方向的不同自由度。两个序列结构之间的偏差由氨基酸主链的羰原子的平均均方根偏差RMSD表示。在本文报道的所有方面的一个实施方案中,VHVL方向如下确定:-从多个变体抗体序列和针对参照抗体产生Fv片段,-基于抗体Fv片段的序列指纹,确定参照Fv片段和多个变体抗体Fv片段的每个变体抗体Fv片段的VH-VL方向,-鉴定选择获得排序那些与参照抗体的VH-VL方向相比在VH-VL方向上具有最小不同的变体抗体Fv片段。在一个实施方案中,该方法包括以下步骤:-鉴定选择获得排序那些与参照抗体的VH-VL-结构域间角相比在VH-VL-结构域间角上具有最高结构相似性的那些变体抗体Fv片段。在一个实施方案中,VH-VL-界面残基是氨基酸残基,其侧链原子具有相对链的相邻原子,其距离小于或等于在至少90%所有叠加的Fv结构中。在一个实施方案中,该组VH-VL界面残基包含残基210、296、610、612、733根据Wolfguy索引编号。在一个实施方案中,该组VH-VL界面残基包含残基199、202、204、210、212、251、292、294、295、329、351、352、354、395、396、397、398、399、401、403、597、599、602、604、609、610、612、615、651、698、733、751、753、796、797、798根据Wolfguy索引编号。在一个实施方案中,该组VH-VL界面残基包含残基197、199、208、209、211、251、289、290、292、295、296、327、355、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、797、798、799、803根据Wolfguy索引编号。在一个实施方案中,该组VH-VL界面残基包含残基197、199、202、204、208、209、210、211、212、251、292、294、295、296、327、329、351、352、354、355、395、396、397、398、399、401、403、597、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、796、797、798、799、801、803根据Wolfguy索引编号。在一个实施方案中,该组VH-VL界面残基包含残基199、202、204、210、212、251、292、294、295、329、351、352、354、395、396、397、398、399、401、403、597、599、602、604、609、610、612、615、651、698、733、751、753、796、797、798、801根据Wolfguy索引编号。在一个实施方案中,该组VH-VL界面残基包含残基197、199、202、204、208、209、210、211、212、251、292、294、295、296、327、329、351、352、354、355、395、396、397、398、399、401、403、597、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、797、798、799、801、803根据Wolfguy索引编号。在一个实施方案中,鉴定选择获得排序基于关于VH-VL方向的前80%变体抗体Fv片段。在一个实施方案中,鉴定选择获得排序是关于VH-VL方向的前20%变体抗体Fv片段。在一个实施方案中,通过计算六个ABangleVH-VL方向参数确定VH-VL方向。在一个实施方案中,通过使用随机森林方法计算ABangleVH-VL方向参数确定VH-VL方向。在一个实施方案中,通过对每个ABangle使用一种随机森林方法计算ABangleVH-VL方向参数确定VH-VL方向。在一个实施方案中,通过使用随机森林模型计算习惯性扭转角、四个弯曲角每个可变结构域两个和VH和VL的枢轴长度HL、HC1、LC1、HC2、LC2、dc确定VH-VL方向。在一个实施方案中,仅用复合抗体结构数据训练随机森林模型。在一个实施方案中,最高结构相似性是最低平均均方根偏差RMSD。在一个实施方案中,RMSD是针对非人或亲本抗体的氨基酸残基的所有Calpha原子或羰原子对变体抗体的相应Calpha原子测定的RMSD。在一个实施方案中,使用模型确定VH-VL方向,该模型从在共有VH或VL框架上比对的模板结构组装,随后在共有Fv框架上进行VH-VL重新定向。在一个实施方案中,使用在完整FvVH和VL同时的β-片层核心上比对的模型确定VH-VL方向。在一个实施方案中,其中抗体Fv片段在共有Fv框架上重新定向的模型用于确定VH-VL方向。在一个实施方案中,使用模型确定VH-VL方向,该模型使用在共同的共有Fv框架上比对的模板结构并且未以任何形式调节VH-VL方向。在一个实施方案中,使用模型确定VH-VL方向,该模型从在共有VH或VL框架上比对的模板结构组装,随后使用基于相似性在所选择的VH-VL方向模板结构上进行VH-VL重新定向。一旦确定了参照抗体及其变体的ABangle值,就可以根据它们与参照抗体的VH-VL方向的相似性对变体进行排序。为了比较ABangle空间中的相似性,我们将一组ABangle参数定义为元组然后两组ABangle参数之间的Euclidean距离是由于distABangle交融角HL、HC1、LC1、HC2、LC2与线性dc距离量度,它们不能被解释为角空间中的事实距离,而仅用作抽象距离量度。过滤根据SCaRAb的应用,可以针对某些序列特征例如,去除参照抗体中存在的潜在糖基化位点或责任liability例如,引入参照抗体中不存在的新的游离半胱氨酸残基筛选突变元组,可以相应地应用过滤器。实施例AB细胞克隆结合物的分离和性质BCC结合物,结合ELISA在第3次免疫后第6天,从免疫的兔R176中收获15ml血液,分离108.6×10E6个PBMC。对于VH的NGS,4.2×10E6PBMC重悬于RLT缓冲液中,而剩余的PBMC进一步加工巨噬细胞耗尽,富集抗原用于通过B细胞克隆方法分离抗原特异性B细胞克隆参见例如Seeber,S.等人,PLoSOne,92014e86184。总之,在这个B细胞克隆方法中,在巨噬细胞KLH-结合物耗尽后沉积并培养动物R176的bleed1的504个单个B细胞,在抗原富集后沉积并培养840个单个B细胞LRP8,低密度脂蛋白受体相关蛋白8,UniProtKB-Q14114。在巨噬细胞耗尽后,初步筛选鉴定了279个分泌IgG的B细胞克隆。在这些克隆中,4个上清液与抗原结合。在抗原富集后,可以鉴定出341个IgG阳性上清液。其中55个B细胞上清液与抗原结合见下表。表:通过B细胞克隆鉴定的结合物的分离和性质NGS数据库中参照抗体变体BCC结合物变体的鉴定选择通过B细胞克隆鉴定的共4个结合物用于在NGS库中鉴定VH变体;在抗原特异性富集后通过B细胞克隆分离所有克隆,均显示对抗原的特异性EC50低于20ngml,其中两个显示与鼠抗原的交叉反应性EC50低于20ngml参见下表。表:选择用于NGS变体分析的B细胞克隆的性质分析来自PBMC和来自抗原富集的B细胞的NGS库,用于鉴定VH变体,其在整个VH中与参照B细胞结合物的VH相比具有≤6个氨基酸置换FR1至FR4,允许框架和HVRCDR中的突变。可以鉴定共441个不同的VH变体,其中对于4种结合物和递送变体的NGS样品具有不同的分布,如下表所示。表:NGS样品中鉴定的相关VH结构指导的抗体变异聚簇和排序SCaRAb如上所述,已经对鉴定的变体进行了聚簇。结果显示在下表中。注意,表示聚簇medoids的变体,即聚簇中的变体,其相对于聚簇中所有其他变体的平均dist_ABangle是最小的,已经用灰色背景突出显示。通过使用距离相关函数,已经在本文报道的方法中扩展了通常已知的基于k-medoids的聚簇。这些变体可以被解释为给定变体聚簇的代表或示例。抗体755的VH变体40个聚簇抗体763的VH变体4个聚簇抗体770的VH变体10个聚簇抗体776的VH变体7个聚簇为了最终选择用于DNA合成和用亲本VK进行HEK瞬时转染的NGS变体,选择具有多于1个氨基酸置换的所有“中心点”VH,其导致AB角距离≤0.5并且没有游离半胱氨酸。已经选择共31个VH用于克隆755,4个用于克隆763,10个用于克隆770,9个用于克隆776参见下表。如下表所示,选择的变体通过PBMC库或抗原富集的PBMC库递送。表:用于基因合成和用亲本VK瞬时转染的NGSVH变体的最终选择。AP:淘选细胞库后;BP:淘选前的PBMC细胞库基于剂量反应曲线的NGS变体的结合分析将变体VH和亲本VL质粒瞬时共转染到HEK293细胞中。另外,还转染参照B细胞克隆并用作参照。纯化上清液后,如下文实验部分所述,分析所有克隆与人和鼠抗原的结合。基于EC50的分析在不同情形一式两份进行,以保证统计准确性。图3显示人和鼠抗原结合的相关图,显示参照抗体淘选后通过筛选鉴定的结合物和由NGS选择的各个克隆。NGS变体和BCC参照的所有生化和突变评分数据合并在下表中。图数据显示关于结合行为和相对排序良好的相关性参见表数据。大多数变体60-80%显示与人抗原结合的EC50值,与相关对照相当,并且一些的EC50值甚至略微改善。对于与鼠抗原呈现交叉反应性的那些克隆,对于与鼠抗原结合的EC50值观察到相同的结果。在PBMCNGS库中富集前鉴定了BCC763的变体,并且80%的变体显示出与参照相当的结合特性;对于BCC755和BCC776,从富集的B细胞库中回收了大多数具有与参照相当的行为的变体,但仍然可以从总PBMCNGS库中获得一些好的结合物。从富集库的NGS库中回收BCC770的变体。可以看出,对于每种参照抗体,可以用本文报道的方法鉴定具有较低EC50值的变体抗体。表:通过与人抗原的EC50值顺序第一个最低,最后一个最高,合并NGS变体和BCC参照的生化和突变评分数据。AP:淘选细胞库后;BP:淘选前的PBMC细胞库因此,通过该步骤,可以使用与所述分离的抗原特异性B细胞克隆相当或甚至改善的结合特性鉴定抗原特异性结合物。这已通过DNA合成、重组表达和基于序列鉴定的变体的生化分析证明。这为NGS数据的全新应用开辟了道路。实施例B具有可开发性热点的B细胞克隆BCC结合物的NGS变体使用本文报道的方法在NGS库中鉴定总共7种B细胞克隆结合物克隆相关的结合物;在hu-CDCP1特异性富集富集类型如下表所示后,通过B细胞克隆分离所有克隆,所有克隆均显示对hu-CDCP1的特异性EC50IC50absngml范围低于200ngml并且所有VH在HCDR中都有半胱氨酸或N-糖基化位点。表:选择用于NGS变体分析的B细胞克隆的性质分析来自PBMC和来自抗原富集的B细胞的NGS库,用于鉴定与参照B细胞结合物的VH相比在整个VHFR1至FR4中具有≤11个氨基酸取代的VH变体。那些具有改善的可开发性特性的VH同源变体在HCDR中不再有Cys和或N-糖基化位点点是基因合成的,在HEK细胞中与亲本轻链共转染,比较表达的抗体与BCC参照,评估其结合特性。基于剂量反应曲线的NGS变体的结合分析将变体VH和亲本VL质粒瞬时共转染到HEK293细胞中。另外,转染七种亲本抗体并用作参照。纯化上清液后,如实施例部分所述,分析所有克隆与人CDCP1抗原的结合。图4显示与相应的亲本克隆相比,NGS变体与人CDCP1的结合。对于每种抗体,测试了不同数量的NGS序列变体。可以鉴定每个克隆的至少一个变体,其显示与参照抗体相同范围的EC50值用*标记。在下表中,显示了针对每个BCC克隆鉴定的VH变体、提供变体的NGS样品的B细胞来源、整个VH中氨基酸取代的总数和绝对EC50IC50值。表:鉴定的具有改善计算机可开发性性质的VH变体:提供变体的NGS样品的B细胞来源、整个VH中氨基酸取代的总数和绝对EC50IC50值。来自NGS库中发现的确认结合物的CDRH3序列显示出非常不同的特征,为序列分类提供了基础。一些“最佳”结合物在CDRH3区显示出强的同源性。已经发现NGS谱库可以用于找到这种良好结合物的变体。具有足够的测序深度和优化的归一化条件的分析是这种方法的基础。最重要的是,必须在DNA水平上分析复杂的序列多样性,以将具有相当的特性的序列组合在一起,其可能具有相同的系统发生起源。特别是对于兔,不仅仅是使用体细胞超突变,而且在克隆扩增期间也进行基因转换,使得很难使该分组能够鉴定克隆相关的VH。用本文报道的方法筛选NGS序列库与上述四种BCC结合物具有相同的CDRH3序列的VH变体。在DNA水平上对完整VH区的分析显示,除了完全相同的VH之外,可以通过CDRH3外的V区上的大量突变,与参照BCC不同来鉴定变体参见下表。序列的比对表明突变发生在整个序列的各种不同位置,并且没有集中到某个区域数据未显示。表:在其VH内选择的CDRH3序列和变体的详细分析。除了具有相同CDRH3和VH中的突变的序列之外,还可以筛选NGS库以鉴定具有与参照BCC结合物的CDRH3区高度同源的CDRH3区的变体。这可以通过将结合物的CDRH3与总NGS库比对并选择具有高度同源性的序列例如肽水平上最多一个突变来完成。下表显示了用“最佳”结合物9-11的CDRH3序列完成比对的提取物。在NGS库中发现的CDRH3序列S1-S25与这些“最佳”结合物密切相关。表:与相同长度和高度同源性的CDR3的提取物S1-S25比对的鉴定的结合物9-11的肽CDR3序列。如上所述,在NGS样品中在多于一种动物中发现了四种BCCCDRH3。在先前的研究中已经表明,免疫后在动物中发现更多共享序列CDR3,表明这些序列是抗原特异性的Galson,J.D.等人,Crit.Rev.Immunol.352015463-478。从以上可以看出,NGS产生的数据与来自BCC的序列数据的组合可用于鉴定参照抗体的替代抗原特异性变体抗体。可以筛选NGS数据中与,即,BCC结合物相比,具有相似或相同CDRH3但在VH的其他区域内具有更高突变率的序列,以找到具有改善性质的抗体。VL如果使用表达共同轻链的转基因动物进行免疫,则仅对VH-库的分析就足够了。在其他转基因模型或野生型动物中,需要鉴定VHVL对为属于一起并且二者以相同的方式有助于抗原特异性。为此,可以使用多种方法,范围从单细胞分选组合单细胞克隆至特定RNA捕获。例如,融合PCR非常适合与UMI纠错方法组合。通过物理连接来自每个单细胞的α和β或重链和轻链转录物来保留配对链信息。转录物的融合可以通过多重重叠-延伸PCR完成。提供以下实施例和附图以帮助理解本发明,本发明的真实范围在所附权利要求中阐述。应理解,可以在不脱离本发明精神的情况下对所述步骤进行修改。附图说明图1参照抗体763的VH上和VL下序列及其VH结构域的六个变体。框架和CDR分类遵循Wolfguy命名法。在VH变体中,关于参照的氨基酸取代以浅灰色显示。CDR编号是灰色阴影。图2参照抗体763的VH上和VL下序列及其VH结构域的六个变体。形成VH-VL方向指纹的一部分的残基已经用灰色背景标记。与参照抗体相比,该区域中的氨基酸取代可能诱导VH-VL方向的改变。CDR编号是灰色阴影。图3EC50M相关性图;所有NGS变体的人vs鼠LRP8结合。为对照、通过筛选和淘选鉴定的克隆红色和蓝色和由NGS鉴定的克隆灰色作图;A:BCC763的变体,B:BCC776的变体,C:BCC770的变体,D:BCC755的变体。图4绝对EC50[nM]值显示所有NGS变体白色条与人CDCP1的结合。亲本对照以黑色显示。成功的NGS变体标记有*。na=不可获得,意味着由于变体的弱的结合,不能从结合曲线得到EC50值。A:CDCP1_105的变体;B:CDCP1_223的变体;C:CDCP1_236的变体;D:CDCP1_284的变体;E:CDCP1_212的变体;F:CDCP1_088的变体;G:CDCP1_234的变体。图5BCC和NGS工作流程的方案。实施例实施例1兔的免疫人LRP8的KLH缀合物用于免疫新西兰白兔。用500μg完全弗氏佐剂乳化的免疫原免疫每只兔,在第0天通过皮内应用,并在第7、14、28、42天通过交替的肌内和皮下应用,每次500μg。此后,兔每月接受500μg的皮下免疫,并在免疫后7天取小样本血液用于测定血清滴度。在免疫的第3、第4和第5个月免疫后5-7天取较大的血液样本估计总血液量的10%,并分离外周单核细胞,将其用作B细胞克隆过程中抗原特异性B细胞的来源。实施例2血清滴度的测定ELISA将生物素化的人LRP8以PBS中0.5μgml固定在96孔链霉亲和素包被的平板上,100μl孔,然后用2%CroteinC的PBS溶液,200μl孔,封闭平板。然后施加0.5%CroteinC的PBS溶液中的100μl孔系列稀释的抗血清,一式两份。用HRP缀合的驴抗兔IgG抗体JacksonImmunoresearchDianova,目录号711-036-152;116000进行检测,各自在0.5%CroteinC的PBS溶液中稀释,100μl孔。对于所有步骤,将板在37℃下孵育1小时。在所有步骤之间,将板用0.05%Tween20的PBS溶液洗涤3次。通过加入100μl孔的BMBluePOD过氧化物酶-可溶性底物RocheDiagnosticsGmbH,Mannheim,Germany生成信号;加入1MHCl,100μl孔终止。在450nm处读取吸光度,而690nm作为参照。滴度定义为产生最大信号的一半的抗血清的稀释度。实施例3兔外周血单个核细胞PBMC的分离从免疫的野生型兔NZW中取血液样本。含有EDTA的全血用1xPBSPAA,Pasching,Austria稀释两倍,然后根据制造商的说明书使用哺乳动物淋巴细胞lympholytemammalCedarlaneLaboratories,Burlington,Ontario,Canada进行密度离心。用1xPBS洗涤PBMC两次。实施例4巨噬细胞单核细胞的耗尽将PBMC接种在无菌KLH包被的SA-6孔平板上以通过非特异性粘附耗尽巨噬细胞和单核细胞并除去与KLH结合的细胞。每个孔最多填充4ml培养基和来自免疫兔的多至6x10E6PBMC,并使其在37℃和5%CO2下结合1小时。将上清液中的细胞外周血淋巴细胞PBL用于抗原淘选步骤。实施例5B细胞的富集将无菌链霉亲和素包被的6孔平板Microcoat,Bernried,Germany用2μgml生物素化KLH蛋白或生物素化LRP8CDCP1蛋白的PBS溶液在室温下包被3小时。在淘选步骤之前,将这些6孔平板用无菌PBS洗涤三次。用每4ml培养基中多至6×10E6个PBL接种包被的板,并允许其在37℃和5%CO2下结合1小时。通过用1xPBS仔细洗涤孔1-2次除去非贴壁细胞。在37℃和5%CO2下通过胰蛋白酶将剩余的粘附细胞分离10分钟。用EL-4B5培养基终止胰蛋白酶化。将细胞保持在冰上直至免疫荧光染色。EL-4B5培养基补充有10%FCSHyclone,Logan,UT,USA、2mM谷氨酰胺、1%青霉素链霉素溶液PAA,Pasching,Austria、2mM丙酮酸钠、10mMHEPESPANBiotech,Aidenbach,Germany和0.05mMβ-巯基乙醇Gibco,Paisley,Scotland的RPMI1640PanBiotech,Aidenbach,Germany。实施例6免疫荧光染色和流式细胞术抗IgG抗体FITC缀合物AbDSerotec,Düsseldorf,Germany用于单细胞分选。对于表面染色,将用耗尽步骤和富集步骤预处理的B细胞实施例4和5与抗-IgG抗体FITC缀合物在PBS磷酸缓冲盐溶液中孵育,在4℃下在黑暗中孵育45分钟。染色后,用冰冷的PBS洗涤细胞两次。最后,将标记的B细胞重悬于冰冷的PBS中,并立即进行FACS分析。在FACS分析之前加入浓度为5μgml的碘化丙啶BDPharmingen,SanDiego,CA,USA以区分死细胞和活细胞。配备有计算机和FACSDiva软件BDBiosciences,USA的BectonDickinsonFACSAria用于单细胞分选。实施例7B细胞培养根据Seeber等人描述的方法进行单个分选的B细胞的培养Seeber,S.等人,PLoSOne,92014e86184.。简而言之,将单个分选的兔B细胞在含有200μl孔EL-4B5培养基的96孔板中、在37℃在孵育箱中孵育7天,所述EL-4B5培养基含有Pansorbin细胞1:100,000CalbiochemMerck,Darmstadt,Germany、5%兔胸腺细胞上清液MicroCoat,Bernried,Germany和γ-照射的鼠EL-4B5胸腺瘤细胞5×10E5细胞孔。取B细胞培养上清液用于筛选,立即收获剩余的细胞,并在-80℃下在100μlRLT缓冲液Qiagen,Hilden,Germany中冷冻。实施例8酶联免疫吸附试验ELISA人抗原:将抗原、生物素化人LRP8与含有浓度为250ngmL的抗LRP8抗体的5μL样品在总体积为25μL的0.5%BSA和0.05%Tween的PBS溶液中、在384w微量滴定板MaxisorbwithStreptavidin,Nunc中孵育。在25℃孵育1.5小时后,通过用90μLPBS洗涤6次除去未结合的抗体吹打和抽吸。通过与POD缀合的抗兔抗体ECL抗兔IgG-POD,目录号NA9340V;POD=过氧化物酶检测抗原-抗体复合物。加入35μLPOD-底物3,3',5,5'-四甲基联苯胺TMB;Piercenet,目录号3402120-30分钟后,在370nm处测定光密度。使用GraphPadPrism6.0软件,用四参数逻辑模型计算EC50值。鼠抗原:将抗原、生物素化鼠LRP8与含有浓度为250ngmL的抗LRP8抗体的5μL样品在总体积为25μL的0.5%BSA和0.05%Tween的PBS溶液中、在384w微量滴定板MaxisorbwithStreptavidin,Nunc中孵育。在25℃孵育1.5小时后,通过用90μLPBS洗涤6次除去未结合的抗体吹打和抽吸。通过与POD缀合的抗兔抗体ECL抗兔IgG-POD,目录号NA9340V检测抗原-抗体复合物。加入35μLPOD-底物3,3',5,5'-四甲基联苯胺TMB;Piercenet,目录号3402120-30分钟后,在370nm处测定光密度。使用GraphPadPrism6.0软件,用四参数逻辑模型计算EC50值。实施例9用于SLIC克隆的V结构域的PCR扩增根据制造商的方案,使用NucleoSpin896RNA试剂盒Macherey&Nagel;目录号740709.4,740698从B细胞裂解物重悬于RLT缓冲液Qiagen,目录号79216中制备总RNA。使用60μl无RNAase的水洗脱RNA。根据制造商的说明使用SuperscriptIIIFirst-StrandSynthesisSuperMixInvitrogen,目录号18080-400和寡dT-引物、使用6μlRNA、通过逆转录酶反应产生cDNA。所有步骤均在HamiltonMLStarSystem上进行。使用4μlcDNA、使用AccuPrimeSuperMixInvitrogen,目录号12344-040扩增免疫球蛋白重链和轻链可变结构域VH和VL,最终体积为50μl,使用引物rbHC.up和rbHC.do用于重链、以及rbLC.up和rbLC.do用于轻链:rbHC.upAAGCTTGCCACCATGGAGACTGGGCTGCGCTGGCTTCSEQIDNO:30rbHC.doCCATTGGTGAGGGTGCCCGAGSEQIDNO:31rbLC.upAAGCTTGCCACCATGGACAYGAGGGCCCCCACTCSEQIDNO:32rbLC.doCAGAGTRCTGCTGAGGTTGTAGGTACSEQIDNO:33所有正向引物对对于分别为VH和VL的信号肽具有特异性,而反向引物对对于分别为CH1和CL的恒定区具有特异性。RbVH+RbVL的PCR条件如下:94℃热启动5分钟;35个循环:94℃,20秒;在70℃,20秒;68℃,45秒;在68℃下最终延伸7分钟。将50μlPCR溶液中的8μl上样到48E-Gel2%Invitrogen,目录号G8008-02上。使用NucleoSpinExtractII试剂盒Macherey&Nagel;目录号740609250根据制造商的方案纯化阳性PCR反应,并在50μl洗脱缓冲液中洗脱。所有纯化步骤在HamiltonMLStarletSystem上进行。将5μl纯化的VH和VLPCR溶液用于DNA测序。实施例10来自PBMC和抗原富集B细胞的NGSVH-PCR将4.2×10E6个PBMC和1.2×10E6抗原富集B细胞重悬于300μlRLT缓冲液Qiagen;目录号79216中。根据制造商的方案,使用RNeasyMini或Micro试剂盒Qiagen;目录号74134从B细胞裂解物制备总RNA。对于PBMC和抗原富集B细胞,分别在50μl和30μl无RNase的水中洗脱RNA。根据制造商的说明书,使用SuperscriptIIIFirst-StrandSynthesisSuperMixInvitrogen,目录号18080-400和寡dT-引物、使用6μlRNA、通过逆转录酶反应产生cDNA。使用50-80ngcDNA扩增免疫球蛋白重链可变结构域VH,其中在50μl的最终体积中使用AccuPrimeSuperMixInvitrogen,目录号12344-040,使用引物rbHCfinal_FS.up和rbHC_shortCH1_fs2.do:rbHCfinal_FS.upATGGAGACTGGGCTGCGCTGGCTTCSEQIDNO:34rbHC_shortCH1_fs2.doGGGAAGACTGATGGAGCSEQIDNO:35正向引物对信号肽VH具有特异性,而反向引物对恒定区具有特异性。PCR条件如下:94℃热启动3分钟;22个循环:94℃,20秒;在68℃,20秒;68℃,40秒;在68℃下最终延伸5分钟。对每个细胞库样品总共进行6次PCR反应。将一个PCR反应中的8μl上样到12E-Gel2%Invitrogen,目录号G521802上。根据制造商的方案,使用NucleoSpinExtractII试剂盒Macherey&Nagel;目录号740609用一个柱分别针对2个B细胞文库PBMC文库;抗原富集B细胞文库的所有PCR反应进行纯化,在50μl洗脱缓冲液中洗脱。将5μl纯净的VHPCR溶液用于DNA-MiSeq测序。实施例11用于NGS测序的模板准备配对末端运行2x300碱基:样品的最小DNA量:100ng,良好500ng。在Illumina的MiSeq上进行NGS测序。在AMPureXP珠上纯化后,在DNA1000AgilentBioAnalyzer芯片上评估PCR模板。使用TruSeqNanoDNA样品制备试剂盒根据制造商的方案进行文库制备。使用qPCR技术定量最终文库。根据KAPASYBRFASTqPCR方案制备qPCR反应,并使用RocheLightCycler480运行。合并样品并与PhiX对比。更详细地,通过使用Illumina测序引物的配对末端IlluminaMiSeq测序运行来分析文库。在开始实验之前,将所有试剂在室温下解冻。将试剂小盒在水浴中解冻。将小盒倒置几次以确保试剂的混合,并且通过在工作台上击打小盒来移除所有气泡。通过将200μl1MNaOH加入800μL实验室级别水中制备1mL0.2MNaOH。将制备的溶液涡旋、离心并储存在冰上。将流动池转移至室温,并用实验室级别水仔细洗涤,使用kimtech精密擦拭纸干燥并按照说明书插入测序仪中。将5μl4nMDNA文库池与新鲜稀释的0.2MNaOH混合,短暂涡旋并在台式离心机上离心。将溶液在室温下孵育5分钟,加入990μL预冷的HT1并通过短暂涡旋混合。将得到的20μM变性文库的1mMNaOH溶液储存在冰上直至进一步使用。为了获得600μl12pM文库,用240μl预冷的HT1稀释360μL20pM变性文库,倒置数次以混合,然后脉冲离心。将得到的12pM文库储存在冰上直至进一步使用。为了制备4nMPhiX文库,将2μL10nMPhiX文库对照加入3μl含有0.1%Tween20的10mMTris-HCl,pH8.5中。将稀释液短暂涡旋并脉冲离心。为了使PhiX对照变性,将5μl新鲜稀释的0.2MNaOH加入到5μL制备的4nMPhiX文库中,短暂涡旋并在台式离心机上离心。将溶液在室温下孵育5分钟,加入990μL预冷的HT1并通过短暂涡旋混合。为了获得12.5pMPhiX文库,将375μL20pM变性PhiX溶液与225μL预冷的HT1混合,短暂涡旋并脉冲离心。将520μL12pM样品文库和80μL12.5pMPhiX组合以产生具有15%PhiX添加spike-in对照的文库。将组合的样品文库和PhiX对照储存在冰上直至上样到MiSeq试剂小盒上。实施例12用于鉴定克隆相关VH变体的NGS序列的生物信息学分析来自IlluminaMiSeq的数据由每个序列的两对且通常是重叠的读取组成。使用以下工作流程分析了所有数据:通过FLASH组装配对读取任何其他软件工具也应有效○FLASH可从http:ccb.jhu.edusoftwareFLASH获得○使用Flashv1.2.10,具有默认参数DEFAULTPARAMETERS没有outies,最小重叠10bp,最大重叠65bp○结果:没有Illumina适体的重叠序列抗体可变结构域的提取:○将DNA翻译成所有6个ORF○对于每个ORF:■通过与共有FW1序列比较搜索FW1的肽序列并计算差异。如果该值高于定义的阈值,则继续。■同样针对FW2进行搜索,尝试连接到FW1其间的区域是CDR1■同样针对FW3进行搜索,尝试连接到FW2其间的区域是CDR2■同样针对FW4进行搜索,尝试连接到FW3其间的区域是CDR3○通常,在6个ORF中的仅1个中,可以鉴定具有上述程序的可变结构域。如果发现多个,则计算描述到共有的距离的分数并选择最佳ORF。○对于发现的可变结构域,有几个值。最重要的是,通过简单地将可变结构域序列与IMGT提供的可获得种系库比对来检测最接近的种系,并报告最佳命中。通过这种方式,还报告最有可能是这些序列起源的每个序列的VDJ种系。○结果:表中每个序列有一行,包含有关所包含可变结构域的所有信息。○进行的额外分析:计算与参照序列相比的DNAPEP水平上每个CDRFR的#突变。实施例13用亲本VL瞬时转染NGSVH变体为了重组表达NGS变体,通过突出克隆方法Haun,R.S.等人,BioTechniques131992515-518;Li,M.Z.等人,NatureMethods42007251-256将编码B细胞克隆亲本VL的PCR产物作为cDNA克隆到表达载体中,在含有兔恒定区的表达盒中以接受VL区。表达载体含有表达盒,所述表达盒由包含内含子A的5'CMV启动子和3'BGH聚腺苷酸化序列组成。除表达盒外,质粒还含有pUC18衍生的复制起点和β-内酰胺酶基因,该基因赋予氨苄青霉素抗性,用于在大肠杆菌中的质粒扩增。此外,表达载体含有兔κLC恒定区以接受VL区。使用重叠引物通过PCR扩增编码κ恒定区和VL插入物的线性化表达质粒。将纯化的PCR产物与T4DNA聚合酶一起孵育,产生单链突出端。通过添加dCTP终止反应。在下一步中,将质粒和插入物组合,并与recA一起孵育,recA诱导位点特异性重组。将重组的质粒转化到大肠杆菌中。第二天,挑选生长的菌落,通过质粒制备、限制性分析和DNA测序测试正确的重组质粒。合成选择的NGSVH变体GeneArt,Regensburg,Germany并作为cDNA克隆到表达载体中。表达载体含有表达盒,所述表达盒由包含内含子A的5'CMV启动子和3'BGH聚腺苷酸化序列组成。除表达盒外,质粒还含有pUC18衍生的复制起点和β-内酰胺酶基因,该基因赋予氨苄青霉素抗性,用于在大肠杆菌中的质粒扩增。此外,表达载体含有兔IgG恒定区,其被设计成接受VH区。为了抗体表达,通过使用239-FreeTransfection试剂Novagen、根据试剂供应商建议的步骤将500ng分离的HC和LC质粒瞬时共转染到2ml96孔平板的FreeStyleHEK293-F细胞Invitrogen,目录号R790-07中。培养1周后,收获HEK上清液,过滤1.2μmSupor-PALL并用MabSelectSuRe50μl,GEHealthcare纯化。用1×PBS平衡柱。用2.5mMHCl,pH2.6洗脱样品,并用10×PBS中和。实施例14抗原CDCP1特异性分类的染色程序来自巨噬细胞耗尽步骤的细胞用于进行抗原特异性分选。在第一轮中,将细胞与浓度为5μgml生物素化的CDCP1抗原在冰上孵育。在两个洗涤步骤后,用A647-链霉亲和素缀合物Invitrogen检测生物素化的和细胞结合的CDCP1。平行地,加入抗IgGFITCAbDSerotec,Düsseldorf,Germany和抗IgMPEBDPharmingen抗体。将染色的细胞洗涤两次。最后,将PBMC重悬于冰冷的PBS中并立即进行FACS分析。用于单细胞分选的细胞门控是:实施例15筛选HuCDCP1结合物将NuncMaxisorb链霉亲和素包被的平板MicroCoat,目录号#11974998001用25μl孔的浓度的200ngml的生物素化的人CDCP1-AviHis融合蛋白包被,并在4℃下过夜孵育。洗涤后用PBST缓冲液磷酸盐缓冲盐水Tween-202×90μl孔,加入25μl抗CDCP1抗体样品并在室温下孵育1小时。洗涤后用PBST-缓冲液3×90μl孔,加入以1:1,000稀释的25μl孔山羊-抗-人IgG-HRP缀合物Millipore,目录号AP502P并在室温下在振荡器上孵育1小时。洗涤后用PBST-缓冲液4×90μl孔,加入25μl孔的TMB底物RocheDiagnosticsGmbH,目录号11835033001并孵育直至OD达到1.5-2.5。通过加入25μl孔1NHCl终止反应。在370492nm进行测量。实施例16来自PBMC和抗原富集淘选样品B细胞的NGSVH-PCR将4×10E6个PBMC和352个抗原富集B细胞重悬于350μlRLT缓冲液Qiagen,目录号79216中。根据制造商的方案,使用RNeasyMini或Micro试剂盒Qiagen,目录号74134从B细胞裂解物制备总RNA。对于PBMC和抗原富集B细胞,分别在50μl和30μl无RNase的水中洗脱RNA。根据制造商的说明书,使用SuperscriptIIIFirst-StrandSynthesisSuperMixInvitrogen,目录号18080-400和寡dT-引物、使用6μlRNA通过逆转录酶反应来产生cDNA。使用AccuPrimeSuperMixInvitrogen,目录号12344-040在最终体积50μl中使用50-80ngcDNA扩增免疫球蛋白重链可变区VH,其中使用引物rbHCfinal_FS.up和rbHC_shortCH1_fs2.do:rbHCfinal_FS.upATGGAGACTGGGCTGCGCTGGCTTCSEQIDNO:34rbHC_shortCH1_fs2.doGGGAAGACTGATGGAGCSEQIDNO:35正向引物对信号肽VH具有特异性,而反向引物对恒定区具有特异性。PCR条件如下:94℃热启动3分钟;20和29个循环分别对于PBMC和抗原富集样品:94℃,20秒;68℃,20秒;68℃,40秒;68℃最终延伸5分钟。每个细胞库样品共进行6-8次PCR反应。CDCP1:3只wt-兔5571、5565、5556测序结果:兔VH序列和簇的数量实施例17用亲本VLHEK瞬时转染NGSVH变体为了重组表达NGS变体,通过突出克隆方法Haun,R.S.等人,BioTechniques131992515-518;Li,M.Z.等人,NatureMethods42007251-256将编码B细胞克隆亲本VL的PCR产物作为cDNA克隆到表达载体中。表达载体含有表达盒,所述表达盒由包含内含子A的5'CMV启动子和3'BGH聚腺苷酸化序列组成。除表达盒外,质粒还含有pUC18衍生的复制起点和β-内酰胺酶基因,该基因赋予氨苄青霉素抗性,用于在大肠杆菌中的质粒扩增。此外,表达载体含有兔κLC恒定区以接受VL区。使用重叠引物通过PCR扩增编码κ恒定区和VL插入物的线性化表达质粒。将纯化的PCR产物与T4DNA聚合酶一起孵育,产生单链突出端。通过添加dCTP终止反应。在下一步中,将质粒和插入物组合,并与recA一起孵育,recA诱导位点特异性重组。将重组的质粒转化到大肠杆菌中。第二天,挑选生长的菌落,通过质粒制备、限制性分析和DNA测序测试正确的重组质粒。合成选择的NGSVH变体GeneArt,Regensburg,Germany并作为cDNA克隆到表达载体中。表达载体含有表达盒,所述表达盒由包含内含子A的5'CMV启动子和3'BGH聚腺苷酸化序列组成。除表达盒外,质粒还含有pUC18衍生的复制起点和β-内酰胺酶基因,该基因赋予氨苄青霉素抗性,用于在大肠杆菌中的质粒扩增。此外,表达载体含有兔IgG恒定区,设计成接受VH区。为了抗体表达,通过使用239-FreeTransfection试剂Novagen、根据试剂供应商建议的步骤将500ng分离的HC和LC质粒瞬时共转染到2ml96孔平板的HEK293-F细胞Invitrogen,目录号R790-07中。培养1周后,收获HEK上清液,过滤1.2μmSupor-PALL并用MabSelectSuRe50μl,GEHealthcare纯化。用1×PBS平衡柱。用2.5mMHCl,pH2.6洗脱样品,并用10×PBS中和。实施例18人CDCP1结合ELISA将NuncMaxisorb链霉亲和素包被的平板MicroCoat,目录号#11974998001用25μl孔的浓度为200ngml的生物素化的人CDCP1-AviHis融合蛋白包被,并在4℃下过夜孵育。洗涤后用2×90μl孔PBST缓冲液,加入25μl抗CDCP1抗体样品,其以1:2系列稀释,起始为5μgml。将平板在室温下孵育1小时。洗涤后用PBST-缓冲液3×90μl孔,加入以1:9,000稀释的25μl孔山羊-抗-人IgG-HRP缀合物Jackson,Cat.No.109-036-098和驴-抗-兔IgGGEHealthcare,目录号NA9340V,Lot#389592的混合物,并在室温下在振荡器上孵育1小时。洗涤后用PBST-缓冲液4×90μl孔,加入25μl孔的TMB底物Roche,目录号11835033001并孵育直至OD达到1.5-2.5。通过加入25μl孔1NHCl终止反应。在370492nm进行测量。

权利要求:1.选择参照抗体可变结构域编码核酸的变体的方法,其中与所述参照抗体可变结构域编码核酸编码的参照抗体可变结构域氨基酸序列相比,所述参照抗体可变结构域编码核酸的所述变体编码的变体抗体可变结构域氨基酸序列具有改善的可开发性,或其中在所述参照抗体可变结构域编码核酸的所述变体编码的变体抗体可变结构域氨基酸序列中,翻译后修饰的至少一个氨基酸残基与所述参照抗体可变结构域编码核酸编码的参照抗体可变结构域氨基酸序列相比,已经改变,其中当与相应的其他结构域配对时,变体和参照抗体可变结构域与相同的抗原结合,该方法包括以下步骤:i使用共有序列特异性引物在对多个含DNA样品的抗体可变结构域编码核酸的PCR扩增中获得的多个扩增产物进行测序,所述含DNA样品的每一个包含一个或多个抗体可变结构域编码核酸;ii在i的测序结果和参照抗体可变结构域编码核酸之间的序列比对中进行基于序列同一性同源性的抗体可变结构域编码核酸的排序,其中参照抗体可变结构域编码核酸是模板序列;和iii从步骤ii的序列排序排序的前10个序列之一中选择变体抗体可变结构域编码核酸,其中选择步骤iii中所选择的变体,使得改善可开发性和或改变至少一个翻译后修饰的氨基酸残基。2.一种选择参照抗体可变结构域的变体的方法,其中所述参照抗体可变结构域具有至少一个翻译后修饰的氨基酸残基,所述方法包括以下步骤:-使用参照抗体的序列作为模板序列,比对通过测序来自多个B细胞克隆的核酸产生的抗体可变结构域编码核酸,其中每个B细胞克隆产生特异性结合与参照抗体相同的靶的抗体;和-选择与参照序列具有最高结构或和功能同一性或和相似性的序列,其中参照抗体可变结构域的翻译后修饰的至少一个氨基酸残基中的至少一个被未经翻译后修饰的氨基酸残基替换改变。3.一种鉴定特异性结合相同靶抗原的参照抗体的变体抗体的方法,所述方法包括以下步骤:i产生特异性结合与参照抗体相同的靶的参照抗体变体抗体的多个氨基酸序列或核酸序列的一组或多组VH或和VL序列,其已通过二代测序确定,其中基于以下比对序列与作为模板的参照抗体的氨基酸序列或核酸序列,其中参照抗体特异性结合靶抗原,αVH或和VL的相同长度,或和β所有β-片层框架区的相同长度,或和γ所有HVRCDR的相同长度,或和δ相同的HVR3CDR3序列、允许的框架和或HVRCDR中至多3个氨基酸交换的突变,或和ε允许至多2个氨基酸交换的同源的HVRCDR3序列,和相同的HVRCDR1和2,或和ζ允许框架和HVRCDR中的突变;ii根据以下对i的一组或多组中的比对序列排序α与参照抗体序列不同的氨基酸的数量,和或β与参照抗体序列不同的氨基酸的位置,和或γ由与参照抗体序列不同的氨基酸产生的物理化学性质的变化,和或δ由与参照抗体序列不同的氨基酸产生的VHVL方向的不同;iii鉴定最佳10个比对和排序的抗体之一作为参照抗体的变体抗体,其中变体抗体确实具有至少一个比参照抗体少的翻译后修饰的氨基酸残基。4.根据权利要求3所述的方法,其中步骤i还包括用相同的编号方案注释序列,所述编号方案是Wolfguy编号方案。5.根据权利要求3至4中任一项所述的方法,其中所述序列的不同以以下形式注释:参照抗体氨基酸残基-位置-变体抗体氨基酸残基,并且被分组为突变元组。6.根据权利要求3至5中任一项所述的方法,其中所述物理化学性质的变化由电荷、疏水性和或大小的变化确定。7.根据权利要求3至6中任一项所述的方法,其中使用突变风险评分确定物理化学性质的变化。8.根据权利要求7所述的方法,其中所述突变风险评分基于下表确定,其中在该表中未明确给出的残基用值1加权:其中位置101至125对应于重链可变结构域框架1,位置151至199对应于CDR-H1,位置201至214对应于重链可变结构域框架2,位置251至299对应于CDR-H2,位置301至332对应于重链可变结构域框架3,位置351至399对应于CDR-H3,位置401至411对应于重链可变结构域框架4。9.根据权利要求3至9中任一项所述的方法,其中从来自与参照抗体相同的免疫活动的B细胞获得特异性结合与参照抗体相同的靶的变体抗体的多个氨基酸序列或核酸序列,其中对表达抗原特异性抗体的B细胞进行B细胞富集。10.根据权利要求1至9中任一项所述的方法,其中在变体中除去以下一个或多个:i可变结构域或HVR中未配对的Cys残基,ii糖基化位点,和iii降解热点Asp、Asn或Met。11.一种用于选择参照抗体可变结构域的变体的方法,其中所述参照抗体可变结构域具有至少一个翻译后修饰的氨基酸残基,所述方法包括根据权利要求1至10中任一项所述的方法的步骤。12.一种产生抗体的方法,包括以下步骤:-培养包含用权利要求1至2中任一项所述的方法获得的核酸和表达功能性抗体所需的所有其他核酸的细胞,-从细胞或培养基中回收抗体。13.一种细胞,其包含用根据权利要求1至10中任一项所述的方法获得的核酸。

百度查询: 豪夫迈·罗氏有限公司 发现替代性抗原特异性抗体变体的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。