买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法_上海海洋大学_201811406204.X 

申请/专利权人:上海海洋大学

申请日:2018-11-23

公开(公告)日:2022-03-01

公开(公告)号:CN109486924B

主分类号:C12Q1/6869(20180101)

分类号:C12Q1/6869(20180101);C12Q1/6806(20180101);C12N15/11(20060101);C40B50/06(20060101)

优先权:

专利状态码:有效-授权

法律状态:2022.03.01#授权;2019.04.12#实质审查的生效;2019.03.19#公开

摘要:本发明公开了基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法,包括样本DNA序列破碎、修复序列平末端、序列末端加上串联条形码接头、修复序列空缺并延伸和PCR扩增的步骤构建DNA文库;其中串联条形码为6bp长度的DNA序列,且同时满足最小编辑长度3以内、包含不同碱基的片段、使用不同激光色的碱基且相邻碱基激光色不同和不含有AAA、ACA、CCC、CAC、GGG、GTG、TTT和TGT的碱基序列。通过提前引入串联条形码进行DNA标记,大大减少污染数据不能被识别的可能性,极大改善在DNA文库构建和基因富集过程中非常普遍的样本之间相互污染问题。

主权项:1.基于Illumina测序的串联条形码,其特征在于,包括IS1串联条形码和IS2串联条形码,其中:所述IS1串联条形码在95℃以0.1℃秒的速率降温至12℃的过程中IS1序列和与所述IS1序列具有部分互补片段的IS3X’序列结合形成;所述IS2串联条形码在95℃以0.1℃秒的速率降温至12℃的过程中IS2序列和与所述IS2序列具有部分互补片段的IS3Y’序列结合形成;所述IS1序列包括IS1_Ind1至IS1_Ind24,所述IS2序列包括IS2_Ind25至IS2_Ind48,所述IS3X’序列包括IS3_Ind1至IS3_Ind24,所述IS3Y’序列包括IS3_Ind25至IS3_Ind48,如下表所示,其中*表示PTO修饰: Name Sequence Name Sequence TCTGCC IS1_Ind1 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*t*g*c*c IS3_Ind1 ggcagaAGATCGGAA*G*A*G*C GTCTCT IS1_Ind2 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*c*t*c*t IS3_Ind2 agagacAGATCGGAA*G*A*G*C ATATTG IS1_Ind3 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTat*a*t*t*g IS3_Ind3 caatatAGATCGGAA*G*A*G*C TGGAAG IS1_Ind4 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtg*g*a*a* IS3_Ind4 cttccaAGATCGGAA*G*A*G*C TCTAGT IS1_Ind5 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*t*a*g*t IS3_Ind5 actagaAGATCGGAA*G*A*G*C AGAGTA IS1_Ind6 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTag*a*g*t*a IS3_Ind6 tactctAGATCGGAA*G*A*G*C GGCCAA IS1_Ind7 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgg*c*c*a* IS3_Ind7 ttggccAGATCGGAA*G*A*G*C TATCTC IS1_Ind8 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTta*t*c*t*c IS3_Ind8 gagataAGATCGGAA*G*A*G*C TTATGC IS1_Ind9 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtt*a*t*g*c IS3_Ind9 gcataaAGATCGGAA*G*A*G*C AGTTGG IS1_Ind10 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTag*t*t*g*g IS3_Ind10 ccaactAGATCGGAA*G*A*G*C GTCAAG IS1_Ind11 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*c*a*a* IS3_Ind11 cttgacAGATCGGAA*G*A*G*C CAGCAA IS1_Ind12 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTca*g*c*a* IS3_Ind12 ttgctgAGATCGGAA*G*A*G*C TCGCCG IS1_Ind13 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*g*c*c*g IS3_Ind13 cggcgaAGATCGGAA*G*A*G*C CTAAGA IS1_Ind14 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTct*a*a*g*a IS3_Ind14 tcttagAGATCGGAA*G*A*G*C CCGCTT IS1_Ind15 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*g*c*t*t IS3_Ind15 aagcggAGATCGGAA*G*A*G*C AAGTTA IS1_Ind16 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*g*t*t*a IS3_Ind16 taacttAGATCGGAA*G*A*G*C GGTACC IS1_Ind17 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgg*t*a*c*c IS3_Ind17 ggtaccAGATCGGAA*G*A*G*C CCAGGT IS1_Ind18 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*a*g*g*t IS3_Ind18 acctggAGATCGGAA*G*A*G*C AATCGA IS1_Ind19 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*t*c*g*a IS3_Ind19 tcgattAGATCGGAA*G*A*G*C AACGCA IS1_Ind20 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*c*g*c* IS3_Ind20 tgcgttAGATCGGAA*G*A*G*C GACGAC IS1_Ind21 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTga*c*g*a* IS3_Ind21 gtcgtcAGATCGGAA*G*A*G*C CGCGCT IS1_Ind22 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcg*c*g*c*t IS3_Ind22 agcgcgAGATCGGAA*G*A*G*C CCGTAG IS1_Ind23 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*g*t*a*g IS3_Ind23 ctacggAGATCGGAA*G*A*G*C GTAATC IS1_Ind24 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*a*a*t*c IS3_Ind24 gattacAGATCGGAA*G*A*G*C GACCTT IS2_Ind25 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTga*c*c*t*t IS3_Ind25 aaggtcAGATCGGAA*G*A*G*C TCATAA IS2_Ind26 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtc*a*t*a*a IS3_Ind26 ttatgaAGATCGGAA*G*A*G*C CAAGAG IS2_Ind27 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTca*a*g*a*g IS3_Ind27 ctcttgAGATCGGAA*G*A*G*C CGATCA IS2_Ind28 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTcg*a*t*c*a IS3_Ind28 tgatcgAGATCGGAA*G*A*G*C TTGATT IS2_Ind29 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtt*g*a*t*t IS3_Ind29 aatcaaAGATCGGAA*G*A*G*C TCCGAG IS2_Ind30 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtc*c*g*a*g IS3_Ind30 ctcggaAGATCGGAA*G*A*G*C CCTGAA IS2_Ind31 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTcc*t*g*a*a IS3_Ind31 ttcaggAGATCGGAA*G*A*G*C ATTCTT IS2_Ind32 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTat*t*c*t*t IS3_Ind32 aagaatAGATCGGAA*G*A*G*C GCGACT IS2_Ind33 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgc*g*a*c*t IS3_Ind33 agtcgcAGATCGGAA*G*A*G*C GGCTTC IS2_Ind34 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgg*c*t*t*c IS3_Ind34 gaagccAGATCGGAA*G*A*G*C AATACG IS2_Ind35 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTaa*t*a*c*g IS3_Ind35 cgtattAGATCGGAA*G*A*G*C TACGGT IS2_Ind36 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTta*c*g*g*t IS3_Ind36 accgtaAGATCGGAA*G*A*G*C ACCGTC IS2_Ind37 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTac*c*g*t*c IS3_Ind37 gacggtAGATCGGAA*G*A*G*C AGAAGC IS2_Ind38 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*a*a*g*c IS3_Ind38 gcttctAGATCGGAA*G*A*G*C CATAGC IS2_Ind39 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTca*t*a*g*c IS3_Ind39 gctatgAGATCGGAA*G*A*G*C AGGCTC IS2_Ind40 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*g*c*t*c IS3_Ind40 gagcctAGATCGGAA*G*A*G*C CTGCGG IS2_Ind41 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTct*g*c*g*g IS3_Ind41 ccgcagAGATCGGAA*G*A*G*C CTCGGC IS2_Ind42 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTct*c*g*g*c IS3_Ind42 gccgagAGATCGGAA*G*A*G*C GATTAG IS2_Ind43 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTga*t*t*a*g IS3_Ind43 ctaatcAGATCGGAA*G*A*G*C AGATAT IS2_Ind44 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*a*t*a*t IS3_Ind44 atatctAGATCGGAA*G*A*G*C TGGTCC IS2_Ind45 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtg*g*t*c*c IS3_Ind45 ggaccaAGATCGGAA*G*A*G*C GTTCCG IS2_Ind46 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgt*t*c*c*g IS3_Ind46 cggaacAGATCGGAA*G*A*G*C GTACGT IS2_Ind47 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgt*a*c*g*t IS3_Ind47 acgtacAGATCGGAA*G*A*G*C AAGAAC IS2_Ind48 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTaa*g*a*a*c IS3_Ind48 gttcttAGATCGGAA*G*A*G*C

全文数据:基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法技术领域本发明涉及分子标记,涉及DNA文库标记,具体涉及一种基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法。背景技术在使用Illumina方法进行测序时,目前通用DNA文库构建的步骤为破碎、修复平末端、加上IS7、IS8引物识别位点接头、补足接头与序列之间出现的空缺,最后进行indexingPCR时为序列加上条形码以便区分样本,测序后得到的数据根据此条形码进行分类。但是,上述方法在整个实验步骤最后加上条形码,如果在之前的步骤中样本之间发生相互污染,则无法区分数据是属于哪个样本。现有技术中,专利申请CN107502607A公开了一种大量组织、细胞样本mRNA的分子条形码标记、文库构建、测序的方法,用于反转录mRNA,合成cDNA时进行标记,但不适用于DNA文库构建。专利CN104573407B公开了一种物种特异性内源性条形码的搜索方法及其在多样本混合测序中的应用,通过重叠延伸PCR技术,利用样本内源DNA序列的差异对PCR产物进行标记,与DNA文库构建无关,也没有包括条形码标记技术。目前,DNA样本间交叉污染现象非常严重,对后续数据的组装和分析造成很大困扰和隐患。发明内容为克服上述现有技术的不足,本发明的目的在于提供一种基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法,在文库构建初期即加入可以区分样本的串联条形码InlineIndex接头,通过串联条形码标记构建DNA文库,准确区分不同DNA样本。相对于传统的分子条形码技术,不仅纠正受到污染的数据,还大大增加条形码组合的数量用于区分更多样本,节约成本。为实现上述发明目的,本发明采用的技术方案如下:第一方面,基于Illumina测序的串联条形码为6bp长度的DNA序列,且同时满足ⅰ最小编辑长度3以内,和ⅱ包含不同碱基的片段,和ⅲ使用不同激光色的碱基,且相邻碱基激光色不同,和ⅳ不含有'AAA'、'ACA'、'CCC'、'CAC'、'GGG'、'GTG'、'TTT'和'TGT'的碱基序列。优选的,所述串联条形码包括IS1串联条形码、IS2串联条形码和与所述IS1串联条形码和IS2串联条形码对应的IS3串联条形码。且所述IS3串联条形码与所述IS1串联条形码和IS2串联条形码之间分别具有部分互补片段。优选的,所述IS1串联条形码包括IS1序列和与所述IS1序列具有部分互补片段的IS3X’序列,通过在95℃以0.1℃秒的速率降温至12℃,所述IS1序列和所述IS3X’序列结合形成所述IS1串联条形码。优选的,所述IS2串联条形码包括IS2序列和与所述IS2序列具有部分互补片段的IS3Y’序列,通过在95℃以0.1℃秒的速率降温至12℃,所述IS2序列和所述IS3Y’序列结合形成所述IS2串联条形码。第二方面,通过上述串联条形码标记的DNA文库的构建方法,具体地,包括以下步骤:1生物样本DNA序列破碎,获取DNA片段序列,和2修复上述DNA片段序列平末端,和3在所述DNA片段序列5’端加上IS1串联条形码接头,所述DNA片段序列3’端加上IS2串联条形码接头,且引物IS7的结合位点位于所述IS1串联条形码接头外侧,引物IS8的结合位点位于所述IS2串联条形码接头外侧,和4修复所述DNA片段序列空缺并延伸,和5采用所述引物IS7、IS8对DNA序列进行PCR扩增,即得。本发明的有益效果在于:传统DNA文库的构建方法中,不断重复地清洗步骤很容易造成样本之间,或者外源性DNA对样本的污染,加上生物探针敏感,导致低浓度的污染DNA也可能被捕获、测序。本发明通过提前引入串联条形码进行DNA标记,大大减少污染数据不能被识别的可能性,极大改善在DNA文库构建和基因富集过程中非常普遍的样本之间相互污染问题。另外,通过本发明标记后的DNA样本可以相互混合用于基因富集、测序,大大降低基因富集技术操作的复杂性和繁琐程度。附图说明图1:串联条形码的制作过程为:在95℃以0.1℃秒的速率降温至12℃的过程中对应的IS1和IS3X’结合形成IS1串联条形码;同样的,在95℃以0.1℃秒的速率降温至12℃的过程中对应的IS2和IS3Y’结合形成IS2串联条形码。图2:DNA文库的建立过程依次为:DNA序列平末端修复、两端添加串联条形码接头、修复空缺并延伸DNA;由于引物IS7、IS8的结合位点分别位于IS1、IS2的接头序列最外侧,用引物IS7和引物IS8对DNA序列进行PCR扩增即完成DNA文库。基因富集实验过程中,利用特异探针对DNA文库进行目标片段抓取,引物IS4和测序用条形码Index引物的结合位点分别位于引物IS7和引物IS8外侧,获得最终目标片段后对DNA序列进行indexPCR扩增,并进行Illumina测序,也可用引物IS4和Index引物对DNA文库进行扩增直接测序获得基因组信息。具体实施方式下面结合附图详细说明本发明的技术方案,但本发明的保护范围不限于下述的实施例。实施例1构建串联条形码,根据表1所提供的DNA序列进行合成,先配置OligoHybridizationBufferNaCl5M1mL,Tris-ClpH8.01M100μL,EDTApH8.00.5M20μL和H2O8.88mL。具体步骤如下:将IS1和对应编号的IS3混合,并加入OligoHybridizationBuffer来形成双链接头IS1_adapter_P5.F500μM10μL、IS3_adapter_P5+P7.R500μM10μL、OligoHybridizationBuffer10×10μL、H2O70μL。将IS2和对应编号的IS3混合,并加入OligoHybridizationBuffer来形成双链接头IS2_adapter_P7.F500μM10μL、IS3_adapter_P5+P7.R500μM10μL、OligoHybridizationBuffer10×10μL、H2O70μL。将上述两种混合液分别在PCR仪中95℃下反应10秒,然后以0.1℃秒的速率从95℃降温至12℃,再以20μL每管进行分装,并在管盖上做好编号,在-20℃环境下保存备用,如图1所示。表1:InlineIndex信息NameSequenceNameSequenceTCTGCCIS1_Ind1A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*t*g*c*cIS3_Ind1ggcagaAGATCGGAA*G*A*G*CGTCTCTIS1_Ind2A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*c*t*c*tIS3_Ind2agagacAGATCGGAA*G*A*G*CATATTGIS1_Ind3A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTat*a*t*t*gIS3_Ind3caatatAGATCGGAA*G*A*G*CTGGAAGIS1_Ind4A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtg*g*a*a*gIS3_Ind4cttccaAGATCGGAA*G*A*G*CTCTAGTIS1_Ind5A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*t*a*g*tIS3_Ind5actagaAGATCGGAA*G*A*G*CAGAGTAIS1_Ind6A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTag*a*g*t*aIS3_Ind6tactctAGATCGGAA*G*A*G*CGGCCAAIS1_Ind7A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgg*c*c*a*aIS3_Ind7ttggccAGATCGGAA*G*A*G*CTATCTCIS1_Ind8A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTta*t*c*t*cIS3_Ind8gagataAGATCGGAA*G*A*G*CTTATGCIS1_Ind9A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtt*a*t*g*cIS3_Ind9gcataaAGATCGGAA*G*A*G*CAGTTGGIS1_Ind10A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTag*t*t*g*gIS3_Ind10ccaactAGATCGGAA*G*A*G*CGTCAAGIS1_Ind11A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*c*a*a*gIS3_Ind11cttgacAGATCGGAA*G*A*G*CCAGCAAIS1_Ind12A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTca*g*c*a*aIS3_Ind12ttgctgAGATCGGAA*G*A*G*CTCGCCGIS1_Ind13A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*g*c*c*gIS3_Ind13cggcgaAGATCGGAA*G*A*G*CCTAAGAIS1_Ind14A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTct*a*a*g*aIS3_Ind14tcttagAGATCGGAA*G*A*G*CCCGCTTIS1_Ind15A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*g*c*t*tIS3_Ind15aagcggAGATCGGAA*G*A*G*CAAGTTAIS1_Ind16A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*g*t*t*aIS3_Ind16taacttAGATCGGAA*G*A*G*CGGTACCIS1_Ind17A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgg*t*a*c*cIS3_Ind17ggtaccAGATCGGAA*G*A*G*CCCAGGTIS1_Ind18A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*a*g*g*tIS3_Ind18acctggAGATCGGAA*G*A*G*CAATCGAIS1_Ind19A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*t*c*g*aIS3_Ind19tcgattAGATCGGAA*G*A*G*CAACGCAIS1_Ind20A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*c*g*c*aIS3_Ind20tgcgttAGATCGGAA*G*A*G*CGACGACIS1_Ind21A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTga*c*g*a*cIS3_Ind21gtcgtcAGATCGGAA*G*A*G*CCGCGCTIS1_Ind22A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcg*c*g*c*tIS3_Ind22agcgcgAGATCGGAA*G*A*G*CCCGTAGIS1_Ind23A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*g*t*a*gIS3_Ind23ctacggAGATCGGAA*G*A*G*CGTAATCIS1_Ind24A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*a*a*t*cIS3_Ind24gattacAGATCGGAA*G*A*G*CGACCTTIS2_Ind25G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTga*c*c*t*tIS3_Ind25aaggtcAGATCGGAA*G*A*G*CTCATAAIS2_Ind26G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtc*a*t*a*aIS3_Ind26ttatgaAGATCGGAA*G*A*G*CCAAGAGIS2_Ind27G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTca*a*g*a*gIS3_Ind27ctcttgAGATCGGAA*G*A*G*CCGATCAIS2_Ind28G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTcg*a*t*c*aIS3_Ind28tgatcgAGATCGGAA*G*A*G*CTTGATTIS2_Ind29G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtt*g*a*t*tIS3_Ind29aatcaaAGATCGGAA*G*A*G*CTCCGAGIS2_Ind30G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtc*c*g*a*gIS3_Ind30ctcggaAGATCGGAA*G*A*G*CCCTGAAIS2_Ind31G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTcc*t*g*a*aIS3_Ind31ttcaggAGATCGGAA*G*A*G*CATTCTTIS2_Ind32G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTat*t*c*t*tIS3_Ind32aagaatAGATCGGAA*G*A*G*CGCGACTIS2_Ind33G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgc*g*a*c*tIS3_Ind33agtcgcAGATCGGAA*G*A*G*CGGCTTCIS2_Ind34G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgg*c*t*t*cIS3_Ind34gaagccAGATCGGAA*G*A*G*CAATACGIS2_Ind35G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTaa*t*a*c*gIS3_Ind35cgtattAGATCGGAA*G*A*G*CTACGGTIS2_Ind36G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTta*c*g*g*tIS3_Ind36accgtaAGATCGGAA*G*A*G*CACCGTCIS2_Ind37G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTac*c*g*t*cIS3_Ind37gacggtAGATCGGAA*G*A*G*CAGAAGCIS2_Ind38G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*a*a*g*cIS3_Ind38gcttctAGATCGGAA*G*A*G*CCATAGCIS2_Ind39G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTca*t*a*g*cIS3_Ind39gctatgAGATCGGAA*G*A*G*CAGGCTCIS2_Ind40G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*g*c*t*cIS3_Ind40gagcctAGATCGGAA*G*A*G*CCTGCGGIS2_Ind41G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTct*g*c*g*gIS3_Ind41ccgcagAGATCGGAA*G*A*G*CCTCGGCIS2_Ind42G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTct*c*g*g*cIS3_Ind42gccgagAGATCGGAA*G*A*G*CGATTAGIS2_Ind43G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTga*t*t*a*gIS3_Ind43ctaatcAGATCGGAA*G*A*G*CAGATATIS2_Ind44G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*a*t*a*tIS3_Ind44atatctAGATCGGAA*G*A*G*CTGGTCCIS2_Ind45G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtg*g*t*c*cIS3_Ind45ggaccaAGATCGGAA*G*A*G*CGTTCCGIS2_Ind46G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgt*t*c*c*gIS3_Ind46cggaacAGATCGGAA*G*A*G*CGTACGTIS2_Ind47G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgt*a*c*g*tIS3_Ind47acgtacAGATCGGAA*G*A*G*CAAGAACIS2_Ind48G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTaa*g*a*a*cIS3_Ind48gttcttAGATCGGAA*G*A*G*C*表示PTO修饰实施例2构建DNA文库,采用CovarisM220超声波破碎仪Covaris,Inc.MassachusettsUSA将生物样本DNA序列破碎至长度约250-500bp的DNA片段序列,破碎程序为:运行90秒50peakpower,25dutyfactor,200cyclesburst,暂停60秒,运行90秒50peakpower,25dutyfactor,200cyclesburst。在270μL离心管中,加入35μLMagNAbeads,放入磁板并静置1分钟,吸去清液后留下干燥磁珠。在MagNAbeads干燥后,加入60μLDNA样本与54μL的MagNAbeadsBuffer,混匀,并同时准备正对照和负对照。室温放置10分钟后,将离心管放到磁板上,小心地吸出上清液。加入70%酒精186μL,放置1分钟后吸去,重复一次后打开离心管盖,放置5分钟使残留酒精挥发。准备20μL的混合物BufferTango10×2.2μL、1×dNTPs10mMeach0.22μL、ATP100mM0.22μL、T4polynucleotidekinase10UμL1.1μL、T4DNApolymerase5UμL0.44μL、H2O17.82μL,加入放有干燥的MagNAbeads离心管中在冰盒上操作,混合均匀,将离心管放入PCR仪中修复DNA粘性末端,运行程序为:15分钟25℃,5分钟12℃。将样本拿出PCR仪后,加入18μLMagNAbeadsBuffer,充分混匀后,放在磁板上静置5分钟,吸去上清液。加入186μL的70%酒精,室温静置1分钟后,去除酒精。重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。配置混合溶液38μLT4DNAligasebuffer10×4.4μL,PEG-400050%4.4μL,5%,T4DNAligase5UμL1.1μL,H2O31.9μL。配置完成后,加入放有干燥的MagNAbeads离心管中在冰盒上操作,再分别加入对应样本、正对照和副对照的串联条形码。放入PCR仪中,运行程序为:30分钟22℃。将样本拿出PCR仪后,加入36μLMagNAbeadsBuffer,充分混匀后,放在磁板上静置5分钟,吸去上清液,加入186μL的70%酒精,室温静置1分钟后,去除酒精;重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。为了补足加上串联条形码后接头与序列之间出现的空缺,用Bsm酶从5’端替换延伸填补空缺,配置混合溶液40μLBsmbuffer10×4.4μL、dNTPs10mMeach1.1μL、Bsmpolymerase、largefragment8UμL1.65μL、H2O36.85μL。配置完成后,加入放有干燥的MAGNAbeads离心管中在冰盒上操作。放入PCR仪上,运行程序为:20分钟37℃。将样本拿出PCR仪后,加入36μLMagNAbeadsBuffer充分混匀,放在磁板上静置5分钟,吸去上清液。加入186μL的70%酒精,室温静置1分钟后,去除酒精。重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。加入35μLTEBuffer,转入新离心管命名为lib中,-20℃保存。参见附图2,经过上述DNA序列平末端修复、两端添加串联条形码接头、修复空缺并延伸DNA的步骤处理后,由于引物IS7、IS8的结合位点分别位于IS1、IS2的接头序列最外侧,再用引物IS7和引物IS8对DNA序列进行PCR扩增即完成DNA文库。另外,基因富集实验过程中,利用特异探针对DNA文库进行目标片段抓取,引物IS4和测序用条形码Index引物的结合位点分别位于引物IS7和引物IS8外侧,获得最终目标片段后对DNA序列进行indexPCR扩增,并进行Illumina测序,也可用引物IS4和Index引物对DNA文库进行扩增直接测序获得基因组信息。

权利要求:1.基于Illumina测序的串联条形码,其特征在于,所述串联条形码为6bp长度的DNA序列,且同时满足ⅰ最小编辑长度3以内,和ⅱ包含不同碱基的片段,和ⅲ使用不同激光色的碱基,且相邻碱基激光色不同,和ⅳ不含有'AAA'、'ACA'、'CCC'、'CAC'、'GGG'、'GTG'、'TTT'和'TGT'的碱基序列。2.根据权利要求1所述的基于Illumina测序的串联条形码,其特征在于,所述串联条形码包括IS1串联条形码、IS2串联条形码和与所述IS1串联条形码和IS2串联条形码对应的IS3串联条形码。3.根据权利要求1或2所述的基于Illumina测序的串联条形码,其特征在于,所述IS1串联条形码包括IS1序列和与所述IS1序列具有部分互补片段的IS3X’序列,通过在95℃以0.1℃秒的速率降温至12℃,所述IS1序列和所述IS3X’序列结合形成。4.根据权利要求1或2所述的基于Illumina测序的串联条形码,其特征在于,所述IS2串联条形码包括IS2序列和与所述IS2序列具有部分互补片段的IS3Y’序列,通过在95℃以0.1℃秒的速率降温至12℃,所述IS2序列和所述IS3Y’序列结合形成。5.权利要求1-4任一项所述基于Illumina测序的串联条形码标记DNA文库的构建方法,其特征在于,包括以下步骤:1生物样本DNA序列破碎,获取DNA片段序列,和2修复上述DNA片段序列平末端,和3在所述DNA片段序列5’端加上IS1串联条形码接头,所述DNA片段序列3’端加上IS2串联条形码接头,且引物IS7的结合位点位于所述IS1串联条形码接头外侧,引物IS8的结合位点位于所述IS2串联条形码接头外侧,和4修复所述DNA片段序列空缺并延伸,和5采用所述引物IS7、IS8对DNA序列进行PCR扩增,即得。

百度查询: 上海海洋大学 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。