打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
DNA测序的发展详述

DNA测序技术是分子生物学研究中最常用的技术,它的出现极大地推动了生物学的发展。成熟的DNA测序技术始于20世纪70年代中期。1977年Maxam和Gilbert报道了通过化学降解测定DNA序列的方法。同一时期,Sanger发明了双脱氧链终止法。20世纪90年代初出现的荧光自动测序技术将DNA测序带入自动化测序的时代。这些技术统称为第一代DNA测序技术。最近几年发展起来的第二代DNA测序技术则使得DNA测序进入了高通量、低成本的时代。目前,基于单分子读取技术的第三代测序技术已经出现,该技术测定DNA序列更快,并有望进一步降低测序成本,改变个人医疗的前景。现介绍DNA测序技术的发展历史及不同发展阶段各种主要测序技术的特点。

DNA测序技术的出现

早在DNA测序技术出现之前,蛋白质和RNA的测序技术就已经出现。1949年,FrederickSanger开发了测定胰岛素两条肽链氨基末端序列的技术,并在1953年测定了胰岛素的氨基酸序列。Edman也在1950年提出了蛋白质的N端测序技术,后来在此基础上发展出了蛋白质自动测序技术。Sanger等[8]在1965年发明了RNA的小片段序列测定法,并完成了大肠杆菌5SrRNA的120个核苷酸的测定。同一时期,Holley完成了酵母丙氨酸转运tRNA的序列测定。

DNA测序技术出现的较晚,1975年Sanger和Coulson发明了“加减法”测定DNA序列。1977年在引入双脱氧核苷三磷酸(ddNTP)后,形成了双脱氧链终止法,使得DNA序列测定的效率和准确性大大提高。Maxam和Gilbert[1]也在1977年报道了化学降解法测定DNA的序列。DNA序列测定技术出现后,迅速超越了蛋白质和RNA测序技术,成为现代分子生物学中最重要的技术。

第一代DNA测序技术

传统的化学降解法、双脱氧链终止法以及在它们的基础上发展来的各种DNA测序技术统称为第一代DNA测序技术。第一代测序技术在分子生物学研究中发挥过重要的作用,如人类基因组计划(humangenomeproject,HGP)主要基于第一代DNA测序技术。目前基于荧光标记和Sanger的双脱氧链终止法原理的荧光自动测序仪仍被广泛地应用。

2.1化学降解法

在该方法中,一个末端被放射性标记的DNA片段在5组互相独立的化学反应中分别被部分降解,其中每一组反应特异地针对某种碱基。因此生成5组放射性标记的分子,每组混合物中均含有长短不一的DNA分子,其长度取决于该组反应所针对的碱基在原DNA片段上的位置。最后,各组混合物通过聚丙烯酰胺凝胶电泳进行分离,再通过放射自显影来检测末端标记的分子。化学降解法刚问世时,准确性较好,也容易为普通研究人员所掌握,因此用得较多。而且化学降解较之链终止法具有一个明显的优点,即所测序列来自原DNA分子而不是酶促合成产生的拷贝,排除了合成时造成的错误。但化学降解法操作过程较麻烦,逐渐被简便快速的Sanger法所代替。

2.2双脱氧链终止法

双脱氧链终止法又称为Sanger法,该方法的原理是:核酸模板在DNA聚合酶、引物、4种单脱氧核苷三磷酸(dNTP,其中的一种用放射性P32标记)存在条件下复制时,在四管反应系统中分别按比例引入4种双脱氧核苷三磷酸(ddNTP),因为双脱氧核苷没有3′-OH,所以只要双脱氧核苷掺入链的末端,该链就停止延长,若链端掺入单脱氧核苷,链就可以继续延长。如此每管反应体系中便合成以各自的双脱氧碱基为3′端的一系列长度不等的核酸片段。反应终止后,分4个泳道进行凝胶电泳,分离长短不一的核酸片段,长度相邻的片段相差一个碱基。经过放射自显影后,根据片段3′端的双脱氧核苷,便可依次阅读合成片段的碱基排列顺序。Sanger法因操作简便,得到广泛的应用。后来在此基础上发展出多种DNA测序技术,其中最重要的是荧光自动测序技术。

2.3荧光自动测序技术

荧光自动测序技术基于Sanger原理,用荧光标记代替同位素标记,并用成像系统自动检测,从而大大提高了DNA测序的速度和准确性。早在1985年,Smith等采用激光激发标记的荧光,并用CCD检测,比常规电泳测序速度提高9倍,测序速度达到8000bp/h以上。20世纪80年代初Jorgenson和Lukacs提出了毛细管电泳技术(capillaryelectrophoresis)。1992年美国的Mathies实验室首先提出阵列毛细管电泳(capillaryarrayelectrophoresis)新方法,并采用激光聚焦荧光扫描检测装置,25只毛细管并列电泳,每只毛细管在1.5h内可读出350bp,DNA序列分析效率可达6000bp/h。1995年Woolley研究组用该技术进行测序研究,使用四色荧光标记法,每个毛细管长3.5cM,在9min内可读取150个碱基,准确率约97%。目前,应用最广泛的应用生物系统公司(appliedbiosystems,ABI)3730系列自动测序仪即是基于毛细管电泳和荧光标记技术的DNA测序仪。如ABI3730XL测序仪拥有96道毛细管,4种双脱氧核苷酸的碱基分别用不同的荧光标记,在通过毛细管时不同长度的DNA片段上的4种荧光基团被激光激发,发出不同颜色的荧光,被CCD检测系统识别,并直接翻译成DNA序列。

2.4杂交测序技术杂交法测序是20世纪80年代末出现的一种测序方法,该方法不同于化学降解法和Sanger法,而是利用DNA杂交原理,将一系列已知序列的单链寡核苷酸片段固定在基片上,把待测的DNA样品片段变性后与其杂交,根据杂交情况排列出样品的序列信息[18]。杂交测序检测速度快,采用标准化的高密度寡核苷酸芯片能够大幅度降低检测的成本,具有部分第二代测序技术的特点。但该方法误差较大,且不能重复测定。

第二代DNA测序技术

随着人类基因组计划的完成,人们进入了后基因组时代,即功能基因组时代,传统的测序方法已经不能满足深度测序和重复测序等大规模基因组测序的需求,这促使了新一代DNA测序技术的诞生。新一代测序技术也称为第二代测序技术,主要包括罗氏454公司的GSFLX测序平台、Illumina公司的SolexaGenomeAnalyzer测序平台和ABI公司的SOLiD测序平台。第二代测序技术最显著的特征是高通量,一次能对几十万到几百万条DNA分子进行序列测序,使得对一个物种的转录组测序或基因组深度测序变得方便易行。新一代测序技术将片段化的基因组DNA两侧连上接头,随后用不同的方法产生几百万个空间固定的PCR克隆阵列。每个克隆由单个文库片段的多个拷贝组成。然后进行引物杂交和酶延伸反应。由于所有的克隆都在同一平面上,这些反应就能够大规模平行进行,每个延伸反应所掺入的荧光标记的成像检测也能同时进行,从而获得测序数据。DNA序列延伸和成像检测不断重复,最后经过计算机分析就可以获得完整的DNA序列信息。

3.1454测序技术

454生命科学公司在2005年最早推出了第二代测序平台GenomeSequencer20,并测序了支原体Mycoplasmagenitalium的基因组。并在2007年推出性能更优的第二代基因组测序系统—GenomeSequencerFLXSystem(GSFLX)。罗氏在2005年便与454公司洽谈并购事宜,2007年完成并购,紧接着公布了DNA双螺旋的发现者之一———沃森(JimWatson)的个人基因组,测序总花费不到一百万美元。454公司在2010年即将推出初级版的新一代测序仪GSJunior,预计每次反应能得到100000条序列,是GSFLX的十分之一,读取的序列平均长度为400bp,准确率达99%,更适合规模较小的实验室。454测序技术利用了焦磷酸测序原理,

主要包括以下步骤。

3.1.1文库准备将基因组DNA打碎成300-800bp长的片段(若是snRNA或PCR产物可以直接进入下一步),在单链DNA的3′-端和5′-端分别连上不同的接头。

3.1.2连接带有接头的单链DNA被固定在DNA捕获磁珠上。每一个磁珠携带一个单链DNA片段。随后扩增试剂将磁珠乳化,形成油包水的混合物,这样就形成了许多只包含一个磁珠和一个独特片段的微反应器。

3.1.3扩增每个独特的片段在自己的微反应器里进行独立的扩增(乳液PCR,emulsionPCR),从而排除了其它序列的竞争。整个DNA片段文库的扩增平行进行。对于每一个片段而言,扩增产生几百万个相同的拷贝。乳液PCR终止后,扩增的片段仍然结合在磁珠上。

3.1.4测序携带DNA的捕获磁珠被放入PTP板中进行测序。PTP孔的直径(29μm)只能容纳一个磁珠(20μm)。放置在4个单独的试剂瓶里的4种碱基,依照T、A、C、G的顺序依次循环进入PTP板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在ATP硫酸化酶和荧光素酶的作用下,释放出光信号,并实时地被仪器配置的高灵敏度CCD捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号;由此一一对应,就可以准确、快速地确定待测模板的碱基序列。与其它第二代测序平台相比,454测序法的突出优势是较长的读长,目前GSFLX测序系统的序列读长已超过400bp。虽然454平台的测序成本比其他新一代测序平台要高很多,但对于那些需要长读长的应用,如从头测序,它仍是最理想的选择。

3.2Solexa测序技术

Illumina公司的新一代测序仪GenomeAnalyzer最早由Solexa公司研发,利用合成测序(SequencingbySynthesis)的原理,实现自动化样本制备及大规模平行测序。GenomeAnalyzer技术的基本原理是将基因组DNA打碎成约100-200个碱基的小片段,在片段的两个末端加上接头(adapter)。将DNA片段变成单链后通过接头与芯片表面的引物碱基互补而使一端被固定在芯片上。另外一端随机和附近的另外一个引物互补,也被固定住,形成桥状结构。通过30轮扩增反应,每个单分子被扩增大约1000倍,成为单克隆的DNA簇,随后将DNA簇线性化。在下一步合成反应中,加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。在DNA合成时,每一个核苷酸加到引物末端时都会释放出焦磷酸盐,激发生物发光蛋白发出荧光。用激光扫描反应板表面,在读取每条模板序列第一轮反应所聚合上去的核苷酸种类后,将这些荧光基团化学切割,恢复3′端黏性,随后添加第二个核苷酸。如此重复,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。GenomeAnalyzer系统需要的样品量低至100ng,文库构建过程简单,减少了样品分离和制备的时间,配对末端读长可达到2×50bp,每次运行后可获得超过20GB的高质量过滤数据,且运行成本较低,是性价比较高的新一代测序技术。

3.3SOLiD测序技术

SOLiD全称为SupportedOligoLigationDetetion,是ABI公司于2007年底推出的全新测序技术,目前已发展到SOLiD3Plus。与454和Solexa的合成测序不同,SOLiD是通过连接反应进行测序的。其基本原理是以四色荧光标记的寡核苷酸进行多次连接合成,取代传统的聚合酶连接反应。具体步骤包括:

3.3.1文库准备SOLiD系统能支持两种测序模板:片段文库(fragmentlibrary)或配对末端文库(mate-pairedlibrary)。片段文库就是将基因组DNA打断,两头加上接头,制成文库。该文库适用于转录组测序、RNA定量、miRNA研究、重测序、3′,5′-RACE、甲基化分析及ChIP测序等。配对末端文库是将基因组DNA打断后,与中间接头连接,环化,然后用EcoP15酶切,使中间接头两端各有27bp的碱基,最后加上两端的接头,形成文库。该文库适用于全基因组测序、SNP分析、结构重排及拷贝数分析等。

3.3.2扩增SOLiD用的是与454技术类似的乳液PCR对要测序的片段进行扩增。在微反应器中加入测序模板、PCR反应元件、微珠和引物,进行乳液PCR(emulsionPCR)。PCR反应结束后,磁珠表面就固定有拷贝数目巨大的同一DNA模板的扩增产物。

3.3.3微珠与玻片连接乳液PCR完成之后,变性模板,富集带有延伸模板的微珠,微珠上的模板经过3′修饰,可以与玻片共价结合。SOLiD系统最大的优点就是每张玻片能容纳更高密度的微珠,在同一系统中轻松实现更高的通量。含有DNA模板的磁珠共价结合在SOLiD玻片表面,SOLiD测序反应就在SOLiD玻片表面进行。每个磁珠经SOLiD测序后得到一条序列。

3.3.4连接测序SOLiD连接反应的底物是8碱基单链荧光探针混合物。探针的5′端用4种颜色的荧光标记,探针3′端第1、2位碱基是ATCG4种碱基中的任何两种碱基组成的碱基对,共16种碱基对,因此每种颜色对应着4种碱基对。3-5位是随机的3个碱基。6-8位是可以和任何碱基配对的特殊碱基。单向SOLiD测序包括5轮测序反应,每轮测序反应含有多次连接反应,得到原始颜色序列。SOLiD序列分析软件根据“双碱基编码矩阵”把碱基序列转换成颜色编码序列,然后与SOLiD原始颜色序列进行比较。由于双碱基编码规则中一种颜色对应4种碱基对,前面碱基对的第二个碱基是后面碱基对的第一个碱基,所以一个错误颜色编码就会引起连锁的解码错误,改变错误颜色编码之后的所有碱基。SOLiD序列分析软件可以对测序错误进行自动校正,最后“解码”成原始序列。因为SOLiD系统采用了双碱基编码技术,在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能,得到的原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前新一代基因分析技术中准确度最高的。超高通量是SOLiD系统最突出的特点,目前SOLiD3单次运行可产生50GB的序列数据,相当于17倍人类基因组覆盖度。

3.4第二代测序技术的应用

3.4.1从头测序(de-novosequencing)对于基因组未被测序过的生物,其基因组测序需要从头测序。由于受测序读取长度的限制,新一代测序技术中只有454技术能独立完成复杂基因组如真核生物基因组的从头测序工作。Solexa和SOLiD技术只能完成简单生物如细菌的基因组的从头测序。在复杂基因组的从头测序中,将Solexa/SOLiD与454技术或传统的Sanger测序技术结合,分别利用它们的高通量和较长读长的优势,可以大大降低测序成本,提高测序速度。如最近完成的黄瓜全基因组测序,就联合运用了Solexa技术和Sanger技术,得到平均72.2倍覆盖度的黄瓜基因组序列,其中3.9倍是用Sanger技术得到的,68.3倍是用Solexa的GA测序平台得到的。

3.4.2重测序如果对照一个参考基因组,新一代测序技术可以短时间内非常轻松的完成一个基因组的重测序。2008年,由中国、美国和英国共同启动的千人基因组计划(1000GenomesProject)是人类基因组计划的延续,也是迄今为止最大的基因组重测序计划。该计划打算测序大约1200个全世界不同国家的人类个体的基因组。454、ABI和Illumina共同加入该计划。

3.4.3SNP研究SNP全称是SingleNucleotidePolymorphism,意即单核苷酸多态性,是指不同个体的基因组上单个核苷酸的变异,包括替换、缺失和插入。SNP在基因组中分布相当广泛,一般来说,SNP是指变异频率大于1%的单核苷酸变异。SNP可以作为新的遗传标记,人体许多表型差异、对药物或疾病的易感性等等都可能与SNP有关。研究SNP是人类基因组计划走向应用的重要一环,因为SNP将提供一个强有力的工具,用于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等。新一代测序技术利用其高通量、低成本的优势,对较多的个体测序,很容易可以得到大量的SNP位点。千人基因组计划即可得到众多的人类基因组SNP位点。其它的在SNP研究中的应用如利用Solexa测序技术对线虫CB4858品系进行重测序,寻找线虫(Caenorhabditiselegance)基因组中的SNP位点,以及寻找橄榄型油菜(Brassicanapus)转录组(transcriptome)中的SNP位点等。

3.4.4转录组及表达谱分析基因表达谱(geneexpressionprofile)指细胞在特定的条件下表达的所有基因。分析基因表达谱是了解组织或器官行使功能的分子基础及环境和病变影响生物的分子机制等的重要手段。以往的基因表达谱分析主要依靠基因芯片技术,该技术需要依赖已知的基因序列来设计探针,通过荧光标记和杂交,根据荧光的强度计算表达量的多少,误差较大,而且无法检测未知基因的表达量。第二代测序技术可对单个细胞样品中的所有RNA即整个转录组进行整体测序,对每个细胞中表达1-50000个拷贝mRNA的基因都能够检测,该技术还可以检测以前没发现过的基因或新的转录本(transcript),定量测定基因的表达模式。如Mortazavi等[38]利用Solexa技术对小鼠的大脑、肝脏和骨骼肌进行了RNA测序,对测得的每条序列进行计数从而获得每个特定转录本的表达量,能检测到丰度非常低的转录本。分析测得的序列,至少有3500个基因拥有不止一种剪切形式,其中有接近10%是从未被报道过的RNA的剪切形式。同年Sugarbaker利用mRNA深度测序对恶性胸膜瘤和对照样品进行比较,发现了肿瘤细胞基因组中存在的15个不同的点突变。

3.4.5小分子RNA(miRNA)研究第二代测序技术还被广泛应用于小分子RNA(microRNA,miRNA)或非编码RNA(ncRNA)表达研究。非编码的小分子RNA参与了许多重要的生物发育过程。它们的序列长度很短,只有18-40个核苷酸,正好在新一代高通量测序技术的读长范围内。第二代测序方法还能发现新的小分子RNA。如利用Illumina的新一代测序技术对人胚胎干细胞发育前后的分析,获得了334个已知的和104个新发现的小RNA的表达谱。

3.4.6转录调控研究(ChIP-seq)染色体免疫共沉淀(chromatinimmunoprecipitation,ChIP)技术是研究蛋白-DNA相互作用的重要方法。以往的研究需结合芯片技术(即ChIP-on-chip或ChIP-chip),因为芯片技术基于杂交原理,需根据已知的序列设计探针,对于未知的序列无能为力。把ChIP技术和第二代测序技术结合,即ChIP-sequencing(ChIP-seq),可以在基因组水平上很方便的检测某种蛋白所结合的DNA序列,全面了解蛋白与DNA的相互作用。如2009年Ouyang等[43]利用ChIP-seq技术发现,在小鼠胚胎干细胞中,大约有65%的基因表达是由12个转录因子调控的。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
测序技术及测序报告中的SNP用途
关于基因你不可不知的一些知识!
焦磷酸测序(Pyrosequencing)原理
DNA测序40周年:DNA测序的过去、现在和未来(上篇)
第二代测序技术(东拼西凑的课程论文)
三分钟了解4代基因测序技术
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服