当前位置:文档之家› 下一代测序技术

下一代测序技术

下一代测序技术
下一代测序技术

下一代测序技术

摘要|从未有过的巨大革命技术需求交付快速、廉价、准确的基因组信息。这一挑战也促进了下一代测序技术的发展。传统方法主要的优势是生产大量廉价的序列数据。在这里,我进行一下技术回顾,模板制备、测序成像、基因定位和装配方法以及当前的最新进展和短期商用的下一代测序技术。除了为解决生物问题的兴趣提供平台选择指导,再略述下一代测序技术的广泛应用。

在过去的四年里,进行基因组分析的自动化桑格测序技术的应用发生了根本性的转变。在这之前,自动化桑格技术主导该产业几乎20年,并作出了巨大的成就,包括唯一完整的人类基因组序列。尽管在这个年代很多技术都在提高,然而自动化桑格测序技术的局限性,展现出对一种面向大量人类基因组测序的新的改良技术的需求。最近致力于研究新的方法,桑格测序可能提的会少一些。因此,本篇文章不包括桑格测序,有兴趣的读者可以读一下前面的文章。

自动化桑格方法被认为是“第一代”技术,新的方法被称为下一代基因测序。这些新技术组成不同的策略,依赖于模板准备,测序和成像,基因组比对和装配的方法结合。下一代测序技术的到来改变了我们在基础、应用和临床研究方面的思考方式。在某些方面,下一代测序技术类似于以前的聚合酶反应链,主要使用局限在成像方面。下一代测序技术的提高在于其能廉价地生产出一个巨大的数据量,在某些情况下仪器运行超过十亿短读。这个特性扩展了实验以外的领域,不仅仅是在确定的顺序集上。例如,基因表达研究基因芯片现在被基于序列的方法所代替,这种方法可以识别和量化罕见的转录体,没有先验知识的一个特定的基因,并且提供特定基因的可变剪接和序列变化方面的相关信息。测序许多相关生物的整个基因组的能力使得大规模的比对和进化研究被实施,这在几年前是不可想象的。下一代测序技术最广泛的应用可能是对人类基因的重新排序以增强人们对不同的基因如何影响健康和疾病的理解。下一代测序的各种特性使得它在市场上可能共存于多个平台,因为它在特定应用上有明显的优势。

本文专注于商用技术,来自罗氏/ 454,Illumina/ Solexa,LIFE/ APG和Polonator Helicos生物科学仪器和近期的太平洋生物科学,旨在2010年将他们的测序设备引进市场。纳米孔测序没有被覆盖,尽管有兴趣的读者通过布兰顿和他的同事们针对一篇文章,描述了进展并对这项技术保持挑战。在这里,我提出一个技术的回顾,模板准备,测序和成像,基因组比对和装配,当前下一代基因测序平台的性能,为这些技术如何工作和如何将这些技术应用于重要的生物问题上提供指导。我强调用目标和整个基因组方法进行人类基因组重组的应用,讨论这些方法的进展和局限性,和接下来几年即将看到的进展和预期的影响。

下一代测序技术

测序技术包括很多方法,宽泛的分为模板准备,测序和成像,数据分析。特定协议的独特结合使得一个技术区别于其他技术,决定着来自每个平台产生的数据类型。当基于数据的质量和成本比较时这些输出数据的不同面临挑战。尽管质量分数和精度估计是由每个制造商提供的,从一个平台到另一个平台“质量基础”是没有一致性的。下文将会讨论各种测序指标。

在下面几节中,讨论模板准备和测序成像,因为它们适用于现有和近期的商业平台。下面有两种方法用于为下一代测序反应准备模板:从单个DNA分子克隆扩增的模板,和单个DNA分子模板。合成测序,在文献中用于描述大量的脱氧核糖核苷酸的方法,在这篇文章中,因为它无法描述测序中的不同机制,所以

没有用到。相反,这些方法被列为循环可逆终止(CRT),单基因(SNA)和实时测序。还描述了结扎测序(SBL),一种由DNA连接酶替换DNA聚合酶的方法。成像方法再加上这些从测量生物发光信号到单核分子的四色成像事件测序策略。下一代测序平台产出大量数据代替了信息技术在数据存储,追踪和质量控制方面的大量需求。

模板准备

需要一个健壮的方法产出一个代表,基因组在调查过程中再怎么强调核酸物质的无偏来源都不为过。目前的方法通常致力于随机的将DNA基因组破坏为较小规格的DNA从中创建片段模板或是双端模板。在下一代测序技术中的一个普遍主题是模板固定或支撑在固体表面。空间的固定分离了模板珠允许数十亿的测序反应同时进行。

克隆扩增模板大多数成像系统没有被设计为检测单一的荧光事件,所以需要扩增模板。两种最普通的方法是感光乳剂聚合酶链反应和固相扩增。感光乳剂聚合酶链反应被用于在非细胞系统准备测序模板,有利于避免基因组序列的任意损失。在细菌克隆方法中存在一个固有的问题。一个片段或配对库被创建后,转接器包含通用的启动点,被绑定在目标末端。允许复杂的基因组用普通的聚合酶链反应引物进行扩增。绑定之后,DNA被分离成单股并捕获到每个支持一个DNA 分子的点的情况。在成功扩增和改进感光乳剂聚合酶链反应后,数百万可以固定聚丙烯酰胺凝胶在一个标准的显微镜幻灯片上,化学的交联在一个氨基酸镀膜玻璃表面或者很好地沉积成单个下一代测序化学过程可以被执行的蛋白酪氨酸磷酸酯酶(PTP)。

固相扩增也可用于随机分布的生产,克隆扩增的集群来自一个载玻片的片段或配对模板。高密度的正向反向引物共价键覆在滑片上,支撑物上引物模板的比率界定了扩增集群的表面密度。固相扩增能产出1、2亿空间上分离的模板集群。为能被混合生成到启动下一代测序反应的一个普通的测序引物提供游离末端。

单一分子模板尽管克隆扩增方法在细菌克隆方面提供了一定的优势。有些协议实现繁琐,要求大量基因组DNA原料。单一的DNA分子模板准备起来更加直接,只需要少量的启动原料。更重要的是,这些方法不需要聚合酶链反应,在克隆扩增模板时突变,伪装为序列变体。AT-rich and GC-rich目标测序可能也展现了生产领域的扩增偏见,导致在基因组比对和装配代表不足。定量应用,例如RNA测序,与未扩增的模板资源,更有效的执行,不改变表征丰富的信使RNA 分子。

在下一代基因测序未实施之前,单核分子模板通常固定在固体支撑上至少使用三个不同的方法之一。在一个方法中,空间分布的单个引物分子共价附着在固体支撑上。模板准备通过随机分割启动原料至小规模,加上普通的转接器到片段末端,混合生成固定的引物。在第二种方法中,空间分布单个分子模板键和固定在固体支撑上,通过引发扩展单链,从固定化引物到单核分子模板。一个普通的引物就被混合生成模板。在这两种方法中,DNA聚合酶绑定固定的引物模板配置最初的下一代测序反应。以上两种方法都在螺旋生物科学中用过。在第三种方法中,空间分布单个聚合酶分子固定在一个引物模板分子被绑定固体支撑上。这种方法被太平洋生物科学用过,在Life/visiGen 16 and LI-COR生物科学专利中描述过。这种技术可用于大的DNA分子,不像前两种方法,第三种能用于实时方法,导致潜在的长读取长度。

测序和成像

测序克隆扩增和单核分子模板有着本质的区别。克隆扩增导致同一模板种群,每个都经历了测序反应。成像,所观察到的信号是在给定周期中附加到相同的模板的核苷酸或探针的共识。这代表在效率增加过程中一个更大的需求,模板总体效果的不完整扩充后随链移相。另外多个核苷酸或探针也发生在一个即定的周期,导致领头链移相。信号移相增加了荧光噪音,造成碱基判定错误和较短读取。因为移相不是一个用于单分子模板的事件,为了循环效率的要求放宽。然而,在任何既定的周期中单核分子易受多个核苷酸或探针增加的影响。这里,删除错误被在毗邻的染色分子或无信号被检测到因为黑核苷酸或探针的合并。在接下来的一部分,测序和成像策略将用克隆扩增和单核分子模板来讨论。

循环可逆终结顾名思义,循环可逆终结是在一个循环方法中用可逆终结来使核苷酸合并,荧光成像和分裂。在第一步中,一个DNA聚合酶,结合启动模板,添加或是合并仅仅一个荧光改变核苷酸,作为对基础模板的补充。在单核核苷酸增加之后DNA合成终结是CRT的一个重要特征。合并之后,剩余的未合并的核苷酸被冲洗。成像用来决定合并后的核苷酸的身份。通过一步分裂,消除了终止/抑制组和荧光染料。另外的冲洗是在下一个合并开始之前被执行。

CRT方法的核心是可逆结束符,分为两步:3’端封锁和3’端未封锁。双脱氧核苷酸在桑格测序中充当着一个链结束符的角色,链接在核苷酸3’末端,为初始的反转封锁组发展提供基础。封锁组,such as 3′-O-allyl2′-deoxyribonucleoside triphosphates (dNTPs) 21 and3′-O-azidomethyl-dNTPs ,已被成功用在了CRT中。3’封锁结束符要求两个化学键的分解来消除来自核苷酸的荧光和恢复3’-OH组。

目前,Illumina公司/ Solexa基因组分析仪(GA)23在门店市场上占据主导地位。它使用克隆增强模板方法,耦合四色CRT方法。这四个颜色通过全内反射荧光(TIRF)使用两个激光成像探测到,输出在图二中描述。玻片被划分为八个频道,它允许独立样本同时运行。表一展示了当前Illumina/Solexa GA II平台在贝勒大学医学院人类基因组测序中心上运行的测序数据。替换是最普遍的错误类型,大部分错误发生在最早合并核苷酸是’G’基。Illumina/Solexa数据的基因组分析揭示了AT-rich和GC-rich区域代表不足,很可能由于模板准备期间的扩增偏差。通过生物信息工具如mAQ 或eLAND ,比对读取参照基因组称为序列变异。宾利和他的同事们记录了单核核苷酸变体(SNV)很高的一致性(99.5%),用相同的比对工具进行标准基因型分析组,和异常的假阳性率为2.5%的单核核苷酸变体。其他的记录者描绘了用这些比对工具更高的异常单核核苷酸变体假阳性率。

困难包括识别一个有效合并3’封锁末端的修改了的酶--需要筛选大的突变DNA聚合酶库--促使了3’未封锁端可逆末端的发展。LaserGen,Inc. 是第一组展示一个小终止组相连的畅通无阻的核苷酸3′端可以作为一个有效的可逆的终结者,通过原生DNA聚合酶合并。这促使了快速终止剂的发展。Helicos是生物科学报道了虚拟终止剂的发展,3′畅通终端与第二个核苷类似物作为抑制剂。3′畅通终端面临的挑战是创建适当的修改终止(快速终止剂)或抑制组(虚拟终端)

以使得DNA合成在单基添加后结束。一个未封锁的3’-OH组重要是因为它为下一个核苷酸的合并提供了天然基质。单键的分裂只需要消除终止或抑制组,来自核苷酸的萤光组比起3’-封锁结束符是一个更有效的策略来为下一个CRT周期恢复核苷酸。

Helicos生物科学是第一个商品化单分子测序仪的团队,HeliScope, 是基于Quake和他的同事们。HeliScope用单核分子模板方法,在图一c和图1d中可以看到,和一色CRT方法结合,在图2c中可以看到。一个核苷酸的合并形成一个

荧光信号。HeliScope,也用TIRF(全内反射荧光)去形成CY5的染料,他的成像可以在图2d看到。Harris和他的同事们用Cy5-12ss-dNTPs,这是早期版本的虚拟终端,缺乏抑制组,报道当使用引物固定方法时聚合物重复区域的删除错误是最常见的错误类型,图1 c。这很可能与在一个给定周期内两个或更多Cy5-12ss-dNTPs 合并有关。这些错误可以通过两阶段测序极大减少,这提供了用模板更改策略基于~25的一致读取。图1d.在2009年的进步基因组生物学和技术(AGBT)会议上, Helicos团队报道他们近来在测序线虫基因组方面的进展。从单个HeliScope仪器的运行仅用50个工具中的7个,大约2.8 Gb的高质量的数据生成从> 25-base一致读取0,1或2 个错误8天。报道基因组大于99%的覆盖率,显示> 5倍覆盖的区域,共识的正确率是99.999%。

结扎测序SBL是另一个循环方法不同于用于DNA连接酶的CRT,是一基编码探针或双基编码探针.最简单的形式是,一种荧光标记的探针混合生成毗邻原始模板的补充序列。然后添加DNA连接酶加入有染料标记的原始探针上。没有绑定的探针被冲洗,通过荧光成像决定绑定探针的特性。周期重复通过用可分裂的探针去除荧光染料,再为随后结扎周期生成一个5′-PO4组或通过删除和为模板再生新的引物。

Shendure and colleagues用的结扎测序方法测序Escherichia coli mG1655基因组。双端测序准备了四个引物(A1-A4),通过感光聚合酶链反应扩增。大量基于1的编码探针,1-探针到7-探针被使用。在第一个结扎测序周期之中,A1引物被锻炼在模板上,随后是1-探针的生成结扎,四色成像和整个引物-探针从固态阶段绑定模板上移除。然后结扎测序周期用2-探针重复A1引物,用3-探针重复A1引物等。其他三个音无,A2,A3,A4,然后在一个相似方式循环产出6(A2和A4)和7(A1和A3)基从每个基因组末端的读取,使得每个双端模板对所有26基的读取。来自两个机器的运行,作者报道产出大约4亿8千万高质量的基,覆盖了大约70%的E. coli基因组。结扎测序方法被用于Polonator 设备上。

Life/APG商业化它们的结扎测序平台叫做支持寡核苷酸结扎检测(SOLiD)。这种方法用双基编码探针,主要优点是在颜色调用和单核核苷酸变体调用时提高精确度,后者要求一个有效的毗邻颜色变化。颜色空间对SOLiD来说是一个独特的特性。引物通过感光聚合酶链反应(emPCR)模板扩增生成。1,2-探针生成和结扎、成像、探针分解的SOLiD 周期重复10次生成10色叫做隔断在5基隔断中。然后扩增的引物从固态阶段模板上脱离。第二轮结扎用‘n-1’个引物完成,重置询问基,类似的十色调用一个位置到左边。十个结扎周期接踵而至,随后是三轮结扎周期。从5个结扎循环调用颜色然后排成一个线性序列(颜色空间),和一个参考基因组比对解码DNA序列。SOLiD 每次运行用两个玻片;每个玻片分为四个或8个区域。表1显示了当前Life/APG平台在

BCm-HGSC上操作的测序数据。替换是最常见的错误类型。和Illumina/Solexa读取的基因组分析相似,SOLiD数据也暴露了AT-rich 和GC-rich区域代表不足。Shen和同事们最近展示了SOLiD的MAQ序列数据可能调用正确变体不足。

单核核苷酸添加:焦磷酸测序。焦磷酸测序是一种用无电泳,生物发光方法测量无生物焦磷酸释放,按比例通过一系列聚合酶反应将其转换成可见光。不像其他的测序方法,通过改变核苷酸来终止DNA合成,焦磷酸测序方法通过限制脱氧核苷三磷酸添加物数量操纵DNA聚合酶。在互补焦磷酸的合并下,DNA聚合酶扩增了引物和中止。在调剂周期,随着下一个互补焦磷酸的增加DNA合成增加。光的序列和峰值被记录为流图,显示潜在的DNA序列。

margulies和同事们描述了第一代NGS平台用它们的PTP设备整合焦磷酸。被Roche/454商业化,设备用荧光聚合酶链反应准备的DNA模板,有1-2百万珠子存放在

PTP源。Roche/454最近发布了一个钛涂层聚对苯二甲酸酯设计,通过减少相邻源交联包含单一的克隆扩增珠子,大幅度增加了读取长度并且提高了数据质量。小点的珠子,有硫酸化酶和荧光素酶附着在上面促进光的生产,载入围绕在模板珠周围的源。个别的脱氧核糖核苷三磷酸然后在源中流动执行预定的排序。生物发光通过一个电荷耦合相机成像,表1显示了Roche/454平台在BCm-HGSC上运转的当前排序数据。不像那些生产很短读取长度的平台,Roche/454平台要求双端测序模板两倍的运行时间。多达六个核苷酸的聚合物重复,三磷酸脱氧核糖核苷酸数量增加直接与光信号成比例。插入是最常见的错误类型,删除次之。

实时测序下一个技术方法达到商业部门的可能是实时排序,太平洋生物科学当前正致力于此。不像可逆结束符,实时核苷酸不会停止DNA的合成。简单的说,实时测序方法牵涉到成像,在DNA合成期间不断合并有染色标签的核苷酸。太平洋生物科学平台,单个DNA聚合物分子附着在个别0-模式的波导探测器底面上,当无机磷核苷酸被并入增长的引物链时获得测序信息。

其他技术的提出用于在实时测序时用更传统的检测方案增强信噪比测量。比如,Lif e/visiGen设计DNA聚合酶时附带一个荧光染料,根据他们γ-标签核苷酸的合并,通过荧光共振能量转移产生增强信号。太平洋生物科学获得LI-COR技术,开发冷却染料核苷酸,在他们的天然状态下生产低信号由于冷却剂组的出现附着在基上。发布和传播染色标记的焦磷酸盐相似物远离固定DNA聚合物生产一个荧光信号。

太平洋生物科技用高的进行性,串置换φ29DNA聚合酶因为它能有效合并磷核苷酸并使得已经关闭的循环模板重新测序。为了评估这种方法的有效性,一个四色测序实验用一个已知的150个基点的线性模板分析。实时读取的基调用决定从类似的萤光脉冲。读取和一个已知的序列对比时,包括删除,插入,错误匹配共发现了27个错误,对应的读取精度为83%。导致测序错误的因素包括两个合并事件间极短的内部片段间隔和在合并到引物串之前在活跃点绑定和释放核苷酸。考虑到大多数错误的出现是随机事件,作者展示了相同模板分子15次或更多重复的测序从而提高一致的读取精度达到9 9%。在2009年的AGBT会议上,太平洋生物科学报道了他们平台的提高,当用于测序E. coli 基因组以8倍的基覆盖,获得了99.3%的基因组覆盖。对整个基因组的一致的精确度达到大于99.999%,平均读取长度为964基。

基因组比对和组装

在下一代基因测序读取产生之后,比对一个已知的参考序列或从头组装。用那种方法会考虑基于预期的生物应用的成本,努力和时间。例如,在高相关的基因组的多品系识别和编目基因组变异,比如发现于在特殊种群的细菌,秀丽隐杆线虫和在拟南芥,能通过比对NGS都去他们的参考序列完成。这种方法比起桑格测序更加廉价快速。单核苷酸变异很容易识别,尽管在很多情况下,校验发现的这些情况是被要求的。

比对方法的局限,例如在参考基因组重复区域或合并区域放置读取可能在参考基因组不存在;后者的情况可能起因于参考基因组的差异或被分析基因组的结构变异的出现。双端读取能为一些重复区域解决正确的基因组比对只要片段读取对基因组是唯一的。艾格霍姆,斯奈德和他的同事们研究展示Roche/454的读取数据,来源于3-kb的双端基因组库,能够捕获人类基因组的一大部分结构变体,尽管这种方法比起传统的福斯质粒末端测序方法仍只能识别较少的结构变体。

从头测序装配因细菌基因组和哺乳类细菌人工染色体被报道,但是他们应用于人类基因组存在很大的挑战。来提高比对质量或装配的一个合理的方法是增加读取覆盖。弗雷泽和他的同事们的一篇文章挑战这种方法,通过报道针对Roche/454, Illumina/Solexa and Life/APG平台不同的基因组区域在本地序列覆盖的系统变异。因为每个检查过的N

GS平台生产一个唯一的序列覆盖的可再生模式,比对或装配中不同NGS读取类型的混合可能会纠正这个缺陷。最近报道混合Roche/454和Illumina/Solexa读取数据使得提高了从头开始的微生物基因组的程序集,在和来自任何一个单独的平台数据比较情况下。

基因组富集尽管大量成本的减少与NGS技术有关与自动桑格技术的比较之下,整个基因组测序仍很昂贵。这个问题的一个临时解决方案可能是用NGS平台去致力于感兴趣的特定区域。这种方法可以用于检测基因组中所有的外显子,组成已知药物目标的特定基因家族或医药基因特效通过对全基因组的有关研究。针对基因组特定区域的观念是成立的,这种方法聚合酶链反应中广为应用,尽管在小范围内。聚合酶链反应和桑格测序适当匹配用来分析少量的候选基因,但是聚合酶链反应和针对的高通量NGS平台匹配策略不实用,因为样本准备要求单独处理成千上万的引物或在大型多元组满足一个单个工具的运行需求。最近弗雷泽和他的同事们与雨舞技术合作的一篇文章报道了用微滴聚合酶链反应技术3976产品的同时增长。这里,一个微流体设备创造了水皮升量液滴,在一个油溶剂前进或反转目标引物。引物滴针对基因组的不同区域与分离的皮升滴合并,包括支离破碎的基因组DNA和关联的聚合酶链反应试剂,这些混合滴液在一个管里热循环。作者报道了一个捕获效率为84%用目标基90%展示同一覆盖用微滴PCR方法测序Roche/454 or Illumina/Solexa 平台。

专门订制的低核苷酸基因芯片和基于杂交策略的方案都被用于感兴趣的目标区域。例如,Roche/NimbleGen低核苷酸基因芯片设计为固定片段杂交丰富外显子提供候补序列或基因组区域的相连延长。序中心和冷泉港实验室团队报道捕获效率为65-77%(Roch e/454platform) 和53% (Illumina/Solexa platform),分别地,有针对的外显子被覆盖通过至少一个NGS读取。最近,序中心团队报道>90%捕获效率用至少10×基覆盖(Roche/45 4 and Life/APG platforms) 通过芯片最优化来减少探针的数量在更大的覆盖区域当增

加这些低覆盖区域。

其他团队捕获了特定的基因组区域通过溶液杂交方法,例如分子插入探针和生物素化RNA捕获序列。Shendure, Church和他的团队是第一次在外显子目标中中用分子插入探针通过设计特定的低核苷酸末端攻击侧面外显子的兴趣。然而,在重复试验下只有2 0%的目标被捕获甚至更少的外显子区域被发现在这两个数据集(Illumina/Solexa platfor m)。mindrinos, Davis 和他们的团队最近描述了一些技术提高,增加分子插入探针捕获的有效性>90%,大约70%的目标下降在485个外显子在10倍的范围内。Shendure团队也描述了能够在初始55,000目标中捕获91%的提高。Nusbaum团队也报道了一个可供选择的方法,创造生物素化的RNA捕获序列被杂交成基因组目标随后富于着外面覆盖的抗生蛋白链菌素磁珠(Illumina/Solexa platform).团队估计了外显子的捕获效率为60%,基因组区域80%。1000基因组课题和外显子组课题采用基于基因芯片和基于溶剂的方法

用于Roche/454, Illumina/Solexa and Life/APG平台针对感兴趣的区域。

下一代基因测序应用生产大量的低成本的读取使得NGS平台描述上述这些包括变体的发现,通过重新测序感兴趣的目标区域或整个基因组,细菌和低等真核生物基因组的从头开始装配,编目细胞、组织和生物的血吸虫,全基因组表观标记的遗传和核染色结构用其他基于序列的方法(ChIP–seq, methyl–seq and DNase–seq)和物种分类或

通过宏基因组研究的基因组发现。有这么多的应用,那个平台才是最适合给定的生物实验呢?例如,Illumina/Solexa and Life/APG平台很适合通过重新测序变体发现,因为每一次运行产生大量高质量基。此外,螺旋生物科学平台很适合应用于RNA测序要求定量信息或直接RNA测序,因为它直接测序RNA模板不需要将他们转换为互补DNA。表1提供了NGS技术综述,工具性能和成本,有利有弊,生物应用的推荐;然而,领域技

术的快速提高在不久的将来能改变这些信息。读者针对RNA测序、芯片测序和宏基因测序给出一些优秀的评价。

下文中,我着重强调近来用NGS在测序个人基因组方面的提高,因为这个领域的要求驱动了技术的快速发展和竞价。

个体基因组人类基因组的研究目的在于目录单核核苷酸变体和有关的典型苯酚不同,最终目标是个性基因组医疗用途。2004年,国际人类基因组测序团队出版了有史以来第一个完结的阶段人类参考基因组。成本大约3亿美元。在2007年10月,Venter 团队描述了j. Craig venter基因组序列用全基因组鸟枪方法和自动桑格测序技术。Vent er基因组和参考基因组比较时,320万单核核苷酸变体被识别。另外,超过90万SVs,共导致更多的变体基超过SNVs.

第一个应用NGS到人类基因组的团队是Roche/454和Gibbs团队在序中心合作,报道詹姆斯·杜威·沃森的双倍基因组。当沃森基因组和参考基因组比对时,大概330万单核核苷酸变体被识别,但是和Venter团队相比更少的SVs被发现。这点很重要,因为未发现的SVs会导致总数中的很大一部分变体,许多会诱发疾病。在过去的几年里,5个另外的人类基因组被描述,其中的一个被在两个不同平台上测序。正如沃森基因组,报道比Venter团队研究发现更少的SVs。

个人基因组用于疾病研究。比如, mardis团队报道了两个急性髓系白血病癌症基因组的序列,这两个研究发现体细胞突变可能与疾病有关。吉布斯团队最近阐述了一个用Life/APG平台 Charcot–marie–Tooth家庭中隐性疾病两个等位变体的说明。

很多课题针对测序更多的个体,包括癌症基因组图谱和1000基因组课题,都用Il lumina/Solexa and Life/454平台测序整个基因组。完整的基因组最近最近描述来自白种男性的第一个基因组序列参加个人基因组项目。这些课题应该引起个体基因组邪恶许数量在不久的将来有显著的提升。

和自动化桑格测序比较,NGS平台极大地提高了通量并大大降低了开支,一些团队报道反应物的花费低于10万美元。然而,模板的大小和结构、读取长度、通量、基、基因组覆盖在NGS平台存在变异,这种变异使得很难评估基于成本考虑的基因组质量。在2009年7月, Illumina声明一个基因组测序服务提供了30倍的基覆盖,价格为4万8千美元。完整的基因组提供了一个相似服务用40倍的覆盖价格为5000美元。基于商业模板依赖庞大的客户数量。最近,Drmanac, Ballinger团队测序三个个体的整个基因组,包括PGP1,用改进的不可分裂的探针SBL方法被认为是组合探针固定结扎。对其他的基因组单核核苷酸变体识别的数量和表1报道的一致,团队报道了一个试剂摊销成本为4400美元。尽管骄人,还不清楚这个价格是否作为零售服务被接受或者是否Illu mina公司或完整的基因组商业模板将会有长期盈利。实现这些成本优势可能也伴随着大量的取舍,也就是说低质量基因组的生产不足以达到捕获Svs 的程度。缩小1万美元和1千美元之间的差距对当前的技术发展者来说是极大的挑战,1千美元基因组可能由于为发展革新。1千美元的草案基因组时间表很难预测,甚至有更多的不确定是一个高质量、阶段完成个人基因组的交付。

总结

2004年以来,国家人类基因组研究协会对NGS的发展奖励1亿美元,这些奖励促进到目前为止更大的进步,还有一些商业的发展。许多公司,包括IBM,牛津纳米孔公司,智能生物系统,激光情报局,NABsys有NGS技术在各阶段发展和商业化。

数十亿的NGS读取产出也挑战存在的信息技术系统基础设备,在数据转移、存储、质量控制、比对计算分析或装配读取数据和简单的追踪和过程管理的实验室信息管理系

统。生物信息的提高还在继续,如果这些系统一直在NGS技术下继续发展。有关下流数据的处理分析成本会匹及或超过数据产出成本。

NGS技术应用范围骄人,正在发展更多。除了上面描述的应用,NGS技术被用于描述古基因组的进化关系,阐明未编码的RNA在健康和疾病中扮演的角色。在不久的将来,可以预见NGS技术会用于从单核细胞中分离出基因组获取高质量的序列数据,这是一个很大的突破,尤其在癌症基因组。会发生这样的情况,技术的提高要求有效分离完整的长DNA分子和在NGS方法来精确读取这些分子的内容序列。NGS的发展和应用是一个快速发展的研究领域,使得基因组研究是一个令人激动的时刻。

纳米孔测序是极具前景的下一代测序技术

纳米孔测序是极具前景的下一代测序技术 Nanopore Sequencing 2019 - Patent Landscape Analysis 随着各种技术的新产品推出,哪些公司将在知识产权方面引领纳米孔测序? 纳米孔测序是极具前景的下一代测序技术 据麦姆斯咨询介绍,纳米孔测序是新一代测序(NGS)技术之一,被认为能够彻底革新DNA分析。随着时间地推移,目前已经开发出了不同形式的纳米孔测序技术,包括蛋白质纳米孔、固态纳米孔和复合纳米孔。该技术可以高速生成超长读数,减少样品制备时间以及将读数重组成原始序列所需要的数据处理时间。 这项新技术可以开发一个需要遗传指纹来快速识别癌症类型和病原体的全新客户群。根据DataBridge的数据,全球下一代测序市场将快速增长,市场规模预计将从2017年的48.3亿美元增长到2024年的163.5亿美元,2018~2024年期间的复合年增长率(CAGR)预计为19.2%。 目前,Oxford Nanopore Technologies是唯一一家将基于纳米孔的测序仪推向市场的公司。不过,还有其它几家公司正在开发自己的相关技术,Oxford Nanopore Technologies公司可能很快将不再是纳米孔测序仪的唯一供应商。例如,Two Pore Guys公司宣布将在2019年春季发布其产品套件。 随着新产品在未来的相继推出,了解纳米孔测序市场相关参与者的知识产权(IP)状况和策略,同时发现专利新申请人及其所带来的威胁至关重要。为此,著名市场研究机构Yole 子公司Knowmade深入调研了基于纳米孔的测序技术(蛋白质、固态和复合)及其应用(肿瘤学、植物遗传学等)中涉及的知识产权主要参与者。本报告可以帮助读者发现业务风险和机遇,预测新兴应用,支持战略决策以加强市场地位。 纳米孔测序全球专利申请趋势 对专利申请趋势的分析表明,从2008年到2013年,纳米孔测序相关的专利申请获得了重要增长。这一增长源自于学术研究团队(哈佛大学和加州大学)对纳米孔测序概念的验证。

新一代测序技术的发展及应用前景

2010年第10期杨晓玲等:新一代测序技术的发展及应用前景 等交叉学科的迅猛发展。 1.1第二代测序——高通量低成本齐头并进以高通量低成本为主要特征的第二代测序,不再需要大肠杆菌进行体内扩增,而是直接通过聚合酶或者连接酶进行体外合成测序¨】。根据其原理又可分为两类:聚合酶合成测序和连接酶合成测序。1.1.1聚合酶合成测序法Roche公司推出的454技术开辟了高通量测序的先河。该技术通量可达Sangcr测序的几百倍,而成本却只有几十分之一,因此一经推出,便受到了国际上基因组学专家的广泛关注。454采用焦磷酸合成测序法HJ,避免了传统测序进行荧光标记以及跑胶等繁琐步骤,同时利用乳胶系统对DNA分子进行扩增,实现了大规模并行测序。截止到2010年4月,已有700多篇文献是采用了454测序技术(http://454.com/publications.and—resources/publications.asp),对该技术是一个极大的肯定。 Illumina公司推出的Solexa遗传分析仪是合成技术的进一步发展与延伸。该技术借助高密度的DNA单分子阵列,使得测序成本和效率均有了较大改善。同时Solexa公司提出的可逆终止子”1也是该技术获得认可的原因之一。与454相比。Solexa拥有更高的通量,更低的成本。虽然片段长度较短仍是主要的技术瓶颈,但是对于已有基因组的物种来说,Solexa理所当然成为第二代测序技术的首选。2008年以来,利用该技术开展的研究大幅度上升,报道文献达400多篇(http://www.illumina.com/systems/genome—analyzer_iix.ilmn)o 1.1.2连接酶合成测序法2007年ABI公司在Church小组拍1研究成果的基础上推出了SOLID测序仪。该技术的创新之处在于双碱基编码…的应用,即每个碱基被阅读两次,因此大大减少了测序带来的错误率,同时可以方便的区分SNP和测序错误。在测序过程中,仪器自动加入4种荧光标记的寡核苷酸探针,探针与引物发生连接反应,通过激发末端的荧光标记识别结合上的碱基类型。目前SOLID3.0测序通量可达20G,而测序片段仅有35—50bp,这使得该技术与Solexa相比,应用范围还不够广泛。ABI公司正加快研发进度,争取在片段长度方面做出重大突破。 DanaherMotion公司推出Polonator¨1测序仪同样也是基于Church小组的研究成果,但是该设备的成本要低很多,同时用户在使用时可以根据自己的研究目的设置不同的测序条件。而CompleteGe—nomics公司推出的DNA纳米阵列与组合探针锚定连接测序法"1则具有更高的容错能力,试剂的消耗也进一步减少,目前已顺利完成3个个体基因组的测序工作。 1.2第三代测序——单分子长片段有望实现第二代测序技术虽然在各方面都有了较大的突破,但是仍然建立在PCR扩增的基础上。为了避免PCR扩增带来的偏差,科学家目前正在研制对DNA单个分子直接测序的第三代测序仪。最具代表性的包括Heliscope单分子测序仪,单分子实时合成测序法,纳米孔测序技术等。 Helicos技术仍然是基于合成测序原理¨…,它采用了一种新的荧光类似物和灵敏的监测系统,能够直接记录到单个碱基的荧光,从而克服了其他方法须同时测数千个相同基因片段以增加信号亮度的缺陷。PacificBioscienees公司研发的单分子实时合成测序法充分利用了DNA聚合酶的特性,可以形象的描述为通过显微镜实时观测DNA聚合酶,并记录DNA合成的整个过程。纳米孔测序技术[11’121则是利用不同碱基在通过纳米小孔时引起的静电感应稍有不同,或者不同碱基通过小孔的能力各有差异,来加以区分不同的碱基信号。 2应用与实践 Kahvejian在2008年的一篇综述中提到¨“:“如果你可以随心所欲地测序,你会开展哪些研究?”。人类基因组计划的完成和近年来高通量测序的兴起,使越来越多的科研工作者认识到,我们对于生物界的认识才刚刚起步。基因图谱的绘制并不意味着所有遗传密码的破解,癌症基因组的开展也没有解决所有的医学难题。DNA变异的模式和进化机制,基因调控网络的结构和相互作用方式,复杂性状及疾病的分子遗传基础等,仍是困扰生物学家和医学家的难题,而高通量测序的广泛应用,也许可以让我们知道的更多。 2.1DNA水平的应用 2.1.1全基因组测序新一代测序技术极大地推

高通量测序常用名词科普

高通量测序常用名词汇总 一代测序技术:即传统的Sanger 测序法,Sanger 法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以 A、T、C、G结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧 核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-0H基团,使延长的寡聚核苷酸选择性地在G A、T或C处终止,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,通过检测得到DNA碱基序列。 二代测序技术:n ext gen eration seque ncing ( NGS又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定,从而使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序 (Deep sequencing )。NGS主要的平台有Roche(454 &454+), lllumina ( HiSeq 2000/2500、GAIIx、MiSeq),ABI S0LiD 等。 基因:Gene是遗传的物质基础,是DNA或RNA分子上具有遗传信息的特定核苷酸序列。基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。 DNA:Deoxyribonucleic acid ,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱基、脱氧核糖、磷酸。脱氧核糖核酸通过3',5'- 磷酸二酯键按一定的顺序彼此相连构成长链,即DNA 链,DNA链上特定的核苷酸序列包含有生物的遗传信息,是绝大部分生物遗传信息的载体。RNA:Ribonucleic Acid ,,核糖核酸,一个核糖核苷酸分子由碱基,核糖和磷酸构成。核 糖核苷酸经磷酯键缩合而成长链状分子称之为RNA链。RNA是存在于生物细胞以及部分病 毒、类病毒中的遗传信息载体。不同种类的RNA链长不同,行使各式各样的生物功能,如

新一代测序法简介

新一代测序法简介 新一代测序方法是一种直接测序法,它既可以分析基因和DNA的组成(定性分析),也可以测定同一类型基因在表达过程中产生的数量(定量分析),以及不同类型基因或DNA 之间的差别所在(交叉对比分析)。自2004年,454测序技术发展以来,已经出现的测序产品超过六种之多。这些产品的技术特点见下表: 产家名称产品技术特点优缺点 化学反应测序方法误读率样品准备高通量程度 Roche (454 Life Science) 焦磷酸标记的链 反应 焦磷酸基 标记 <1% 较复杂,需PCR 中等 Illumina(Solexa)四色可逆终止码合成法1%—3% 较复杂,需PCR 中—高ABI(SOLID) 双色可逆终止码合成法1%—5% 较复杂,需PCR 中—高Helicos Bioscience 单色可逆终止码合成法2%—8% 简单,无需PCR 高—超高Intelligent Biosystm 四色可逆终止码合成法1%—5% 较复杂,需PCR 中—高 Pacific Bioscience 四色焦磷酸基标 记焦磷酸基 标记 3%—8% 简单,无需PCR 高 VisiGen 焦磷酸基标记 FRET 焦磷酸基 标记 3%—8% 简单,无需PCR 高 在这些技术中,从所分析的样本在测序前是否需要扩增,大致可以分为两类,即克隆扩增型和单分子测序型。两种类型在测序技术上区别并不大,但对结果的影响却有不小的差别。主要体现在两个方面:(1)单分子测序更能反应细胞或组织内分子的真实情况,尤其是在需要定量分析的情况下。而克隆扩增型中的PCR反应使得样品中DNA分子的扩增机会并不完全均等,这会对基因表达的定量分析造成影响;(2)单分子测序具有通量更高的优势。克隆扩增使得同一类型的分子数目急剧上升,在提高同类型分在在固相表面出现的几率同时,也降低了不同类型分子出现的机会。 面重点介绍Pacific Biosciences公司推出的Single Molecule Real Time (SMRT?) DNA Sequencing(单分子实时DNA测序)。 首先,在这一测序技术中有主要有两个关键的技术: 一、荧光标记的脱氧核苷酸避免了碱基的空间位阻效应。显微镜现在也无法实现实时看到“单分子”,但是它可以实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入DNA 链的时候,它的荧光就同时能在DNA链上探测到。当它与DNA链形成化学键的时候,它的荧光基团就被DNA聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样; 二、纳米微孔(Zero-mode waveguide (ZMW))。因为在显微镜实时记录DNA链上的荧光的时候,DNA链周围的众多的荧光标记的脱氧核苷酸形成了非常强大的荧光背景,这种强大的荧光背景使单分子的荧光探测成为不可能。Pacific Biosciences公司发明了一种直径只有10nm的纳米孔,单分子的DNA聚合酶被固定在这个孔内。在这么小的孔内,DNA链周围的荧光标记的脱氧核苷酸有限,而且由于A,T,C,G这四种荧光标记的脱氧核苷酸非常快速地从外面进入到孔内又出去,它们形成了非常稳定的背景荧光信号。而当某一种荧光标记的脱氧核苷酸被掺入到DNA链时,这种特定颜色的荧光会持续一小段时间,直到新的化学

下一代测序技术

下一代测序技术 摘要:DNA测序技术对生物学的发展有着最根本的意义。Sanger法测序经过了30年的应用和发展,而在过去三年中,以454, solexa, SOLiD为代表的高通量测序平台已经大幅度降低了测序成本,提高了测序速度,成为基因组测序市场的主流。在此基础上,各种下一代测序技术正在快速研发,将使基因组测序和重测序的通量和成本更加平民化,为基因组学、遗传学、生物医学和健康科学等领域的发展创造更加广阔的前景。本文将对所有新的测序技术的原理、优势和应用进行总结和展望。 1977年Maxim、Gilbert发明的化学降解法测序技术和Sanger发明的双脱氧末端终止法测序技术不仅为他们赢得了诺贝尔奖,也使得从DNA序列层面研究分子遗传学成为可能。特别是后者,从最开始的凝胶电泳到越来越高通量的毛细管电泳,从开始的手工操作到越来越多自动测序仪的出现,各种改进的Sanger 测序技术统治了DNA测序领域三十年,至今仍在长片段测序,大片段文库测序方面有广泛的应用。人类基因组计划(HGP)的完成就是靠Sanger测序法。 在耗费了庞大成本的人类基因组计划宣布完成之后,越来越多的物种基因组测序工作对测序成本和通量提出了更高的要求,新一代测序技术(也被称为第二代测序技术)开始登上历史舞台。2005年454 life science公司率先推出了焦磷酸测序技术,使测序成本较Sanger法降低了100倍,速度快了(提高)100倍,人类基因组测序逐步进入了100,000美元时代。如今,454 FLX测序仪(Roche Applied Science)、基于“边合成边测序”的Solexa测序仪(Illumina Inc.)和使用“边连接边测序”的SOLiD测序仪(Applied Biosystems)已经成为基因组测序市场的主流机型。除此之外,2008年一年内又有HeliScope单分子测序仪(Helicos)和Polonator(Dover/Harvard)两种测序机型商品化。 在NHGRI(美国人类基因组研究中心)的支持和推动下,未来几年内测序成本将在目前基础上再下降100倍,最终使个人基因组测序成本降至1000美元,人类将革命性的进入个人基因组时代。高通量和低成本的测序技术将进入到普通实验室,基因组测序的简单化将使分子生物学飞跃发展,个人基因组测序产业化也将对健康医学等领域产生革命性的影响。本文将首先对目前已经商品化的新一代测序技术(454、Solexa、SOLiD、HeliScope)做一介绍和比较,再对正在研发中的各种下一代测序方法(第三代测序技术)的原理和应用做一详细的介绍和展望。 1. Roche 454测序技术 2005年454生命科学公司在《自然》杂志发表论文,介绍了一种区别于传统Sanger法的全新高通量测序方法,将测序成本降低了100倍以上,开创了第二代测序技术的先河,454测序仪也成为最先商品化的第二代测序仪。正是在此基础上,其它如Solexa、SOLiD等第二代测序仪才相继问世。454测序技术的原理在于首先使用乳液PCR(emulsion PCR)技术(图一a)扩增已经连接上接头的基因组文库片段,扩增子结合在28 μm的磁珠表面,将乳液破坏后用变性剂处理磁珠,再将含有扩增子的磁珠富集到芯片表面,用测序引物进行测序。在测序过程中,454使用了一种“焦磷酸测序技术”(Pyrosequencing),即在合成DNA 互补链的过程中,每加入一种单核苷酸(dNTP),如与模板链配对结合,就会释放出一个焦磷酸,与底物腺苷-5’-磷酸硫酸(APS)在A TP硫酸化酶作用下合成A TP,与荧光素(Luciferin)一起在荧光素酶(Luciferase)的作用下,会发出一个光信号,由芯片背后连接的电荷耦合装置(CCD,Charge Coupled Device)捕捉。454测序技术合成DNA链使用的是普通单核苷酸,没有任何标记,合成中也没有切割基团等生化反应,因此读长可以达到300-400bp。但没有阻断(block)和去阻断(de-block)过程也意味着对连续重复单核苷酸的阅读只能根据信号强度来判断,容易对其中插入和缺失碱基阅读错误。454测序技术相比较其他第二代测序技术如Solexa和SOLiD, 在读长上有着巨大的优势,但是目前成本要略高。总体而言,高读长使得454技术比较利于De Novo拼接和测序。

新一代DNA测序技术总览

作者:尹银亮、陈会平、毛良伟译来源:生物谷 原文刊登于《分析化学》综述Analytical Chemistry 原文标题:Landscape of Next-Generation Sequencing Technologies 索引信息:https://www.doczj.com/doc/e3412818.html,/10.1021/ac2010857 | Anal. Chem. 2011, 83, 4327–4341 原文作者:Thomas P. Niedringhaus, Denitsa Milanova, Matthew B. Kerby, Michael P. Snyder,and Annelise E. Barro 译者资料: 尹银亮,香港华大基因研发中心有限公司email:stevenyinbio@https://www.doczj.com/doc/e3412818.html, 陈会平,毛良伟,武汉华大基因科技有限公司 【内容】 第二代测序 第二代测序成本 第三代测序技术 单分子测序法 边连接边测序法 边合成边测序法 纳米孔测序技术 蛋白质纳米孔测序法 固态纳米孔测序法 长距离阅读DNA的扩展方法 总结性评论 DNA测序正处在技术上天翻地覆剧变的阵痛之中,其突出特点是,测序通量(测序数据量)的大幅增长,原始数据中每个碱基的测序成本急剧下跌,并伴随着以巨资购买仪器以引进新技术的需求。以前看似高不可攀的奢侈性研究活动(如个人基因组测序,宏基因组学研究,以及对大量重要物种的测序),在短短几年之间,正以急速的步伐而变得越来越切实可行了。本篇综述将集中讨论在第三,第四代测序方法背后的故事:它们所面临的挑战;各种方法的局限性;以及它们带给我们的充满诱惑的前景。 第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法或者是1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解). 在1977年,桑格测定了第一个基因组序列,是噬菌 体X174的,全长5375个碱基。其测序方法和历史过程以前已做过详细回顾。 后来的四色荧光桑格测序法(每一种荧光代表四种碱基中的一种)被用在自动毛细管电泳测序系统中,此系统由应用生物系统有限公司(Applied Biosystems Inc.)推上市场,后来该公司被整合入生命技术公司(Life Technologies)和贝克曼.考尔特公司(Beckman Coulter inc.)(见表1)。发表于2001年的第一个人类基因组

高通量测序技术

高通量测序技术(High-throughput sequencing)又称“下一代”测序技术 ("Next-generation" sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。 根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA 纳米球测序(DNA nanoball sequencing)等。 高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。 实验过程 1.样本准备(sample fragmentation) 2.文库构建(library preparation) 3.测序反应(sequencing reaction) 4.数据分析(data analysis) 测序平台 自从2005年454 Life Sciences公司(2007年该公司被Roche正式收购)推出了454 FLX焦磷酸测序平台(454 FLX pyrosequencing platform)以来,因为他们的拳头产品毛细管阵列电泳测序仪系列(series capillary array electrophoresis sequencing machines)遇到了两个强有力的竞争对手,曾推出过3730xl DNA测序仪(3730xl DNA Analyzer)的Applied BioSystem(ABI)这家一直占据着测序市场最大份额的公司的领先地位就开始动摇了,一个就是罗氏公司(Roche)的454 测序仪(Roch GS FLX sequencer),,另一个就是2006年美国Illumina公司推出的Solexa基因组分析平台(Genome Analyzer platform),为此,2007年ABI公司推出了自主研发的SOLiD 测序仪(ABI SOLiD sequencer)。这三个测序平台即为目前高通量测序平台的代表。(见表一) 公司名称技术原理技术开发者 Apply Biosystems(ABI) 基于磁珠的大规模并行克隆连接 DNA测序法 美国Agencourt私人基因组学公司(APG) Illumina 合成测序法英国Solexa公司首席科学家David Bentley Roche 大规模并行焦磷酸合成测序法 美国454 Life Sciences公司的创始人Jonathan Rothberg Helicos 大规模并行单分子合成测序法美国斯坦福大学生物工程学家Stephen Quake Complete Genomics DNA纳米阵列与组合探针锚定连接 测序法 美国Complete Genomics公司首席科学家radoje drmanac 表一:主流测序平台一览 Roche 454焦磷酸测序 (pyrophosphate sequencing) Illumina Solexa 合成测序 (sequence by synthesize) Illumina Genome AnalyzerIIx测序原理 Illumina公司的新一代测序仪Hiseq 2000和Hiseq 2500具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究。Hiseq是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时将基因组DNA的随机片段附着到光学透明

新一代高通量测序技术SOLiD简介

新一代高通量测序技术SOLiD简介 目前市场上有四种高通量测序仪,分别是Solexa,454 (GS-FLX),SOLiD和Polonator。根据测序原理,它们可以被分为两大类:使用合成法测序(Sequencing by Synthesis)的Solexa和454,及使用连接法测序(Sequencing by Ligation)的Polonator和SOLiD。这些高通量测序仪的共同点是不需要大肠杆菌系统进行DNA模板扩增,且测序所得序列较短:其中的454序列最长,为200~300个碱基,其余三种序列都只有几十个碱基。测序原理及序列长度的差异决定了各种高通量测序仪具有不同的应用领域。这就要求我们在熟悉各种高通量测序仪内在技术特点的基础上进行选择。 基因组所引进的SOLiD (Sequencing by Oligonucleotide Ligation and Detection)是ABI(Applied Biosystems)公司生产的高通量测序仪。目前这台SOLiD运行稳定,SOLiD实验及数据分析小组也可以为大家提供专业的技术服务。所以接下来的关键是如何把SOLiD测序仪应用到符合其技术特点的科研项目中。本短文将简单介绍SOLiD测序流程,双碱基编码原理及数据分析原理,以帮助大家了解SOLiD测序仪的技术特点和应用范围。 1.SOLiD关键技术及其原理 SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的reference序列,把SOLiD颜色序列定位到reference上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。 1.1. SOLiD文库构建 使用SOLiD测序时,可根据实际需要,制备片段文库(fragment library)或末端配对文库(mate-paired library)。简单地说,制备片段文库就是在短DNA片段(60~110 bp)两端加上SOLiD 接头(P1、P2 adapter)。而制备末端配对文库,先通过DNA环化、Ecop15I酶切等步骤截取长DNA片段(600bp到10kb)两末端各25 bp进行连接,然后在该连接产物两端加上SOLiD接头。两种文库的最终产物都是两端分别带有P1、P2 adapter的DNA双链,插入片段及测序接头总长为120~180 bp。 1.2:油包水PCR 我们知道,文库制备得到大量末端带P1、P2 adapter但内部插入序列不同的DNA双链模板。和普通PCR一样,油包水PCR也是在水溶液进行反应,该水相含PCR所需试剂,DNA模板及可分别与P1、P2 adapter结合的P1、P2 PCR引物。但与普通PCR不同的是,P1引物固定在P1磁珠球形表面(SOLiD将这种表面固定着大量P1引物的磁珠称为P1磁珠)。PCR反应过程中磁珠表面的P1引物可以和变性模板的P1 adapter负链结合,引导模板合成,这样一来,P1引物引导合成的DNA链也就被固定到P1磁珠表面了。 油包水PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR 反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。A BI公司提供的SOLiD 实验手册已经把小水滴体积及水相中DNA模板和磁珠的个数比等重要参数进行了技术优化和流程固定,尽可能提高“优质小水滴”(水滴中只含一个DNA模板一个P1磁珠)的数量,为后续SOLiD 测序提供只含有一种DNA模板扩增产物的高质量P1磁珠。

下一代测序工作流程自动化

下一代测序(NGS)彻底改变了基因组学研究领域,使全基因组测序比以往任何时候都更有效率。然而,典型的NGS工作流程是鲜有革新的,因为它面临许多手动操作步骤和来自成本、通量以及结果变异性的诸多挑战。传统的样品制备和数据分析方法非常耗时,并更易出错。 针对这些挑战,自动化技术为此提供了相应的解决方案,并通过减少样品间变异提高了最终数据的精准度。然而,为您的NGS工作流程选择适合的自动化设备是一个复杂的过程。为了给您的实验室配备最佳的自动化整合系统,首先要对以下的四个因素进行评估,然后再作出决定: ? 自动化将如何影响您的实验流程? ? 您可选的自动化方案有哪些? ? 需要多少培训? ? 您的自动化解决方案是否需要扩展,以满足未来的需求?

Ilumina文库构建杂交选择和靶向捕获簇扩增和测序Ilumina文库构建杂交选择和靶向捕获簇扩增和测序

图3,高通量PCR纯化自动化工作流程 您是否在纯化时使用真空泵和离心过滤?图3描述了一个中高通 进一步加速:靶标富集技术 量的自动化工作流程图。 基于磁珠技术的靶标富集方法,比如SureSelect靶标富集 试剂盒和SureSelect人全外显子试剂盒,能使您仅对感兴 趣的基因片段测序,提高了几个数量级的实验效率。这些操 作很容易实现和高度扩展,凸显出Bravo自动化液体处理 平台的速度和精度的优势。

如果您的实验室需要更高的通量,您可考虑增加一个更全面的自动化系统。安捷伦BenchCel 微孔板工作站是一个灵活的、可扩展的、通量可媲美大型系统的紧凑桌面式平台。由市面上最灵活和调度高效的安捷伦VWorks 软件控制,BenchCel 工作站可用于复杂的和简单的应用流程,比起传统的手动操作方法能提供更长的无人值守时间和更大的通量。 对于超高通量、高生产率的实验室,您可能需要放弃桌面型系统。安捷伦独立的BioCel 自动化系统基于一个易于定位的直驱机械臂(DDR)。这种高度灵活的系统能与安捷伦其它自动化模块,或第三方设备组合形成定制系统,以满足您实验室的需要。 自动化方案的选择 想一想您实验室的整个工作流程。有各种不同的自动化解决方案——从垂直移液工作站到BenchCel 工作站再到BioCel 系统,可以满足不同的通量需求。自动化将提高实验数据的准确性和一致性——您是否需要一个完全无人值守的自动化解决方案?安捷伦拥有一系列的自动化设备可供选择,以适应不同实验室的需要。安捷伦的Bravo 自动液体处理平台具有宽量程的高精度移液性能、兼容不同类型微孔板的灵活性以及独特的开放式设计,易于整合到其他的自动化工作流程中。结合Bravo 自动化液体处理平台可以大大减少样品制备和检查下一代测序文库质量所花费的时间,并通过减少样本间变异提高了数据质量。 图4. 桌面型选择: A .Bravo 自动化液体处理平台 B .BenchCel 微孔板操作工作站独立的高通量系统:C. BioCel 系统 A B C

下一代DNA测序技术研究进展综述

深度DNA测序技术在基因组测序中的研究策略和进展 摘要:回顾了经典DNA测序技术原理,重点阐述了深度测序技术在基因组测序中的研究策略,并结合目前比较常见的二代测序仪来分析比较相互之间的特点和优势,最后,对即将到来的三代测序法的研究进展给予了简单的介绍。 关键词:深度DNA测序基因组测序仪 DNA测序技术的发展过程漫长而艰辛,然而,我们现在获取的大部分DNA序列信息还是依靠基于Sanger在1977年建立的“DNA双脱氧链末端终止测序法”的DNA测序技术获得的。另外就是Maxam和Gilbert建立的“化学降解测序法”。在过去的七年当中,DNA测序技术的发展至少受到来自四个方面的影响:首先是人类基因组计划的出现,这项计划的实施过程中,科学家们面临了巨大的经费问题,因为传统的Sanger测序法无论怎么优化,都无法大幅度降低测序的成本,这很大程度促进了人们对在测序过程中如何降低成本的技术方面的研究。第二,人类以及其他主要模式生物参考序列数据库的建立使得短片段阅读(short-read)成为可能,这极大的促进了短片段测序技术的发展。第三,新型分子生物学技术的不断涌现导致了越来越多的诸如RNA表达染色体构象等生物现象的出现,这就需要有高通量DNA测序手段去解释这些问题,这也极大的促进了新型测序技术的发展。第四,其他学科领域的技术的发展,例如计算机技术,数据存储及分析技术,聚合酶工程技术等,极大地支持了DNA测序技术的应用。本文主要是对目前新一代DNA测序(也叫深度测序)技术(Next-generation DNA sequencing technologies)的研究策略及目前国际DNA测序最新进展做一简要的综述。 1.Sanger测序法 先来回顾一下经典的DNA测序法,从上世纪九十年代早期开始,几乎所有的DNA测序都是利用半自动化的毛细管电泳Sanger测序技术完成的(图1-a)。后来出现了高通量测序法,这种方法首先要对DNA预处理,获取大量的待测序模板即质粒或PCR产物。然后在测序一种发生测序生化反应,这个过程会产生大量长短不一(因为终止位点不一样),末端被荧光标记的延伸产物。再用分辨率高的毛细管凝胶电泳分离这些延伸产物,通过对延伸产物末端四种不同荧光颜色的区分,利用计算机软件自动“读

下一代测序技术的内容概览

下一代测序技术的内容概览 高通量DNA测序技术(下一代测序技术NGS)在过去的15年里已经有了快速的发展,新的方法也在继续实现商业化。随着技术的发展,对基础和应用科学中的相关应用范围也在增加。这篇综述的目的是提供一个对NGS方法论的概述以及相关的应用。每个简要的讨论之后都跟有制造商和基于网页的可视化。关键词搜索,例如用Google,可能也会提供有帮助的网页链接和信息。 方法的建立 DNA测序方法的建立是Sanger双脱氧合成法以及Maxam-Gilbert的化学裂解法。Maxam-Gilbert化学裂解法是基于DNA的化学修饰然后在邻近修饰过的核苷酸附件的位点进一步裂解DNA骨架。Sanger测序采用了特殊的链终止核苷酸(双脱氧核苷酸),它缺少一个 3‘OH连接位点。因此,不能够在DNA聚合酶的作用下合成磷酸二酯键,结果是正在伸长的DNA链在该位置终止了。双脱氧核苷酸是具有放射性的或者具有荧光标记的,便于分别在测序凝胶或者自动测序仪器上识别。尽管原始的Maxam-Gilbert方法的化学特性已经被进行修饰来帮助消除有毒性的反应物,但是Sanger测序通过合成双脱氧核苷酸的方法已经变成了一种测序的标准。 Sanger测序法在1977年被创建,并且在UNIT7.4中被详尽的描述了。尽管通过当前NGS 标准测序相对较慢,但是在Sanger末端终止法的改进,自动化,以及商业化这些方面已经使它能够在当前的多种应用范围中成为最适当的测序方法。特别的,超薄的凝胶板电泳已经被多通道毛细血管电泳代替了,逐渐还出现了自动填充可循环的毛细血管以及电动样品加样,这对提高Sanger测序过程的速度与便利性有很大的贡献。在Sanger测序中已经出现的最显著的创新点有:(1)荧光染色的发展,(2)采用末端循环测序降低所要求的输入DNA的质量并且用耐热聚合酶高效准确的将终止物染色与正在伸长的DNA链结合起来,(3)解释和分析序列软件的发展。在自动化的Sanger测序项目中的主导者是Applied Biosystem(AB)。当前商业化的AB测序仪全部使用的是荧光染色和毛细管电泳(CE)。用于DNA测序或者片段分析协议的机器的容量在发生改变,4组毛细血管(SeqStudio Genetic Analyzer),8到24组毛细管(3500 Series Genetic Analyzer),以及48到96组(3700 Series Genetic Analyzer)。所以的这些测序仪产生了600-1000个碱基的正确的序列。尽管多年以来,不同种类基于Sanger测序的测序仪器已经被引进,包括来自Licor,Amersham,MilliGen,Perkin Elmer 和Dupont,所以的这些除了AB仪器都已经被停产了。 Sanger测序技术在一些应用中任然非常有用,而这些应用中高通量测序是不被要求的。一些DNA测序的核心设备和以测序来获利的公司提供了Sanger测序服务。对于个体测序反应对公共的用法是在一个特殊的模板上用特殊的DNA引物,例如去检验质粒的构建和PCR 产物。既然来自大量的商家的用于DNA纯化的分子生物试剂盒和试剂以及相对较高质量的合成产物都是可用的,这就使得甚至是相对较大的Sanger测序项目都能够在合理的时间框架和成本范围内完成。 除了检测DNA的序列AB仪器上的毛细管电泳(CE)还被应用到测量酶对基于荧光标记的DNA底物的选择活性,列如,可以分析DNA片段的大小。毛细管电泳同样能够用来同时分析一个单反应中的多个底物,产物或者反应介质,通过不同的荧光标记。CE被用在DNA 聚合酶和DNA连接酶动力学,以及包括冈崎片段和核糖核苷酸的删除修复的偶联酶通路的研究中。AB CE在在糖生物学中也是很有用的,可以用来分析荧光标记的多糖。 第二代测序方法 术语“下一代”隐含着DNA测序技术发展的下一步,同时也表明将会产生一个以下一代命名的新技术。我们更喜欢用下一代,第三代等这些术语,因为我们意识到上述的自动化的

一代测序、高通量测序等各种测序相关概念介绍

什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行 细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。 什么是Sanger法测序(一代测序) Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。 什么是基因组重测序(Genome Re-sequencing) 全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。 什么是de novo测序 de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列。 什么是外显子测序(whole exon sequencing) 外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。

新一代测序技术研究内容

新一代测序技术研究内容 新一代测序技术不仅仅是生命科学基础研究的重要工具,它即将发展为一个新型的巨大产业群,彻底改变生命科学相关产业和医学的发展模式,并给人类社会带来不可估量的巨大影响。 该技术主要包括基因组学、转录组学、表观组学三个方面的研究。 (1)基因组学 基因组学,或称基因体学,是研究生物基因组和如何利用基因的一门学问。该学科提供基因组信息以及相关数据系统利用,试图解决生物、医学和工业领域的重大问题。此外,基因组学能为一些疾病提供新的诊断和治疗方法,有助于医生获得更多的治疗信息并进行个性化医疗。同时,基因组学还被用于食品与农业部门。 在新一代测序技术中,基因组学方面主要包括以下八个方面的测序研究: ①全基因组从头测序 从头测序即de novo测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究。一个物种基因组序列图谱的完成,意味着这个物种学科和产业的新开端!这也将带动这个物种下游一系列研究的开展。全基因组序列图谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;并为后续的基因挖掘、功能验证提供DNA序

列信息。 ②全基因组重测序 随着测序成本降低和已知基因组序列物种增多,全基因组重测序已经成为动植物育种、群体进化、药物研发、疾病研究和临床诊断中最为迅速而有效的方法之一。全基因组重测序是对基因组序列已知物种的个体进行基因组测序,并在个体或群体水平进行差异性分析的测序方法。在全基因组水平上扫描并检测与生物体重要性状相关的突变位点,具有重大的科研价值和产业价值。 ③外显子测序 外显子测序是指利用序列捕获技术将探针能覆盖到的全基因组外显子区域DNA捕捉并富集后再进行高通量测序的基因组分析方法。该方法能够获得指定外显子捕获平台探针设计区域及侧翼200bp序列的遗传信息,极大地提高了人类基因组中外显子区域的研究效率,显著降低了研究成本。目前主要用于识别和研究与疾病、种群进化相关的编码区及UTR区域内的结构变异。 ④目标区域测序 目标区域测序是指利用特制的探针对客户感兴趣的蛋白编码区域DNA或某段特定序列进行捕获,富集后进行高通量测序的基因组分析方法。该方法能够获得指定目标区域的遗传信息,极大地提高了基因组中特定目标区域的研究效率,显著降低了研究成本。通过目标区域测序,可以对候选位点或候选基因进行验证,也可以进一步找到候选区域或候选基因内的易感位点,适用于候选基因关联分析等研究。

新一代测序技术组装拼接软件velvet使用简介

新一代测序技术组装拼接软件velvet使用简介 目前用于新一代的测序的主要仪器有Illumina/Solexa的Genome Analyzer、ABI的Solid和Roche的454,它们都能高通量的测序,产生大量的测序结果,接下来就要对序列进行拼接,用于拼接的软件也有很多,比如velvet、soap、abyss、maq等,454的还有专门的newbler。平时用velvet比较多,就简单介绍一下。 velvet对短序列的拼接效果比较好,所以多用于对Illumina等产生的短序列片段进行组装拼接。下面以Illumina的GAII产生的结果为例进行说明。 一、单端测序 单端测序可以直接对fastq格式的原始文件进行处理,首先是用velveth 命令建立hash表子集 输入./velveth会出来使用帮助: Usage: ./velveth directory hash_length {[-file_format][-read_type] filename} [options] directory : directory name for output files hash_length : odd integer (if even, it will be decremented) <= 75 (if above, will be reduced) filename : path to sequence file or – for standard input File format options: -fasta -fastq -fasta.gz -fastq.gz -eland

相关主题
文本预览
相关文档 最新文档