Solexa测序原理及流程_--华大基因

格式：ppt
大小：1.49 MB
文档页数：19

下载文档原格式

Solexa测序原理及实验流程

Solexa测序原理及实验流程(2011-04-19 09:45:04)Solexa 高通量测序原理Solexa 方法是利用单分子阵列测试 genotyping ，此种测序法首先是将 DNA 从细胞中提取，然后将其打断到约 100 － 200bp 大小，再将接头连接到片段上，经 PCR 扩增后制成 Library 。

随后在含有接头的芯片（ flow cell ）上将已加入接头的 DNA 片段绑定在 flow cell 上，经反应，将不同片段扩增。

在下一步反应中，四种荧光标记的染料应用边合成边测序的原理，在每个循环过程里，荧光标记的核苷和聚合酶被加入到单分子阵列中。

互补的核苷和核苷酸片断的第一个碱基配对，通过酶加入到引物上。

多余的核苷被移走。

这样每个单链 DNA 分子通过互补碱基的配对被延伸，利用生物发光蛋白，比如萤火虫的荧光素酶，可通过碱基加到引物后端时所释放出的焦磷酸盐来提供检测信号。

针对每种碱基的特定波长的激光激发结合上的核苷的标记，这个标记会释放出荧光。

荧光信号被 CCD 采集， CCD 快速扫描整个阵列检测特定的结合到每个片断上的碱基。

通过上述的结合，检测可以重复几十个循环，这样就有可能决定核苷酸片断中的几十个碱基。

Solexa 的这种方法，可在一个反应中同时加入 4 种核苷的标签，采用边合成边测序（SBS － sequencing by synthesis），可减少因二级结构造成的一段区域的缺失。

并具有所需样品量少，高通量，高精确性，拥有简单易操作的自动化平台和功能强大等特点，此反应可以同时检测上亿个核苷酸片断 , 因此在同一个芯片或几个芯片上花费很少（只需常规方法的 1 ％）的成本就可测试全基因组。

实验流程1. 文库制备将基因组DNA打成几百个碱基（或更短）的小片段，在片段的两个末端加上接头(adapter)。

2. 产生DNA簇利用专利的芯片，其表面连接有一层单链引物，DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。

Illumina Solexa NGS

建库
即样本制备过程，将DNA打断到大小适宜的片段，在DNA片段两端加上测序接头，完成建库工作。
首先准备基因组DNA（100—200ng），然后将DNA随机片段化成几百碱基或更短的小片段，并在两头加上特定的接头反转成cDNA，然后加上接头，或者先将RNA 反转成cDNA，然后再片段化并加上接头。片段的大小（Insert size）对于后面的数据分析有影响，可根据需要来选择。对于基
Illumina Solexa NGS
DNA二代测序Solexa技术
Illumina Solexa
Solexa技术最早由两位剑桥大学和Sanger的科学家创立，利用专利核心技术 “DNA簇”和“可逆性末端终结”，达成自动化样本制备及基因组数百万个碱基大规模平行测序。 Illumina作为测序行业的龙头企业，于2006年收购Solexa公司，获得新一代高通量测序技术，从而成为目前市场上的主流测序满足Small RNA 测序的读长要求，且数据读取量大，性价比高，因此Solexa在Small RNA测序方面得到广泛的应用
(1) PAGE胶纯化特定大小的小RNA分子； (2) 5′接头连接和纯化； (3) 3′接头连接纯化； (4) RT-chnoli基延伸测序（Single Base Extension and Sequencing）
完成好扩增的DNA片段紧密结合在flowcell上，加入带有荧光信号的dNTP，检测与 DNA片段结合的dNTP信号来获得碱基信息。簇扩增及测序同时进行。即在碱基延伸过程中，每个循环反应只能延伸一个正确互补的碱基，根据四种不同的荧光信号确认碱基种类，保证最终的核酸序列质量，经过多个循环后，完整读取核酸序列二 RNA是一类高度保守的长度在18-30 nt的RNA分子，主要包括miRNA、siRNA、piRNA。是生物体内一类重要的调控分子，参与细胞生长、发育、代谢、基因转录和翻译等诸多生物学过程，在疾病的发生发展转归的病理过程中也具有非常重要的作用，是一类新的极具开发潜质的生物标志物和药物靶标。

solexa测序原理及操作

≥99% ≥99% ＞98.5% ≥98.5%
5. Solexa 上机操作
C S
稀释样品→CS扩增→添加测序引物→送往GA测序
G A
检查GA→安装FC→First Base评估→开始测序
稀释样品
用于CS上机的样品首先经过QPCR检测浓度后根据任务单上机密度的要求对样品进行稀释。这分为新库和旧库两种情况：新库会根据以往类似样品的经验大概设定一个浓度；旧库即是根据已经上机后的数据计算出相应的浓度。
读长
时间（天）
密度
产量(GB)
准确率
1 x 36 bp 2 x 36 bp 2 x 45 bp 2 x 76 bp
~2.5 ~5 ~6.5 ~9.5
138-168 million 138-168 million 138-168 million 138-168 million
4.5-6 9.5-11.5 13.5-16.5 20.5-25
diol
diol
diol
diol
diol
Flow Cell接头
P7
P5
模板杂交
延长
变性
剩下的复制链其一端“固定”在芯片上，另外一
端随机和附近的另外一个引物互补，被“固定” 住，形成“桥”(bridge) 。形成的单链桥，以周围的引物为扩增引物，在芯片表面进行扩增，形成双链。双链经变性成单链，再次形成桥，并作为下一轮扩增的模板继续扩增反应。反复若干轮扩增，每个单分子得到了大量扩增，成为单克隆“DNA簇群”。
Y
X
TG C TAC GAT …
1 2 3 4 5 6
7
8
9
TTTTTTTGT…
3.2 Paired-End Sequencing

mRNA solexa测序分析方案

mRNA solexa测序结果分析SSC021目录mRNA solexa测序实验分析方案 (3)Solexa Digital Gene Expression (3)分析方案 (3)一、基因注释（必选） (3)二、差异基因筛选（必选） (4)三、样品之间的比较分析（推荐） (4)四、GO(gene ontology)分析（推荐） (4)五、pathway分析（推荐） (5)六、Knowledge-driven Network分析（推荐） (5)七、转录因子分析（推荐） (5)mRNA solexa测序实验分析方案Solexa Digital Gene Expression基因表达方法采用Illumina Digital Gene Expression试剂盒。

选取起始1～2µg总RNA，利用OligodT的beads富集总RNA样本中mRNA，并逆转录为双链cDNA，采用4碱基识别酶DpnII酶切双链cDNA，链接Illumina adapter1，利用MmeI酶切3’端20碱基，并在3’端链接Illumina adapter2。

再加入Primer GX1和Primer GX2, 进行15个循环的PCR扩增（10 seconds at 98°C， 30 seconds at 60°C，15 seconds at 72°C ，10 minutes at 72°C）。

扩增后样本通过6% TBE PAGE 胶回收85碱基条带，纯化后通过Illumina基因表达测序法测序。

分析方案一、基因注释（必选）我们将测序结果进行比对和分析，确定tag代表的基因，用于后续分析。

结果样板：二、差异基因筛选（必选）对样品之间进行差异基因筛选。

筛选到表达有差异变化的基因。

然后对变化基因的趋势进行归类，以方便分析和描述。

实例如下图：三、样品之间的比较分析（推荐）我们将通过曲线拟合的方法，寻找样品之间趋势差异最大的一些基因：四、GO(gene ontology)分析（推荐）对于每一种表达趋势的基因，选择性的进gene ontology:功能分析。

北京师范大学生物化学课件---solexa测序原理及应用

第 5 页共 15 页
目标基因组片段化
新一代高通量 DNA 测序技术
片段拼接
补洞
新一代 DNA 测序技术在全基因组测序应用中的技术路线
二、全基因组表达谱分析：
第 6 页共 15 页
基于新一代测序技术的表达谱分析原理
和附近的另外一个引物互补，被“锚定”住，形成“桥“(bridge)； 5、在测序芯片上同时有上千万 DNA 单分子发生以上的反应； 6、4 中形成的单链桥，以周围的引物为扩增引物，在测序芯片表面再次进行扩增，形
第 1 页共 15 页
成双链；

7、双链经变性成单链，再次形成桥，成为下一轮扩增的模板继续扩增反应；
Solexa 技术的基本原理: 1、基因组 DNA 被随机打断成为小的 DNA 片断；并在 DNA 片断的两端连上接头
(adapter)； 2、Solexa 测序专用的测序芯片（flow cell）表面连接有一层单链引物（Primer）,单链状
态的 DNA 片断与芯片表面的引物通过碱基互补被一端“锚定”在芯片上； 3、通过扩增反应使得单链 DNA 成为双链 DNA； 4、双链再次变性后成为单链，其一端“锚定”在测序芯片上，另外一端（5’或 3’）随机
Solexa 技术介绍： Solexa 技术最早由两位剑桥大学的化学家创立，利用专利核心技术“DNA 簇” 和“可逆性末端终结”，达成自动化样本制备及基因组数百万个碱基大规模平行测序，具有高准确性，高通量，高灵敏度，和低运行成本等突出优势。可以同时完成传统基因组学研究（测序和注释）以及功能基因组学（基因表达及调控，基因功能，蛋白/核酸相互作用）研究。
其他应用：DNA 甲基化分析，Metagenomics 等。
一、基因组测序和重测序： 1、经典案例

DNA测序技术的发展历史与最新（可编辑）

DNA测序技术的发展历史与最新在2002年4月，美国《科学》杂志，登载了一篇长达14页的论文尤其引人注目―――《水稻（籼稻）基因组的工作框架序列图》。

2004年12月，水稻基因组“精细图”全部完成 2004年12月10日，中国科学家在世界上率先完成的家蚕基因组“框架图”及基因组生物学分析成果在世界科学类权威的学术期刊――《Science》杂志上发表。

2009年12月13日，Nature杂志刊登了由深圳华大基因研究院领衔完成的大熊猫基因测序。

DNA测序技术的发展历史与最新进展主讲人：金瑞营第一代DNA测序技术成熟的DNA测序技术始于20世纪70年代中期。

●1977年am 和Gilbert报道了通过化学降解测定DNA序列的方法。

●同一时期, Sanger发明了双脱氧链终止法● 20世纪90年代初出现的荧光自动测序技术将DNA测序带入自动化测序的时代。

这些技术统称为第一代DNA测序技术。

化学降解法在该方法中,一个末端被放射性标记的DNA片段在5组互相独立的化学反应中分别被部分降解,其中每一组反应特异地针对某种碱基。

因此生成5组放射性标记的分子,每组混合物中均含有长短不一的DNA分子,其长度取决于该组反应所针对的碱基在原DNA片段上的位置。

最后,各组混合物通过聚丙烯酰胺凝胶电泳进行分离,再通过放射自显影来检测末端标记的分子。

双脱氧链终止法原理：核酸模板在DNA 聚合酶、引物、4种单脱氧核苷三磷酸 dNTP,其中的一种用放射性P32标记存在条件下复制时,在四管反应系统中分别按比例引入4种双脱氧核苷三磷酸ddNTP ,因为双脱氧核苷没有3′ -OH,所以只要双脱氧核苷掺入链的末端,该链就停止延长,若链端掺入单脱氧核苷,链就可以继续延长。

如此每管反应体系中便合成以各自的双脱氧碱基为3′端的一系列长度不等的核酸片段。

反应终止后,分4个泳道进行凝胶电泳,分离长短不一的核酸片段,长度相邻的片段相差一个碱基。

经过放射自显影后,根据片段3′端的双脱氧核苷,便可依次阅读合成片段的碱基排列顺序。

solexa培训的资料

通过生物信息学方法对取得的序列信息进行拼接。
基于SBS的Solexa测序技术
3’-
…-5’
5’-
GTATTTTCGGCACAG
A
G
A
C
T C
T TG
Cycle 1:按顺序加入反应试剂合成第一个碱基清除未反应的碱基和试剂激发碱基荧光并收集荧光信号去除阻断基团和荧光基团
Cycle 2-n: 重复前面的步骤
Solexa仪器说明
Solexa仪器说明
直观图
特殊处理图
6 Solexa的优势
高通量：一次单通道的测序可以得到不低于 200 万条
的序列
低成本：每20个碱基只需花费一分钱，是传统Sanger
技术花费的1/100。
高分辨率：可以检测测序得到的miRNA单个碱基差异高精准度：数字的检测信号，从几个到数十万个copy
成复制链。
2.1.1 Cluster Station流程
剩下的复制链其一端“固定”在芯片上，另外一
端随机和附近的另外一个引物互补，被“固定” 住，形成“桥”(bridge) 。
形成的单链桥，以周围的引物为扩增引物，在芯
片表面进行扩增，形成双链。
双链经变性成单链，再次形成桥，并作为下一轮
扩增的模板继续扩增反应。
精确计数
操作简便：不需重复实验多用途：基因测序；重测序；mRNA；Small RNA；
甲基化DNA；多样品测序……
谢谢!
ห้องสมุดไป่ตู้
SOLEXA
新一代的基因测序技术
上机组
1 SOLEXA测序原理
Solexa 是一种基于边合成边测序技术

新一代基因测序技术原理和应用

新一代基因测序技术原理和应用基因测序技术是解读生物基因组的重要方法之一，对于深入了解生物基因的结构和功能起着至关重要的作用。

近年来，随着科学技术的不断发展，新一代基因测序技术的出现，进一步提高了测序速度与准确度，为基因研究和应用提供了更多可能性。

一、新一代基因测序技术的原理新一代基因测序技术相比传统的Sanger测序技术，采用了高通量并行测序的方法，能够在短时间内同时测定大量的DNA序列，大大提高了测序的效率和准确度。

目前，常用的新一代基因测序技术主要包括Illumina/Solexa 测序、ABI SOLiD测序、454测序和Ion Torrent测序等。

1. Illumina/Solexa测序原理Illumina/Solexa测序是目前应用最广泛的测序技术之一。

其原理主要基于DNA合成过程中的核酸链延伸和荧光信号的检测。

首先，DNA样本经过片段化处理，生成短小的DNA片段。

随后，这些片段会与具有固定引物的光纤芯片上的端子进行连接。

接下来，在PCR反应中进行扩增，生成成千上万个复制物。

之后，将芯片放入Illumina测序仪中，通过循环终止法进行测序。

在每个循环中，通过在碱基末端发行碱基的可逆终止法，每次只释放一种具有特定荧光标记的碱基，并通过激光检测其荧光信号。

最终，通过分析测序结果的荧光信号，可以获得DNA序列。

2. ABI SOLiD测序原理ABI SOLiD（Sequencing by Oligonucleotide Ligation and Detection）测序技术是一种通过链接寡核苷酸和检测碱基的方法进行测序。

其核心原理是通过两个同时存在的碱基标记对DNA进行测序。

首先，DNA片段经过端修复，再通过连接引物的方法进行适配体制备。

然后，在适配体上引入特定的引物序列，将这些标记不同的适配体引物链接到DNA片段上。

在测序过程中，利用红外线激光对适配体的碱基进行激发，并通过信号检测系统检测每个碱基的颜色和强度，进而确定序列。

454测序

第二代测序技术（Next-Generation Sequencing）NGS之基础篇2001年，美、英、法、德、日、中六国合作，历时十年，耗资数十亿美元的人类基因组计划（Human Genome Project，HGP）宣告完成。

转眼又是十年过去，在此期间，各国科学家仍在为解读基因的密码而不懈努力，这其中最大的突破，就是第二代测序技术的推出。

HGP的顺利完成证明了我们有能力对自身的遗传信息进行研究，然而，高昂的成本、漫长的时间、巨大的人力需求，无不限制着对遗传密码的进一步认识。

从HGP开始的第一天期，科学家们就在寻求更好的方法来对基因组进行研究，“鸟枪法”就是其中之一。

2006年，美国X大奖基金会（）设立了奖金高达1000万美元的基因组Archon X大奖，旨在奖励第一个在10天内以低于100万美元的成本完成100个人类基因组测序的民间团队。

而罗氏（Roche）、应用生物系统（Applied Biosystems，ABI）、Illumina三家公司先后推出了各自的第二代高通量测序平台，成为NGS领域的领头羊。

2005年底，454公司推出第一个基于焦磷酸测序原理的高通量基因组测序系统——Genome Sequencer 20 System，这是核酸测序技术发展史上里程碑式的事件。

随后，罗氏公司以1.55亿美元收购了454公司，并在2006年推出了更新的GS FLX测序系统，该系统可在10小时的运行中获得100万条读长（reads），4~6亿个碱基信息（base pair），且准确率达到99%以上。

2008年，GS FLX系统再次升级，通量提高了5倍，读长和准确率也有所增加。

虽然454 GS测序平台也许不是市场占有率最高的测序仪，但截至2011年3月，利用该系统进行研究的论文已发表超过1000余篇，而它在读长上的优势明显胜于另两套系统，因此在从头测序（de novo）和宏基因组测序（meta genome）方面有着不可替代的地位。

一代、二代、三代基因测序技术的发展历史及应用

罗氏454 GS测序仪器参数对比
备注：数据来源于罗氏官网和网络
二代测序的技术平台——Thermo Fisher
ABI/SOLiD技术原理： SOLiD测序技术也是采用油包水的方式进行Emulsion PCR。
不同之处在于SOLiD形成的小水滴要比454系统小得多，只有1μm大小，用连接酶替代了常用的DNA聚合酶。
二代测序的技术平台——Thermo Fisher
① Ion Torrent测序芯片，是一块半导体芯片； ② 孔即是测序微珠的容器，又同时是一个微型的PH计。 ③ 4种dNTP依次流过Ion芯片； ④ 发生聚合反应产生H+引起PH变化，被传感器记录下来。每个碱基的检测只需要几秒钟。
二代测序的技术平台——Thermo Fisher
读长
2x150bp 2x150bp 2x300bp
台式测序 2x150bp
台式测序/大规模
2x150bp
大规模测序
2x250bp
大规模测序
2x150bp
测序通量 1.2Gb 7.5Gb
15Gb
120Gb
330Gb
6000Gb
16Tb
最大reads数 4M
25M
25M+
运行时间 9.5-19h 4-24h
4-55h
400M 12-30h
1.1B+ 11-48h
200亿 13-44h
260亿（单） 520亿（双）
13-48h
二代测序的技术平台——华大智造
华大基因先推出了BGISEQ-500桌面化测序系统，之后又推出： BGISEQ-50、 MGISEQ-200、 MGISEQ-2000均取得了NMPA（原CFDA）认证，还推出了MGISEQ-T7， 2022年10月推出DNBSEQ-T10x4、DNBSEQ-T7高通量测序仪。

solexa测序原理

A p p l i c a t i o n NN o t e :D N A S S e q u e n c i n gClonal Single Molecule Array ™TechnologySequencing templates are immobilized on a proprietary flow cell surface designed to present the DNA in a manner that facilitates access to enzymes while ensuring high stability of sur-face-bound template and low non-specific binding of fluorescently labeled nucleotides. Solid phase amplification is employed to create up to 1,000 identical copies of each single mole-cule in close proximity (diameter of 1 micron or less). Since the process does not involve photolithography, mechanical spotting or positioning of beads into wells, the Clonal Single Molecule Array technology can achieve densities of up to 10 million single molecule clusters per square centimeter.Sequencing-by-SynthesisSolexa’s Sequencing-By-Synthesis (SBS) utilizes four proprietary fluorescently labeled modified nucleotides to sequence the millions of DNA clusters present on the flow cell surface. These nucleotides, specially designed to possess a reversible termination property, allow each cycle of the sequencing reaction to occur simultaneously in the presence of all four nucleotides (A, C, T,G). In each cycle, the polymerase is able to select the correct base to incorporate, with the nat-ural competition between all four alternatives leading to higher accuracy than methods whereonly one nucleotide is present in the reaction mix at a time. Sequences where a particular base is repeated one after another (e.g., homopolymers) are addressed like any other sequence and with high accuracy.Analysis PipelineThe Solexa sequencing approach is built around a very large number of short sequence reads.Deep sampling of more than ten-fold even coverage is required to generate a consensus and thus ensure high confidence in determination of genetic differences. Such differences are identi-fied by comparison of sequence reads to a reference. Deep sampling allows the use of weighted “majority voting” and statistical analysis, similar to conventional methods, to identify homozy-gotes and heterozygotes and to distinguish sequencing errors. Each raw read base has an assigned quality score so that the software can apply a weighting factor in calling differences and generating confidence scores.The suite of software from Solexa will enable users to align sequences to a reference in rese-quencing applications. Developed in collaboration with leading researchers, Solexa’s software suite includes the full range of data collection, processing, and analysis modules to streamline collection and analysis of data with minimal user intervention. The open format of the software allows for easy access to the data at various stages of processing and analysis using simple application program interfaces.本页已使用福昕阅读器进行编辑。

基因组测序原理

参考文献：岳桂东高强高通量测序技术在动植物研究领域中的应用生命科学 2012年第42卷陈勇柳亦松曾建国，植物基因组测序的研究进展生命科学研究 2014.2 杨晓玲施苏华唐恬新一代测序技术的发展及应用前景生物技术通报 2010年第10期周晓光任鲁风李运涛张猛俞育德, 于军下一代测序技术: 技术回顾与展望生命科学
原理: 利用合成测序理论，将样本DNA的单链分子绑定在该仪器特有的没有背景荧光的玻璃表面，通过加入荧光标记的核苷酸和聚合酶到单分子阵列中，核苷酸会特异性结合到DNA分子的结合位点上通过激光激发结合在DNA子上的荧光标记的核苷酸，从而使标记物发出荧光，相机以15ms速度快速扫描整个阵列，检测特异性结合到DNA 片段上的荧光碱基之后，结合的核苷酸会被移除，然后，进入下一次结合。优缺点：不需要PCＲ扩增，所以能反映样本的真实情况，通量也较高，但由于该技术限制可读的DNA片段长度平均仅为32bp，而且其高度精密的显微镜不仅造成其仪器庞大价格昂贵，而且对环境要求高升级困难。
优点：纳米级别的孔径保证了检测具有良好的持续性，测序的准确度可达 99.8%以上，对于长达1000bp的单链DNA分子、RNA分子或者更短的核酸分子而言，无需进行扩增或标记就可以使用纳米孔测序法进行检测，这使得便宜快速地进行DNA测序成为可能。
三代测速技术的比较
第一代测序技术：凭借其长的序列片段和高的准确率, 适合对新物种进行基因组长距框架的搭建以及后期GAP填补, 但是成本昂贵, 而且难以胜任微量 DNA 样品的测序工作。第二代测序技术： 454 适合对未知基因组从头测序, 搭建主体结构, 但在判断连续单碱基重复区时准确度不高。Solexa具有通量高、片段短、价位低的特点,适合于小片段如miRNA 的研究。 SOLID 具有双碱基编码系统的纠错能力以及较高的测序通量, 但无法在基因组拼接中的广泛应用。

Sanger&Solexa测序原理和流程

最终结果是通量的飞跃——从点到面
测序的发展方向质量Fra bibliotek通量读长成本
Quality file(Fasta)
>203c04_0102.g1.abi 21 21 29 26 26 26 32 32 33 47 48 48 51 51 42 42 56 56 56 56 48 31 31 31 31 35 42 48 37 40 36 45 35 35 35 44 56 56 42 42 36 35 51 51 56 56 56 56 56 35 35 35 29 29 17 29 35 35 35 37 42 42 44 42 37 42 44 44 56 37 42 35 36 30 33 33 38 37 37 37 31 29 29 29 42 35 29 29 29 29 29 16 17 17 24 24 29 29 682 33 47 51 46 48 44 56 51 32 45 35 35 56 42 31 40 46 43 37 37 38 36 24 24 29 42 23 29 48 42 44 51 45 35 44 39 43 37 36 28 29 33 17 48 51 35 34 42 42 42 42 42 42 35 37 46 43 45 40 43 42 37 37 36 36 28 28 35 29 40 40 430 51 51 34 34 42 42 42 42 37 37 37 37 42 40 42 40 42 42 46 51 42 42 36 42 25 25 40 40 ABI 46 42 34 34 42 42 40 45 37 37 40 51 40 45 42 37 42 42 44 43 44 37 44 42 32 27 25 25 42 42 35 37 44 51 45 35 42 42 37 42 25

报告1：Solexa测序原理、实验流程课件

1、Prepare genomic DNA sample
利用物理方法将待测样品DNA随机打断成
100-200bp的片段，在打断后的DNA片段的两端加上接头，解开双链。

2、Attach DNA to surface
Solexa在测序时利用微注射系统将已经加过
接头的单链待测片段随机结合到Flow Cell的内表面，每一个Flow Cell又被分成８条Lane，每条 Lane的内表面上能通过共价键的形式随机固定单链接头序列和带接头的单链待测DNA片段。
通过变性，释放出互补的单链，固定到附近
的固相表面。

6、Complete amplification
通过不断的循环，就会在Flow cell 的固相表面上获得上百万条成簇分布的双链待测片段。

7、Determine first base
加入DNA聚合酶、被荧光标记的dNTP和接头引物，开始第一轮测序。

3、Bridge amplification
在Flow cell内加入未标记的dNTP和酶，起始固相桥扩增。

4、Fragments become double-stranded
所有的单链桥型待测片段通过酶的作用，被
扩增成双链桥片段。

5、Denature the double-satanded molecules
Solexa测序原理、实验流程以及现在常用的微生物群落功能基因检测的方法
第一部分
Solexa测序原理、实验流程
Solexa简介
Illmina 公司包含有HiSeq 和MiSeq 测序平台，基于Solexa 技术，其

基本原理是单分子簇边合成边测序(Sequencing by Synthesis，SBS)

华大基因测序技术基础原理

• Cluster Generation 分子簇的生成
• Sequence By Synthesis 边合成边测序
Sample Preparation
5’
T
3’
A
5’
T
3’
A
A
3’
T
5’
A
3’
T
5’
加双末端
Grafted FlowCells
OH
OH
diol
P7
P5
OH
8oxo-G
OH
U
8oxoG-P7 U-P5
(1985)
Invention of 454 GS 20 Sequencer
(2005)
Invention of Applied Biosystems
Solid System (2007)
Invention of Illumina Genome Analyzer System (2006)
Sanger 测序法原理
* 生成“簇” * 5小时
* Start Sequencing * Cluster Density Evaluation * 4 images per tile per cycle * Run time: 2-3 days
* Firecrest: Image Analysis * Bustard: Basecalling *Gerald: Sequence Alignment
•Each tile is imaged four times per cycle – one image per base 每个循环会对每个tile照4次相——每个碱基都会成像
Illumina/on
Cluster 工作站 Clusttion序列簇的产生

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Solexa测序原理及流程
深圳华大基因研究院
Agenda
DNA样品制备 Cluster Formation
Binding to flowcell Bridge Amplification
SBS (Sequencing By Synthesize)
One Cycle One Base
P5
3’ddN
O
ttactatgccgctggtggctctagatgt aatgatacggcgaccaccgagatctaca
s(T)10
agtgtagatctcggtggtcgccgtatcatt
gaagagctcgtatgccgtcttctgcttgaaaaaaaaaa
NaIO4
DNA insert
Melt and hybridize 3’ to primers
5’
1st
PCR oligo 2
P7
round
PCR 5’
3’
3’ 5’
3’ extension
3’
3’
5’
3’ extension
Insert
3’ 5’
3’ 5’
P7
P5
5’ 3’
SBS oligo
P7 反向互补序列
5’ 3’ 5’
Pair End
DNA样品制备
Cluster formation
Cluster Formation
Bridge Amplification Cycle
DNA synthesization
P7 P5
SBS oligo
Sequencing By Synthesization
三种特殊序列
P7序列：flowcell上结合的序列，边合成边边测序（SBS）过程模板序列的5’端。
3’ 5’
SBS oligo P7 反向互补序列
5’po4 3’ 5’po4 3’A 5’
Phosphorylation T4 polynucleaotide kinase, ATP
3’ po45’
2.Add 3’ Adenosine with
Klenow (3’exo- ) and dATP
A3’
ctaga tctagccttctcgcagcacatccctttc gatct agatcggaagagcgtcgtgtagggaaag
P7
sttttttttttcaagcagaagacggcatacgagctcttc
aaaaaaaaaagttcgtcttctgccgtatgctcgagaagg sttttttttttcaagcagaagacggcatacgagctcttcc
3’ddN
O
P7
P7
hybridization of sequencing primer
3’ddN
O
Pair End
Standard sample prep
Paired-end sample prep
P5 SBS3
5’
Insert
5’
P7
P5 PESP#2
5’
Insert
5’
PESP#1 P7
Different Cluster template
2nd round PCR
Cluster template
P7
3’ 5’
Insert
5’
5’
OH 3’
3’
P7
OH 3’diolFra bibliotek3’P5
OH 3’
NaIO4 diol
NaIO4
OH 3’
diol
P5
P7
P5
P7
Bridge Amplification
ddNTP
ddNTP
P5
P7
P5 P7
SBS (Sequencing By Synthesize)
8. ddNTP block & Hyb SBS 8
SBS READ 2
OH
7. Linearise P7 (Fpg)
Fpg
OH
6. Re-synthesis of P5-strand
(Isothermal amp)
OH OH
5. De-phosphorylate P5-PO4(PNK)
Specification comparison:
P7
O
s(T)10
aatgatacggcgaccaccgagatctacact
P5
3’ddN
O
Linearization of Clusters (cont.) denature
DNA insert
gagaaagggatgtgctgcgagaaggctaga tctagc
DNA insert
gatct agatcggaagagcgtcgtgtagggaaag
OH
OH
U
8oxo-G
8oxoG-P7 U-P5
1. Grafting
OVERVIEW OF THE METHOD
=
PO4
OH
USER OH
OH
OH
U
U
PNK
2. Cluster ampn
3. USER Linearisation
4. ddNTP () block & Hyb SBS 3
SBS READ 1
PCR oligo 1
PCR enrichment (cont.)
3’ 5’
Melt and hybridize to primers
2nd round PCR
3’ extension
3’
Insert
PCR oligo 2
3’
5’
3’
5’
SBS oligo P5
5’ 3’
Melt and hybridize to primers
P5序列：flowcell上结合的序列。 SBS引物序列(oligo)
Fragment DNA
5’ 3’
Genomic DNA
sample prep
5’
+
5’ 3’
5’
1.End repair
T4 polymerase , DNA Pol 1 (Klenow fragment)
5’ + 3’
R2 preparation SBS kit
15 reagents 4 h 50 mins
36 cycle
36 cycle
36 cycle
THE END!
THANKS!
ttactatgccgctggtggctctagatgt
s(T)10
sttttttttttcaagcagaagacggcatacgagctcttc sttttttttttcaagcagaagacggcatacgagctcttcc
s(T)10
agtgtagatctcggtggtcgccgtatcatt
Bridge Amplification
3’ extension
melt
hybridize
P5
P7
P5 P7
P7 P5
P7 P5
O
Linearization of Clusters
NaIO4
DNA insert
gagaaagggatgtgctgcgagaaggctaga tctagc ctctttccctacacgacgctcttccgatct agatcg
+
po45’
5’po4 3’T
3.Ligation of adaptors
DNA insert
3’
3’
5’ P7反向互补序列
3’
SBS oligo
5’
P7 P5 SBS oligo 5’ P7 反向互补序列
3’
PCR oligo 1
5’
5’
P5 SBS oligo
5’ 3’
5’ 3’
5’ 3’
PCR enrichment 3’
Flowcell
Single read 2 primer
2-primer PE method
Read 1
Read 2
2 (different) primer
Linearisation Blocking 1 Blocking 2
Diol
USER
Fpg
✓
✓
✓
-
✓
✓
Sequencing primer SBS3(+T) SBS3(+T) SBS8(+T)