当前位置:文档之家› 精准医疗:基因检测行业调研

精准医疗:基因检测行业调研

精准医疗系列之三:基因检测行业调研

联系人:张其立/蔡强(153********)

最近我们深入基因检测行业一线,走访了百傲科技(基因芯片)、昂朴生物(基因测序创业公司)、遗传专科医院(产前诊断)、肿瘤研究所(肿瘤分子诊断)、华大基因(测序服务)等公司,了解了行业的发展现状。调研的主要内容整理如下,欢迎大家一起交流探讨。

一、基因检测的几种技术,不仅仅是测序

基因检测是精准医疗的基础,之前市场上的报告都集中关注于基因测序,但是除了测序外,PCR(qPCR、DDPCR)、基因芯片(固相芯片、液相芯片,检测CNV、SNP)也都是临床中常用的基因检测手段。目前高通量测序主要应用于无创产前诊断(唐氏筛查)、肿瘤基因检测、易感基因筛查;基因芯片主要分为CNV(基因片段微缺失微重复)、SNP(单核苷酸多态性)两种,主要应用于产前诊断、药物代谢基因检测、易感基因检测;PCR分为qPCR、DDPCR两种,主要应用于肿瘤、耳聋基因少量突变位点的检测。

1.1 qPCR和DDPCR

PCR在基因检测中的主要应用是多重荧光定量PCR(即qPCR),qPCR的检测方法有两种,分别是ARMS-qPCR和Tagman-qPCR,原理都是:单核苷酸发生改变后,探针与序列的结合减弱,导致PCR反应不能正常进行,通过检测荧光产物就能知道位点是否发生了改变,并且通过荧光强度能够实现定量。DDPCR与普通荧光定量PCR原理一样,但是它能将反应混合液分割为微小液滴,每个液滴不包含或者只包含数个反应体系,这样通过液滴数量和反应量(符合泊松分布)就能更加精确检测突变位点和突变基因含量。

这两种PCR方法的特点是:①能够定量检测,DDPCR的精确程度很高;②在扩增完成后就能得到结果,不需要进一步进行杂交或者测序,检测时间短。③一般对仪器无限制,差别在于检测试剂盒。目前主要产品有:EGFR基因检测、KRAS基因检测、BRAF基因检测、四项耳聋基因检测等。

1.2 基因芯片,包含固相芯片和液相芯片

基因芯片对检测已知突变位点具有较大优势,主要分为基因片段微缺失微重复(CNV)检测、基因分型(SNP或突变)检测两种,原理是提取患者基因组DNA,然后在特定引物下扩增,纯化扩增产物与基因芯片上的探针杂交,然后在扫描仪上读取结果。

CNV主要用于产前诊断以及遗传病检测,CNV胎儿一般在妊娠期间流产,出生后的胎儿临床表现为智力低下、发育迟缓、癫痫及伴有先天性心脏病,所以医院中的心内科用得比较多。基因分型检测可以用于大量SNP位点以及部分突变位点的检测,可以检测易感基因和基因突变位点。

国外知名的芯片公司有Illumina、Affymetrix、Agilent公司,美国基因检测公司23andMe

使用的就是基因芯片检测,具体是在Illumina HumanOmni Express-24 format chip基础上改进而来,大约可以检测100万个SNP。国内的博奥生物耳聋基因芯片可以检测4个基因中的9个基因突变位点、宏灏基因的高血压芯片可以对5个高血压药物相关基因位点进行检测、百傲科技有4款基因芯片产品,主要涉及药物代谢、乙醛脱氢酶、5、10亚甲基四氢叶酸还原酶检测。

值得注意的是,我们通常所说的基因芯片是固相基因芯片,也就是把核酸探针片段是结合在玻片或者塑料片上面;而液相芯片起源于流式细胞仪,是一种以微球为基础的多指标数据采集和分析平台,微球上连接有核酸探针,并且含有荧光标记,通过杂交后的荧光反应来判断检测结果,因为分子杂交是在悬浮溶液中进行,所以称为“液相生物芯片”。液相基因芯片减少了空间限制,提供了充分的表面积,反应更为充分,所以精确度和准确度也更高。

基因芯片的特点是:①需要先扩增,然后再杂交,少量位点检测的时间比PCR长,但是多个位点检测时比PCR方便;②基因芯片可以实现高通量检测,特别在CNV检测方面具有优势;③由于不同探针杂交条件的差异、空间限制等因素,高通量芯片检测时会有10%左右的假阳性\假阴性结果。④芯片扫描仪是闭源,不同的芯片扫描仪器一般不能混用。

1.3 基因测序

基因测序目前也主要分为两类,分别是一代测序(Sanger测序)和二代测序(高通量测序)。一代测序的原理是首先设计扩增区域两端的引物(探针),扩增过程中用ddNTPs终止扩增,然后电泳反应产物,检测末端荧光基团就能知道具体核苷酸序列。一代基因测序不能高通量检测,但是它是目前所有基因检测技术中公认的“金标准”,较其他方法更加准确、可靠,是临床上最可信赖的基因诊断手段,二代测序的主要步骤是:提纯基因组DNA、将DNA片段化、在DNA片段两端加接头(adaptor)、然后用探针去捕获目的片段、然后纯化扩增、上样测序、测序结果存储、数据分析、出具测序报告。这其中有多种类型的公司参与,例如测序仪器公司、试剂公司、捕获探针合成公司、数据存储和分析公司、第三方测序服务公司、医院检验科等,对整个测序过程的分析很重要,这会让我们更好的理解整个测序产业链。

目前一代测序主要用于:①单基因病多外显子的测序,或者少量基因多位点的检测;

②验证二代测序中出现的阳性结果。二代测序主要应用于:①无创产前筛查;②易感基因检测;③根据不同的Panel进行肿瘤、遗传病的检查。

一代测序的特点是:①测序成本比较高;②结果可靠,用于验证其他检验结果;③读长较长,达到900bp;④不能高通量。二代测序的特点是:①高通量、测序成本相对于一代测序大大下降;②读长小,大概在200bp左右;③单个碱基的错误率在0.1%左右,通过提升测序深度可以减少错误率;④全基因组测序时会有随机丢失。

1.4 顺便提一下第三代测序技术

三代测序技术目前还不稳定,完全推广开来估计要10年时间。根据已有资料显示,①三代测序实现了DNA聚合酶内在自身的反应速度,一秒可以测10个碱基,测序速度是化学法测序的2万倍。②实现了DNA聚合酶内在自身的processivity(延续性,也就是DNA

聚合酶一次可以合成很长的片段),一个反应就可以测非常长的序列。二代测序现在可以测到上百个碱基,但是三代测序现在就可以测几千个碱基,这为基因组的重复序列的拼接提供了非常好的条件。③它的精度非常高,达到99.9999%。

此外,它还有两个应用是二代测序所不具备的。第一个是直接测RNA的序列。既然DNA 聚合酶能够实时观测,那么以RNA为模板复制DNA的逆转录酶也同样可以。RNA的直接测序,将大大降低体外逆转录产生的系统误差。第二个是直接测甲基化的DNA序列。实际上DNA聚合酶复制A、T、C、G的速度是不一样的。正常的C或者甲基化的C为模板,DNA聚合酶停顿的时间不同。根据这个不同的时间,可以判断模板的C是否甲基化。

二、测序是否会取代PCR和基因芯片?全基因组测序是否会取代捕获测序?

二代测序技术功能强大,而且随着测序成本的进一步降低,那是不是会完全取代其他基因检测手段呢?通过一线调研,我们认为虽然测序是主流技术,但是测序并不能取代其他检测手段,而且随着基因检测市场的进一步壮大,根据当前PCR和基因芯片的应用程度,未来PCR和基因芯片还有进一步扩大的空间。

主要理由是:①测序的成本和操作复杂度会持续高于PCR和基因芯片,医院检验科通常将测序业务外包给第三方基因测序公司,很难即时得到测序检验结果,而PCR和基因芯片检验科可以自己操作,能够较快的得到结果,并且检验科能够获得更大盈利,所以对检验科来说有较大的推广动力。②对医生而言只要能够得到诊断依据,能够指导用药就可以了,某些单基因病、少数位点的检测并不需要整个基因序列,PCR和基因芯片就能达到目的。③ PCR(qPCR、DDPCR)能够快速的,更加精确的对突变基因进行定量检测。④基因芯片对片段微缺失微重复(CNV)具有较好的检验结果,而目前测序较难对CNV进行准确的检测(随着技术的提高测序检测CNV将会逐渐成熟)。

另外,我们认为全基因组测序也不会取代目标序列测序,因为:①全基因组测序目前还是有随机丢失的问题,不能确保重要信息不会丢失。②为获得更加准确的结果,需要对目的片段进行深度测序,扫描次数可能高达2000x,全基因组测序无法达到。③序列信息只是一方面,基因的其他信息还包括甲基化等,而且当前基因信息的解析还有待提高,片面的追求全基因组信息意义不大。④对于非自身基因组所导致的疾病,例如外源病原体的检测,乙肝病毒、HPV病毒等,还有ctDNA检测等,也需要定向捕获测序技术。

综合以上可以预计,PCR、基因芯片、测序将逐步找到自己的市场定位,PCR技术主要应用于少量突变位点的定量检测;基因芯片在CNV、SNP的检测领域继续保持优势;一代测序将在少量基因、多突变位点的基因测序中应用广泛;高通量测序依然是基因检测的主流发展方向,针对特定疾病致病基因(肿瘤、心血管、糖尿病)的捕获测序技术、ctDNA检测和传染性病原体检测,将是高通量测序服务的发展方向。得益于整个基因检测市场的扩大,各项技术的应用、市场规模都会逐步扩大,但高通量测序仍将是主流。

三、公司能否对致病基因申请专利,垄断特定基因的检测?

之所以讨论这个问题,是因为如果公司率先确定某个基因突变与疾病之间的作用关系,并且对该序列申请专利,垄断对该基因的检测以及开发利用,势必会影响产业格局,所以弄

清楚这个问题有重要意义。

举个例子:美国有个生物公司叫Myriad genetics,他们拥有“BRCA1”和“BRCA2”这两个基因的专利,这两个基因与乳腺癌和子宫癌的发病密切相关,了解两个基因的情况,能为患者提供一系列的预防和保护措施。Myriad公司在基因专利的保护下,成为美国本土唯一可以进行对BRCA1和BRCA2基因进行序列分析的公司,每个标本基因BRCA1和BRCA2序列分析和结果解释的价格是3000美金,大大高于同类基因的检测费用。2013年相关科研机构和公司将Myriad公司告上法院,法院重新裁定:重新合成的cDNA属于可专利范围,但检测和分析BRCA 基因序列的方法不属于可专利的方法,由此取消了Myriad 公司对BRCA1和BRCA2两个基因的唯一检测权。

目前在基因检测领域的专利问题比较能确定的是:可以对突变基因申请专利(美国占据了人类基因序列专利的20%);但是专利保护范围有限,不能限制其他机构对该位点的检测或者其他应用(靠基因专利垄断测序是不可能的);检测所用到的核酸探针、试剂等,可以申请专利,这将是公司的主要竞争力之一。

四、基因测序产业链

测序是基因检测行业的主要发展方向,我们重点梳理了基因测序产业链。一般认为基因测序的上游是测序仪器,中游是测序服务,下游是数据分析,实际上我们可以进行更加具体的划分:上游是测序仪器,中上游是捕获和测序耗材(其中测序耗材与测序仪器配合使用),中游是测序服务,中下游是测序数据分析和云平台,下游是医学检验中心,包括测序数据的解读和医学诊断报告的出具。

图1:基因检测产业链

4.1 上游测序仪器公司掌握测序耗材

测序仪器由国外几家公司把持,主要有Illumina公司的Solexa和HiSeq技术,Life Tech 公司的Solid技术和Roche的454技术,其中Illumina凭借其超高通量和相对较长读长的优势,占有超过70%的市场份额。国内公司华大基因通过收购美国基因测序仪公司Complete

Genomics后开发BGISEQ系列测序仪,紫鑫药业与中科院共同研发的BIGIS测序仪已在今年8月份投产试用。

测序仪器开发公司的主要收入来源除了仪器销售外,测序耗材收入也占十分重要的比例,主要包括建库试剂、测序试剂、探针、工具酶等。Illumina测序仪每次上机测序的开销在3-15万元之间(不同测序平台成本不一样,建库成本按样本个数另算),以每月上机两次,假设每次5万元左右成本计算,一台测序仪一年的测序试剂成本在100万元以上。随着基因检测服务机构的增加,测序服务的价格会进一步压缩,单纯的测序外包服务盈利十分有限,只有往上下游延伸才能构筑更高的竞争壁垒,获得更大的盈利空间。

4.2 捕获技术或是关键

对于一般的基因检测服务公司,开发测序仪器是十分困难的,但是可以在基因片段的制备方面取得竞争优势。前面已经提到,未来一段时间目标序列捕获测序将是主流方向,包括同目标基因测序,ctDNA检测,外显子测序,染色体区域捕获,病原体检测等,都需要用到捕获技术,捕获效率的高低决定了基因测序的信息量和精准程度,这直接关系到公司的市场地位。简单地说:低于同一种病症能以更便宜的价格,检测到更多的相关基因,获得更多精确的数据,公司就越有优势。

捕获效率与目标基因的选择、探针的设计、捕获材料、试剂、操作等密切相关。目前主要有3种捕获方法。①多重扩增子,设计与目标片段互补的引物,通过PCR反应获得目标片段,这种方法受目标片段长度和数量的限制,多重PCR扩增效率的一致性一直是大难题。

②固相杂交法,所用的探针通常都是固定在固体支持物上,如玻璃片、塑料球等,其中最典型的是基因芯片。固相捕获系统构建首先选定目标DNA区域,在修饰了的玻璃片基上原位合成一系列与目标区域互补的探针。通常,基因芯片是杂交后,洗脱未杂交上的DNA片段,再洗脱与探针杂交的DNA,用于后序的测序工作。③液相杂交法,在溶液中目标DNA片段和已带有生物素标记探针直接杂交,然后通过生物素亲和素的反应使目标DNA片段锚定在带有亲和素的微珠上。洗去非目标DNA,洗脱后,富集的DNA用于测序。液相杂交与固相杂交相比有两大优势:第一、杂交效率更高;第二、易于操作,时间短,便于自动化操作。

4.3 循环肿瘤DNA和循环肿瘤细胞(CTC)的良好应用前景

血浆游离循环肿瘤DNA(ctDNA)是由肿瘤细胞释放到血浆中的单链或者双链DNA,携带有与原发肿瘤组织相一致的分子遗传学改变。ctDNA作为一种新的肿瘤标志物,将在肿瘤的诊断、治疗及预后检测等方面发挥重要的作用,尤其是对于一些不具有典型临床症状、检查无特异性和诊断困难的肿瘤可避免复杂的、具有创伤性的活检。ctDNA是一种特征性的肿瘤生物标记物,并且还可以被定性、定量和追踪。ctDNA在血液中大概250bp左右,含量少,ctDNA的检测依赖于强大的捕获技术,捕获效率越高检测越准确。

循环肿瘤细胞(CTC)是指从实体瘤中脱离出来并进入外周血液循环的肿瘤细胞。CTC 在临床上具有很大的应用价值:①在早期肿瘤患者中,利用影像学还未发现病灶时已经可以在外周血中检测到CTC,因此CTC可以用于肿瘤的早期诊断。②通过CTC在不同治疗阶段的数目变化,可辅助快速评估手术、放化疗及其他治疗手段的疗效。③用于判断患者是否需要辅助治疗,术后CTC数目大于阈值,建议强化术后辅助化疗;CTC数目小于阈值,建

议采用标准辅助化疗。④CTC数目上升,提示肿瘤进展,转移复发风险增大;反之CTC数目下降,提示肿瘤缓解,转移复发风险降低。CTC应用的典型是益善生物(新三板公司)。

4.4 数据的积累和分析很重要,决定竞争层次

当前基因检测有个明显的问题,那就是同一个人在不同的机构进行基因检测可能会得到不同的检测结果(特别是不成熟的非诊断检测项目,例如易感基因、天赋基因检测等),这不是测序结果的差异,主要原因有两方面:①解读这些测序结果时所比对的数据库、文献资料不同所造成。如果基因数据库足够丰富,包含的样本足够多,那么分析结果势必会越准确。

②数据的处理方法存在差异,每个人的基因组都包含海量的数据,对基因数据的提取和运用需要强大的数据模拟分析能力,因此数据分析将也是决定竞争层次的因素之一。

附:测序主要有一代测序(Sanger测序),二代测序(扩增子法和捕获法测序),这几种测序方法的适用情况和成本比较

一、根据对于单个样本所需测序的基因范围分三档

1.1 测序范围<= 100Kb,推荐用Sanger法测序

1.2 500Kb <= 测序范围< 100Kb,推荐用扩增子法测序

1.3 200Kb < 测序范围<= 100Mb,推荐用目标区域捕获测序

二、根据上面的分法,成本比较

1 用传统sanger法测序

1.1 每500bp测一对来回,每个测序20元(PCR + sanger测序);

1.2 每个样本的测序成本:100000/500 * 20 = 4000元/样本;

1.3 数据分析,500元/样本;

1.4 再加一点人工,总成本4500元/样本以内就完成了。

用高通量测序,建库2000元/样本,再加测序的上机费1000~3000元/样本,还有二代测序必须的生物信息分析费,成本上不占优势。高通量测序在此的唯一的优势,是可以在一个试管中完成PCR,减少起始样本(DNA)用量。

2 用扩增子(Amplicon)法测序

2.1 以200Kb,100样本为例;

2.2 引物及PCR,设计多重PCR引物,每个扩增子约150Bp的长度,总120000元,分摊到每样本,1200元;

2.3 PCR反应,成本20元/样本;

2.4 建库,2000元/样本;

2.5 测序:

a. Miseq平台,5G数据/run,26500元/run;

b. 如果一次跑一个run,测24个样本,每个样本的测序部分的成本:26500/24=1104元/样本;

c. 如果一次跑超过24个样本,测序成本可以进一步分摊。

2.6 数据分析,大约500元/样本;

2.7 总成本:引物成本+扩增+建库+测序+数据分析=1200 + 20 + 2000 + 1104 + 500 = 4824元。

扩增子测序前一步要做多重PCR,到目前为止,多重PCR扩增效率的一致性一直是大难题。扩增子越多,不均一性越高。这使用大于500Kb的范围的测序,很难用扩增子测序的方法做好。

3 目标区域捕获法测序,适用范围:100Kb < 测序范围<= 100Mb

3.1 采购捕获试剂盒

a. Nimblegen的SeqCap EZ Choice Library, 96 Reaction,USD30000

b. 折合含25%税的每反应人民价格:30000*6.2*1.25/96=2421元/反应

3.2 建库,捕获反应

a. 建库,2000元/样本

b. 捕获操作,3000元/样本

3.3 测序,Hiseq 2500 Rapid PE150测序(临床样本追求速度,Rapid快,只用2天测序,比Hiseq 2000 high throughput PE100 的11天更合适)

a. 每个Flowcell,75G PF data;

b. 一次每个样本测2G PF data;

c. 一个Flowcell,24个样本,因为样本之间在测序过程中的相互竞争,所以上样按每个样本3G上样,这样可以保证大部的样本可以得到2G(24*3=72G)以上的数据;

d. 测序深度,假设捕获区间为7M,捕获的效率为65%(有35%为非特异的片段),2,000,000,000 * 0.65 / 7,000,000 = 185倍,符合绝大多数的检测需求;

e. 测序成本,每个Hiseq 2500 rapid PE100 flowcell,8万元,分摊到24个样本,80000/24=3333元/样本

3.4 数据分析,假设:2000元/样本

3.5 总成本=捕获试剂+ 建库+ 捕获操作+ 测序+ 数据分析= 2421 + 2000 + 3000 + 3333 + 2000 = 12754元/样本

因为片段很长,如果用扩增子测序,其测序所需的多重PCR的中的扩增子过多,所以不可行,并且Miseq或PGM的数据产量也不能很好地覆盖被测样本。

三、所用时间比较

1 sanger法,如果同步进行,10Kb以内的范围,可以在1-2天内完成。

2 扩增子法,PCR用0.5天,建库2-3天,测序1-2天,数据分析2-3天,最快1周出结果。

3 捕获法,建库2-3天,捕获2-3天(杂交反应,必须慢,没法更快),测序2-3天,数据分析2-10天,最快10天出结果。

相关主题
文本预览
相关文档 最新文档