当前位置:文档之家› 烟草ESTs资源的SSR信息分析

烟草ESTs资源的SSR信息分析

#研究报告#

生物技术通报

BI OTEC HNOLOG Y BULLETI N

2009年第7期

烟草ESTs 资源的SS R 信息分析

胡重怡 蔡刘体 陈兴江

(贵州省烟草科学研究所,贵阳550003)

摘 要: 烟草EST s 数量迅速增加为开发新的SSR 标记提供了宝贵的资源。经过软件分析,对242683条烟草ES T s 序列剔除冗余序列,在211728条非冗余烟草EST s 序列中,共检索出9339个SSR,SSR 之间的距离约为14121kb ,检出率为4141%,包括216种重复基元。其中三核苷酸重复类型的SSR 占主导地位,占总SSR 的50134%,其次为二核苷酸和单核苷酸,分别为23100%,16148%,其余重复类型所占比例均不足5%。在所有重复基元中,A /T 重复为主要类型,占所有重复14168%,其次为AT /TA 、AG /TC 、AAG /TTC ,分别为10149%、9148%、6185%。随机设计10对EST-SSR 引物,对6个品种烟草进行扩增,10对EST-SSR 引物均能扩增出产物,其中1对引物在6个品种有多态性。本研究为烟草ES T-SS R 标记的建立和进一步应用奠定了基础。

关键词: 烟草 EST-SSR 重复基元

Analysis of SS R Infor m ati on i n ESTs Resource of

Tobacco (N icoti ana tabac u m )

Hu Zhongy i Cai L i uti Chen X i ng ji ang

(T obacco Science Resource Instit u t e of Gui zhou Province ,Gui yang 550003)

Abstrac:t

In th i s research ,242683expressed sequence tags (ES T s)were ana l yzed by soft ware ,i ndicati ng t hat 9339SSR w ere

found i n 211728non -redundant tobacco EST s ,and the average d i stance be t w een SSR w as approx i m ate l y 14121kb ,accoun ti ng f o r 4141%of EST s ,i nc l ud i ng 216k i nds of repeat mo tifs w ere m ined out 1T ri m er i c repea ts ,accounti ng for 50134%,w as dom i nant i n all SSR,fo llo w ed by di m er i c and mono -m er ic repeats ,23100%and 16148%,wh ile the frequency fo r other repeat type w as be l ow 5%each 1T he m ost abundan tm o tif was A /T,accoun ting fo r 14168%i n all repea t types ,fo llo w ed by AT /TA,AG /T C ,AAG /TTC ,ac -counti ng f o r 10149%,9148%,6185%,

respecti ve ly 110pa irs o f pr i m ers for ES T-SSR random ly designed w ere subjected to PCR f o r

DNA s fro m s i x t obacco var i e ties and one pair o f pr i m e rs showed poly m orph i s m s 1T he result prov i ded a base fo r the deve l op m ent and ap -p licati on of EST-SSR m arkers in tobacco 1

K ey words : T obacco EST-SSR M o tif

收稿日期:2009-03-13

基金项目:贵州省烟草专卖局项目(黔烟科2007-03)作者简介:胡重怡(1982-),女,硕士,研究方向:分子生物学;E-m ai:l rebeccahu0801@1261co m 通讯作者:蔡刘体(1974-),男,博士,研究方向:分子生物学;E-m ai:l caili uti 01@1631co m

烟草是重要的经济作物。目前,世界上已有多个实验室以DNA 多态性为基础的分子标记的开发和应用,为烟草遗传图谱构建、品种纯度检测、遗传

多态性分析、分子标记辅助选择育种和基因定位等研究提供了发展机遇

[1~7]

。然而由于对烟草全基因

组序列知之甚少,目前应用于烟草遗传育种研究上

的分子标记还主要局限于随机扩增长度多态性(rando m a m plified poly m orphic DNA,RAPD )和扩增

片段长度多态性(a m plifi e d frag m ent leng th poly m or -ph ic ,AFLP )。但这两种标记手段都各有欠缺:RAPD 技术简单,费用低,但RAPD 是显性标记,可

重复性不高,需要大量引物;AFLP 标记多态性高,结果稳定可靠,但需要经过酶切和连接的过程,技术难度和费用也相对较高。

在众多分子标记类型中,SSR (si m ple sequence repeat)分子标记以多态性高、共显性、重复性好、操

2009年第7期胡重怡等:烟草EST s资源的SSR信息分析

作简单、易检测、数量丰富和对基因组覆盖范围广等特点,从实用性和有效性均优越于其他标记类型而广泛应用于各类作物上[8]。近年来,许多作物大规模的c DNA单边测序并在网上公开释放,使得基于ESTs(expressed sequence tags)的SSR标记开发能力大大增强,并且由于可以直接获得基因表达的信息,节省了SSR引物开发过程中的克隆和测序步骤,减低了引物开发成本。自2000年起,已相继在葡萄[9]、甘蔗[10]、硬粒小麦[11]、黑麦[12]、大麦[13]、小麦[14]和马铃薯[15]等作物开展了EST-SSR标记的开发并广泛用于基因组研究和分子育种。截止到2008年9月,烟草公布的ESTs序列已有242683条,烟草ESTs序列以爆炸速度递增。

本研究对已有烟草ESTs中SSR信息进行了全面的分析,并建立烟草EST-SSR体系,以期更多的了解烟草ESTs资源的特性,并为利用烟草ESTs建立SSR标记和探索其在烟草遗传育种中的应用奠定基础。

1材料与方法

111烟草ESTs序列的来源

截止2008年9月2日,在G enB ank(http:// www.ncb.i nl https://www.doczj.com/doc/d87749144.html,/dbEST/dbEST_summ ar y.h-t m l)中释放有烟草ESTs共242683条,以FASTA格式下载这些序列。

112烟草EST-SSR开发

采用EST-tri m m er软件(http://pgrc.ipk-gater-sle ben.de)除去5c端或3c端的poly T或po l y A,并剔除长度小于100bp的ESTs序列。通过软件采用C lastal X1181(https://www.doczj.com/doc/d87749144.html,/So ft/Se-quences/li g nm ent/200409/0.ht m l)、Treev ie w(ver 1161)(http://www.taxono m y.zoo-l ogy.g la.ac.nkr od/ od.ht m l和Genedoc(ver216102)(http://www.psc. edu/bio m ed/genedoc/gdd.l ht m)软件对242683条ESTs序列进行冗余性查找。剔除冗余序列,然后利用在线软件SSR I T(http://arsgeno m e.corne l.l edu/ cg i b i n/rice/ssrtoo.l pl)在非冗余序列中查找SSR。利用该软件查找了二、三、四、五、六核苷酸5种类型的SSR,利用TRF(tande m repeats finder,http://tan-de https://www.doczj.com/doc/d87749144.html,/trf/tr.f ht m l)查找单核苷酸类型的SSR。SSR的查找标准:单核苷酸重复\25bp,二核苷酸重复\14bp,三核苷酸重复\15bp,四核苷酸重复\16 bp,五核苷酸重复\20bp,六核苷酸重复\24bp。113烟草EST-SSR的引物开发

随机抽取12条包含有SSR的ESTs序列,利用Pri m er310(http://frodo1w i1m it1edu/cg-i bin/pri m er3/ pri m er3_www1cgi)进行引物设计,共设计了10对EST-SSR引物。引物设计的主要参数是:引物长18~ 20bp,最适为20bp;PCR产物长100~250bp;最适Tm值为57e;GC含量为35%~65%,最适50%。引物合成由上海生工生物工程技术服务有限公司完成。114DNA提取、SSR扩增和电泳

本研究用了6个烟草品种:红花大金元、云烟85、K326、NC82、心叶烟、N icotiana t a bacum L.xan-thin。用Q I A GE N公司DN easy PlantM i n iK it试剂盒提取DNA。EST-SSR扩增条件:94e5m in;94e30 s,53e40s,72e40s,35个循环;72e10m i n。PCR产物在8%的聚丙烯胺凝胶垂直电泳中进行电泳分离,在25e,120V恒压下电泳210h,通过银染法显影[16]。

2结果与分析

211烟草ESTs的SSR出现频率

用EST-tri m m er、C lastal X1181、Treev ie w和Genedoc软件对242683条EST s序列比较分析,剔除冗余的序列,得到211728条非冗余ESTs序列, SSR I T查找获得9339条EST-SSR,分布于8764条ESTs序列中,出现SSRs的频率是4141%。在211 728条烟草非冗余ESTs序列中,拼接总长度为132 744127kb,平均相隔14121kb就出现一个SSR。各重复类型出现频率见表1。

表1烟草E ST s序列SSR出现的频率类型数目类型的比例(%)频率(%)平均距离(kb)单核苷酸153916148017386125

二核苷酸214823100110161180

三核苷酸470150134212228124

四核苷酸44441750121298197

五核苷酸21421290110620130

六核苷酸29331140114453105总计9339100414114121

212烟草EST-SSR的分布特征

9339个SSR中共有216种重复基元(m otif)。

83

生物技术通报B iotechnology Bulletin2009年第7期

根据W eber[17]的分类标准可将9339个EST-SSR分成精密型(perfect)、非精密型(i m perfect)和复合型(compound)3种类型,其中精密型SSR有8867个(94195%),非精密型SSR有306个(3128%),复合型SSR有166个(1178%)。在精密型SSR中,三核苷酸重复基元类型的SSR出现频率最多,而在非精密性SSR中,以二核苷酸重复基元类型的SSR出现频率最多。在精密型和非精密型SSR中,单、二、三、四、五和六碱基重复基元中出现频率最多的重复基元分别是(A/T)n,(AT/TA)n,(AAG/TTC)n, (AGAA/TCTT)n,(AAAAT/TTTTA)n和(AAAAAT/ TTTTTA)n。它们在各自重复基元类型中的比例分别是89121%,38103%,11135%,6131%,4167%和4144%。在所有类型的重复基元中,三核苷酸重复基元出现的频率最高为50134%,其次分别为二、单、四、六和五核苷酸重复基元。

在复合型SSR中,至少每一串联重复基元的长度大于10bp。根据串联重复基元的不同长度把SSR分成11种类型,即m1B2-2(两核苷酸和两核苷酸重复基元串联,依此类推),m2B2-3,m3B3-3, m4B4-2,m5B5-2,m6B3-4,m7B6-3,m8B4-4,m9B1-2,m10B6-6和m11B5-4。在烟草中出现频率最高的是m3,即在复合型SSR中出现频率最高的是三核苷酸串联三核苷酸的SSR,有88个复合型SSR 是m3型,频率为53101%;其次是m1型,有60个复合型SSR为m1型,频率为39176%。

在检测到的216种SSR重复基元中,所占比例最高的是A/T(14168%),其次分别是AT/TA (10149%)、AG/TC(9148%)、AAG/TTC(6185%)等。不同类型重复基元的EST-SSR分布见图1

11A/T;21AT/TA;31AG/TC;41AAG/TTC;51AGA/TCT;61CTT/GAA;71C/G;81CA/GT;91AC/TG;

101AAC/TTG;111CTG/GAC;121CAA/GTT;131AAT/TTA;141频率小于2100%的重复基元类型

图1基于重复基元类型的E ST-SSR分布

213烟草EST-SSR标记的多态性

利用随机抽取包含SSR的ESTs序列,设计10

对引物(表2),对不同烟草品种进行多态性筛选,10

对EST-SSR引物均能扩增出目标条带(图2),其中

有1对引物在不同烟草品种中扩增出多态性(图

3)。

表210对烟草EST-SSR引物信息

引物编号重复基元来源EST编号产物大小(bp)引物序列(5c y3c)

ES01(cccagt)4123225916203CATGAGGTGCAGCAGTCTACGCGTCTGTAAGCCCTGTATT

ES02(ct)19123225877194AGCTTCATTTTGCTGCTTCTGGCTTGGACCTGAGTTCTTA

ES03(ga)16123225720188CCACTAGGGTTAAGCTTCCACAGGATTCATAGCAACACCA

ES04(aca)5123225563215ACGACGACAACAACAACAACGACATTAGTGGAGGGTCAGG

ES05(aagag)594325445195CACCATACCAGAGGGTTTTCGCCTCCTGTCAAGACAAAGT

ES06(gtatt)5123225429174TGCAGCAAATGTCCTAAATGGCCTCCTGTCAAGACAAAGT

ES07(tc)13+(ca)1594325043226CACACACACACACACAGAGCGCTTCGCGTGAAGATAGAAT

ES08(tcgcag)594324527199ACAATGCTGCTGATGAGAAATTGCTGAAGTTTGTTCCAGA

ES09(tccaac)7123225111189AACAGAAGTGTTCCGGTAGCAGTTGGAGTTGGAAGAGTCG

84

2009年第7期

胡重怡等:烟草EST s 资源的SSR

信息分析

11DL2000M arker ;21红花大金元;31云烟85;41K326;51NC82;61心叶烟;71L 1xan t h i n

图2 引物E S01

扩增的条带

11DL2000M aker ;21红花大金元;31云烟85;41K326;51NC82;61心叶烟;71L 1xan t h i n

图3 引物ES06在不同品种中的多态性

3 讨论

M organte 等

[18]

研究指出,植物基因组中SSR 出

现的频率与该物种基因组大小和重复DNA 序列所

占的比例成负相关,而与基因组中转录部分的比例和低拷贝序列出现的频率成显著正相关。一般来说SSR 出现频率是通过搜索数据库序列估计得出,但是不同学者搜索的标准(如SSR 重复类型,长度等)、分析方法不尽相同、分析数据多少不一,因此

各自的结果有很大的不同。按照Cardle [19]

的统计标准,在拟南芥的EST 序列中,平均每1318kb 出现1个SSR,水稻中则为每314kb 出现1个。而M or -gante 等

[18]

将EST-SSR 的统计标准定为1~5碱基

重复至少3次,总长度为12个碱基,结果显示,在拟南芥中每211kb 就出现一个SSR 。Gao 等

[20]

将不

同重复基元的总长度定为18bp 以上,得出水稻中每11181kb 出现1个SSR 的结果。不同研究结果的差异主要归因于发掘EST-SSR 时所采用的标准不一样。2007年张俊娥针对当时公布的133523条烟草ESTs 数据,通过M I SA 软件进行分析,用M or -gante 的方法[18]

,以重复基元总长度定为12bp 以上,共获得81757条SSR 序列,SSR 出现频率高达61109%,每0192kb 出现1个SSR [23]

。在本研究

中,主要采用了改进的Cardle 分类标准[19]

,与Car -dle 等人的分类标准相比,提高搜索单、四、五、六核苷酸重复基元重复次数的标准,结果显示在烟草中每14121kb 的ESTs 出现1个SSR,频率为4141%,所获得的SSR 位点更具有实用性。

虽然在不同作物的EST-SSR 序列分布特征研究中,不同学者搜索SSR 采用的标准不同。但对大部分植物的EST -SSR 序列综合调查,均表明重复基元为三核苷酸的EST -SSR 出现频率最高[19,20]

,其次

为二核苷酸重复类型

[21,22]

,本研究也表明在烟草

里,以三核苷酸出现频率最高,达到50134%,其次

为二核苷酸和单核苷酸,分别为23100%、16148%,与张俊娥得出的六核苷酸重复类型最高有所偏差,原因可能是所用分析软件和重复次数参数的设定不

同而导致的[23]

。在拟南芥ESTs 中,AAG /TTC 重复

基元在三核苷酸重复中所占比例最大,为45%[19]

。而在大麦、玉米、高粱、水稻、小麦和黑麦中则以CCG /GGC 重复基元最丰富,ATT /TAA 重复基元最少[13,21,24]。在本研究中三核苷酸重复基元出现频

率最多依次是AAG /TTC 、AC A /TCT 和C TT /C AA,ATT /TAA 也为最少,估计TAA 编码终止子会影响烟草蛋白合成。在小麦、水稻、玉米、大豆中二核苷

酸重复基元出现频率最多的是AG /TC [13,21,24]

,而本研究中二核苷酸重复以AT /TA 和AG /TC 两种重复基元为主,两种重复基元所占比例相差不大。

烟草作为模式作物,在分子标记发展上却远落后于其他作物。从ESTs 数据库中开发SSR 标记,成本相对较低,并且EST -SSR 标记理论上可为功能基因提供/绝对0的标记,直接用于功能基因的研究。现阶段烟草ESTs 数量迅猛增加,为EST -SSR 标记的开发提供了信息,EST-SSR 标记可有效应用于烟草遗传作图、资源多样性、功能基因等育种研究。

(下转第93页)

85

2009年第7期马月萍等:高盐沉淀C TAB法提取温室菊花基因组DNA

液均无色或略带黄色。而对于多酚含量不高的植物,可用维生素C替代B-M e。

参考文献

1M a YP,Fang XH,Chen F,et al1P l ant C ellRep,2008,27(4): 647~6541

2Jai m e A1B i otechno l ogy Advan ces,2003,21:715~7661

3W angW K,Dai SL,L iM X1C ell u l ar&M olecu l ar B i ol ogy Letters, 2002,(7):911~9141

4W ang W K,L i MX,Xu YX,D ai SL1Forestry S t udy i n Ch i na,

2003,5(2):30~341

5Dai SL,W ang W K,LiM X1Journa l of Integrati ve Plant B i o l ogy1 2005,47(7):783~7911

6李辛雷,陈发棣1植物学通报,2004,(21)4:392~4011

7戴思兰,陈俊愉,高荣孚,等1园艺学报,1996,23(2):169~1741 8蒋细旺,包满珠,李智崎,等1江汉大学学报(自然科学版), 2002,19(3):42~441

9Doyle JJ,Doy l e J L1Phytoc h e m ical Bu ll eti n,1987,19:11~151 10彭锐,宋洪元,李泉森,等1中国中药杂志,2003,12:1129~11311 11张海泉1现代农业科技,2006,(13):82~841

(上接第85页)

致谢:本研究部分工作在贵州大学贵州省农业生物工程重点实验室完成,在此表示感谢。

参考文献

1汪安云,肖炳光,等1中国烟草学报,2000,(4):7~111

2王志德,牟建民,等1中国烟草学报,2003,(4):20~251

3N is h iT,Taji m a T,et al1Theor Appl Genet,2003,(4):765~701 4郭生云,何川生,等1海南师范学院学报,2001,(2):10~131

5何川生,何兴金,等1植物学报,2001,6:610~6141

6胡重怡,蔡刘体,等1安徽农业科学,2007,5(25):7871~ 7872,79111

7杨本超,肖炳光,等1遗传,2005,27(5):753~7581

8Po w ellW,M achray GC,et al1T rends P l ant Sci ence,1996,1:215~2221 9Scott KD,E gg l er P,et a l1Theor App lGen et,2000,100:723~7261 10C ord ei ro G M,Casu R,et al1Plant Sc,i2001,160:1115~1123111Eu j ayl I,Sorrells M E,et al1Theor App lGenet,2002,104:399~4071 12H ackauf B,W eh ling P1Plant B reed,2002,121:17~251

13Th i el T,M ichalek W,et a l1Theor App l Genet,2003,106:411 ~4221

14Peng J H,N ore L,et al1Geno m i cs,2005,5:80~961

15Fei ngo l d S,L l oyd J,et al1Theor App lGenet,2005,111:456~4661 16张志峰,史洪才,等1生物技术,2005,15(3):51~531

17W eb er J L1Genom ics,1990,7:524~5301

18M organte M,H anafey M,et al1Nat Genet,2002,30:194~2001

19Card l e L,Rat n s ay L,et al1Geneti cs,2000,156:847~8541

20G ao LF,Tang J F,et a l1M olB reed,2003,12:245~2611

21K antet y RV,L a Rot a M,et al1Plant M ol B i o,l2002,48(5~6): 501~5101

22Kota R,Varshn ey RK,et al1H ered i tas,2001,135(2~3):145~1511 23张俊娥,李芬,等1武汉植物学研究,2007,25(5):427~4311

24Ch i n ECL1Geno m e,1996,39:866~8731

中国典型半荒漠与荒漠区啮齿动物研究

武晓东付和平杨泽龙著

978-7-03-023280-9á88.002009年6月出版

本书对我国典型半荒漠与荒漠生态系统中啮齿动物分类、啮齿动物地理分布、啮齿动物种群、群落及其在不同干扰和尺度下的生态学、啮齿动物的危害与防治理论进行了系统的研究。研究方法方面,在传统的动物分类学、动物地理学和动物种群和群落生态学的基础上,融合了景观生态学、恢复生态学、干扰生态学、保护生物学、遥感和地理信息系统等多个新兴学科门类的基本原理和方法,着重强调在大尺度下对生态科学问题的综合思考。分析方法方面,既有传统线性方法,也应用了分形分析、小波分析等非线性方法。

本书可供从事草业科学、动物生态学、野生动物管理学、保护生物学、植物保护学等专业领域的研究、教学、生产部门的科技人员和相关专业的研究生参考。

欢迎各界人士邮购科学出版社各类图书(免邮费)

邮购地址:北京东黄城根北街16号科学出版社科学出版中心生命科学分社

邮编:100717联系人:周文宇李韶文联系电话:010-********,64000849

更多精彩图书请登陆网站https://www.doczj.com/doc/d87749144.html,,欢迎致电索要书目

93

相关主题
文本预览
相关文档 最新文档