当前位置:文档之家› 叶绿体系统发育基因组学的研究进展

叶绿体系统发育基因组学的研究进展

叶绿体系统发育基因组学的研究进展
叶绿体系统发育基因组学的研究进展

叶绿体系统发育基因组学的研究进展*

张韵洁,李德铢**

(中国科学院昆明植物研究所生物多样性与生物地理学重点实验室,云南昆明650201)

摘要:系统发育基因组学是由系统发育研究和基因组学相结合产生的一门崭新的交叉学科。近年来,在植物系统发育研究中,基于叶绿体基因组的系统发育基因组学研究优势渐显端倪,为一些分类困难类群的系统学问题提出了解决方案,但同时也存在某些问题。本文结合近年来叶绿体系统发育基因组学研究中的一些典型实例,讨论了叶绿体系统发育基因组学在植物系统关系重建中的价值和应用前景,并针对其存在问题进行了探讨,其中也涉及了新一代测序技术对叶绿体系统发育基因组学的影响。

关键词:系统发育基因组学;叶绿体基因组;新一代测序技术;长枝吸引

中图分类号:Q75,Q949文献标识码:A文章编号:2095-0845(2011)04-365-11 Advances in Phylogenomics Based on Complete Chloroplast Genomes

ZHANG Yun-Jie,LI De-Zhu**

(Key Laboratory of Biodiversity and Biogeography,Kunming Institute of Botany,Chinese Academy of Sciences,Kunming650201,China)

Abstract:Phylogenomics is a new synthesized discipline which combines genomics with phylogenetics.Phylogenom-ics based on chloroplast genomes has shown many great advantages in plant phylogenetic research in recent years,providing resolutions for phylogeny of some taxonomically difficult groups of plants.However,there are some prob-lems coming along with chloroplast phylogenomics as well.In this review,the application prospects and potential problems of chloroplast phylogenomics in plant phylogenetic reconstruction were discussed based on recent phylog-enomic case studies.The influence of next-generation sequencing on chloroplast phylogenomics was also discussed.Key words:Phylogenomics;Chloroplast genome;Next-generation sequencing;Long-branch attraction

地球上的生命形式多种多样,它们因有着共同的进化历史而有着或近或远的渊源。正确理解不同生物类群之间的关系不仅是进化生物学研究的前提,生物分类和命名的依据,而且也是开展生物学其它分支学科研究的基础。因而构建可靠的系统发育树(即将各生物类群之间的关系形象地以树的形式描绘出来)不仅是系统发育研究的重点,也是生物学研究的重要内容之一。早期系统发育学家通过对化石记录、比较形态学和比较生理学的研究,构建出了物种进化历史的主要框架(Nei和Kumar,2000)。20世纪80年代以后,随着分子生物学的快速发展,系统发育研究开始由比较形态学转向分子系统学研究领域,即利用生物大分子(如DNA序列、氨基酸序列等)所提供的信息来推断生物的进化历史(Li和Olmstead,1997;Nei和Kumar,2000;田欣和李德铢,2002)。分子系统学研究的出现使我们对生命进化过程有了更深刻的认识。然而随着分子证据的不断积累,基于不同分子片段对同一类群所进行的分子系统学研究结果之间存在的差异,

植物分类与资源学报2011,33(4):365 375

Plant Diversity and Resources DOI:10.3724/SP.J.1143.2011.10202

***基金项目:中国科学院现代农业科技创新基地重要方向性项目“重要野生禾本科植物的比较基因组学和重要功能基因的研究(KSCX2-YW-N-029)”

通讯作者:Author for correspondence;E-mail:dzl@mail.kib.ac.cn

收稿日期:2010-11-15,2010-12-01接受发表

作者简介:张韵洁(1984-)女,在读硕士研究生,主要从事植物系统发育基因组学研究。

也使人们逐渐认识到基因树虽然在一定程度能反映物种的进化历史,却不能等同于物种树(de Queiroz等,1995;Wendel和Doyle,1998)。因此,越来越多的学者试图将来自不同基因组(如核基因组、线粒体基因组或叶绿体基因组)和具有不同功能的分子片段相结合,或与形态学性状联合起来进行分析。虽然研究方法有所不同,但系统发育学家所做的努力最终目的只有一个,即构建能反映物种真实进化关系的可靠的系统发育树。

随着测序技术的日益完善,越来越多的基因组序列得到解析,系统发育研究进入了一个崭新的时代———系统发育基因组学时代。系统发育基因组学是进化生物学领域里由系统发育学和基因组学结合形成的一门崭新的交叉学科(Eisen,1998;Eisen和Hanawalt,1999)。系统发育基因组学的研究是围绕着系统发育学和基因组学展开的,主要研究内容包括在基因组水平上用大规模的分子数据研究生物之间的系统发育关系以及利用进化关系反过来研究基因组的进化机制(如DNA修复过程,未知基因的功能注释等)(Eisen,1998;Eisen和Hanawalt,1999;Delsuc等,2005)。

在植物中由于核基因组的复杂性使得单拷贝(或低拷贝)基因的筛选比较困难,而对植物核基因组的测序工作目前仅局限在基因组相对较小的模式物种或具有重要经济或生态价值的物种中,如拟南芥、水稻、高粱、黄瓜等,因此基于大规模核基因的植物系统发育基因组学的发展相对滞后。而植物线粒体基因组具有的很多特性使其在系统发育研究中的应用受到了限制,如线粒体基因组大小在各植物类群中变异很大(大多数被子植物线粒体基因组大小在300 600kb),且基因组中存在很多由基因组之间水平转移造成的外源基因插入(Palmer,1992);线粒体基因组进化速率较慢,其核苷酸替换率比叶绿体基因组慢4倍,但在其基因组中却广泛存在分子内重组(intramolecular recombination)现象(Palmer和Herbon,1988;Lonsdale等,1988)。因此,在植物中,线粒体基因组一般情况下不是系统发育基因组学研究的理想资源。植物叶绿体基因组序列具有很多优点,使之被广泛应用于分子进化及系统发育研究。首先,叶绿体基因组包含大量的遗传信息,础。其次,叶绿体DNA的核苷酸置换率适中,在应用上很有价值。叶绿体基因组的编码区和非编码区的分子进化速度差异显著,分别适用于不同阶层的系统学研究(Clegg等,1994)。除此以外,叶绿体基因组大小适中,便于测序,且各植物类群叶绿体基因组之间具有良好的共线性,便于比较分析。因此,近年来基于叶绿体基因组的系统发育基因组学得到了较快的发展。到2010年10月为止,在NCBI数据库中收录的叶绿体基因组已达146个,其中19个为藻类,其余均为陆生植物,为系统发育研究提供了大量可用的数据。本文拟结合研究中的具体例子,探讨叶绿体系统发育基因组学在植物系统发育重建中的应用价值、存在的优势和问题以及新一代测序技术对叶绿体系统发育基因组学发展的促进作用。

1叶绿体基因组的结构与功能

叶绿体是与光合作用直接相关的细胞器,其基因组的功能也跟光合作用密不可分,一般认为叶绿体是由蓝细菌通过内共生起源的。叶绿体作为植物细胞中一个独立的细胞器,拥有自己的一套完整的基因组。它在在裸子植物中一般为父系遗传,而在被子植物中多为母系遗传。双亲遗传的现象较为罕见,在被子植物中约占14%(Cor-riveau和Coleman,1988)。叶绿体基因组一般为共价闭合环状DNA,在细胞中以多拷贝的形式存在,高等植物的叶绿体基因组具有高度保守的四分体结构(Jansen等,2005),即由两个反向重复序列(inverted repeat sequence,IR)将整个环状的叶绿体基因组分为大单拷贝区(large sin-gle copy,LSC)和小单拷贝区(small single copy,SSC)。也有少数植物如豆科的地三叶草(Trifoli-um subterraneum)、蒺藜苜蓿(Medicago truncatu-la)和鹰嘴豆(Cicer arietinum)因一个反向重复区完全丢失而具有特殊的叶绿体基因组结构(Cai等,2008)。叶绿体基因组大小一般在115 165kb范围内,基因组大小变异主要受反向重复区长度变异影响。叶绿体中绝大多数蛋白复合体是由核基因组和叶绿体基因组共同编码的。叶绿体基因组约编码110 130个基因,这些基因主要可分为三大类:第一类是那些涉及叶绿体基因表达的基因,包括编码叶绿体RNA聚合酶三

663植物分类与资源学报第33卷

个亚基、核糖体RNA、转运RNA、核蛋白体蛋白及翻译起始蛋白等产物的基因;第二类基因是那些与光合作用有关的基因,如Rubisco大亚基基因,光合电子传递链中各蛋白复合体(PSⅠ,PSⅡ,细胞色素复合体,ATP合成酶)的几个亚基基因等;第三类包括据推测为NADH脱氢酶各个亚基的基因和开放阅读框架,它们的功能目前尚待查明。陆生植物的叶绿体基因组在基因数目及基因排列顺序上相对保守,但一些类群的叶绿体基因组也具有其独特的特征,使其与其它植物区分开来。如松属植物叶绿体基因组的ndh基因家族全部丢失(Wakasugi等,1994),而列当科寄生植物Epifagus virginiana的叶绿体基因组仅包含42个基因,丢失了与光合作用和叶绿体呼吸作用有关的所有基因以及叶绿体编码的RNA聚合酶基因(Wolfe等,1992)。

2叶绿体基因组在植物系统发育研究中的应用及优势

系统发育基因组学中所涉及的研究方法主要包括:(1)基于序列分析的方法,该方法与传统分子系统学研究方法一致,因而被广泛应用。(2)基于非序列的分析方法,主要包括全基因组特征分析(whole-genome features,WGFs),即对基因组成成分,基因排列顺序及寡核苷酸串在基因组中排布方式等的分析;稀有基因组变异(Rare genomic changes,RGCs),如插入缺失,内含子的有无,转座子插入,基因的融合和断裂等事件,这些稀有基因组变异可用于一些节点的支持,也可根据他们的有无构建系统树(Delsuc 等,2005;于黎和张亚平,2006)。叶绿体系统发育基因组学属于系统发育基因组学的范畴,因此它的研究方法同系统发育基因组学研究方法一致。2.1非序列分析方法

藻类植物的叶绿体基因组常发生基因组重排、基因含量和结构等变化,因此非序列分析方法多用于藻类植物的叶绿体系统发育基因组学研究。如利用基因组结构、基因含量及基因排列顺序推断原始绿藻Mesostigma viride和轮藻类的Chlorokybus atmophyticus在绿色植物界(Viri-diplantae)的系统位置(Lemieux等,2007)或是在整个植物界中的进化过程(Nozaki等,2003)。而陆生植物叶绿体基因组结构、基因含量和基因排列顺序相对保守,因此在陆生植物的叶绿体系统发育基因组学研究中,全基因组特征和稀有基因组变异两种分析方法的应用相对较少,目前仅局限在叶绿体基因组经历了大规模重排的类群中。例如早期的研究表明桔梗科中一些植物的叶绿体基因组与烟草(茄科)基因组相比经历了大量的基因重排(Cosner等,1997;Knox等,1993,1999)。基于此,Cosner等(2004)通过对桔梗科18个种叶绿体基因组的基因排列顺序进行分析,并以此构建系统树,从一个全新的角度阐述了桔梗科内部18个属间的系统发育关系。

虽然以上非序列分析方法的单独使用受到了一定程度的限制,但一般认为全基因组特征和稀有基因组改变较少受到平行演化和回复突变的影响,并且这种非序列分析方法受序列比对算法的内在影响较小,因此可与分子序列数据结合起来进行分析。从基因组特征和稀有基因组变异的角度挖掘基因组中的有用信息,可用于对基于序列分析的研究结果进行验证,或是用以确定某些争议类群的系统学位置。如Pombert等(2005)基于叶绿体基因组58个蛋白质编码基因的核苷酸序列和氨基酸序列对绿藻门中绿色鞭毛纲(Pra-sinophyceae)、石莼纲(Ulvophyceae)、共球藻纲(Trebouxiophyceae)及绿藻纲(Chlorophyceae)之间的系统发育关系进行研究,结果产生了具有两种不同拓扑结构的系统发育树,一种支持石莼纲和共球藻纲为姊妹关系,另一种支持石莼纲和绿藻纲为姊妹关系,而通过对叶绿体基因组中的基因排列顺序、基因丢失的情况及基因组重排断裂点进行分析,认为后一种系统发育关系更为合理。基因组特征和稀有基因组变异是叶绿体基因组中的宝贵资源,对正确理解物种之间的关系有着不可忽视的作用,但目前在叶绿体系统发育基因组学中,没有一套统一成熟的非序列分析方法。虽然也有少数基于非序列分析的方法学报道(Cosner 等,2000;Chu等,2004;Yu等,2005),但这些方法的有效性有待于在实践中进行进一步考证。2.2序列分析方法

基于序列分析的方法与传统的分子系统学研究方法一致,因而在叶绿体系统发育基因组学中

763

4期张韵洁和李德铢:叶绿体系统发育基因组学的研究进展

应用较为广泛。受数据获得较为困难的限制,叶绿体系统发育基因组学多用于较高阶元的系统学研究。最初多通过对某个或少数几个系统学位置具有争议的关键类群的叶绿体基因组进行测序,并结合数据库中已有的叶绿体基因组数据,用以研究这些类群在植物界中的系统学位置。例如葡萄科在被子植物中的系统学位置一直存在争议,基于一个或多个分子片段所进行的系统发育研究结果非常不一致,且支持率均较低(Savolainen 等,2000;Chase等,1993;Hilu等,2003)。Jan-son等(2006)对葡萄(Vitis vinifera)全叶绿体基因组进行测序,结合数据库中已有的26种被子植物叶绿体基因组序列进行系统发育研究,结果强烈支持葡萄科为其余蔷薇分支(rosids)植物的姊妹群。

随着叶绿体基因组数据的不断累积,使得分类学家可以利用大量叶绿体基因组对整个被子植物的系统发育关系进行重建,这些研究结果也使得被子植物系统发育的基本框架逐渐清晰。例如在被子植物中,虽然以Amborella、Nymphaeales 和Austrobaileyales为核心的“ANITA阶”(ANI-TA grade)构成被子植物基部分支这一观点已形成共识,但究竟哪一个类群才是被子植物最基部的类群一直存在争议(Barkman等,2000;Leebens-Mack等,2005;Qiu等,2005)。Jansen 等(2007)根据64个叶绿体基因组的81个基因,成功的解决了这一分类学上的争议问题。研究结果强烈支持Amborella为被子植物的最基部类群,随后依次是Nymphaeales和Austrobailey-ales。再如在被子植物中,Pentapetalae分支包含除洋二仙草目(Gunnerales)以外的所有核心真双子叶植物分支。长期以来基于多个基因片段的系统学研究仍然没有解决Pentapetalae分支内部主要分支之间的关系(Soltis等,2003;Burleigh 等,2009),这与Pentapetalae分支内部一些主要分支可能由快速分化形成有关,而这一假说也得到了化石证据的支持(Magallón等,1999;Magallón和Castillo,2009)。Moore等(2010)选取了86个种子植物叶绿体基因组的83个蛋白质编码基因和rRNA基因,对Pentapetalae分支做了比较全面的分析,很好的解决了该分支内部很

。分子数据仍未解决其系统关系的类群,如唇形亚纲(Lamiidae)内部关系,昆栏树目(Trochoden-drales),黄杨目(Buxales)和洋二仙草分支(Gunneridae)之间的关系,作者也指出这些类群可能经历了快速分化的过程。

在较高分类阶元的系统发育基因组学研究中多利用来自叶绿体基因组编码区的信息,而对于较低阶元分类群,如亚科下、属下分类阶元等,叶绿体基因组具有的良好共线性使基于全叶绿体基因组的序列比对成为可能,而非编码区的参与分析为解决低阶元分类群之间的系统关系提供了庞大的数据基础。对于因研究类群之间分子差异较小而使其分子系统发育研究显得较为困难的类群,利用叶绿体系统发育基因组学手段将会是一个较好的解决方案。Parks等(2009)运用新一代测序技术测序了37个松属植物及其近缘种的叶绿体基因组,用以研究松属植物内部的系统学关系。与以往基于多个分子片段的研究结果相比,采用系统发育基因组学的手段,大大提高了松属植物内部分支的分辨率和支持率。这一研究成果首次证实了全叶绿体基因组序列用于低分类阶元系统发育研究的可行性及优势。

禾本科是叶绿体基因组研究比较集中的一个科,但竹亚科,特别是木本竹类的叶绿体基因组研究比较少。木本竹类种类丰富、形态多样、分布广泛,其漫长的开花周期使得收集完整的花序、子房和果实等十分困难,而分子系统学研究结果表明木本竹类的分子变异率较低,能提供的系统发育信息较少,因此无论从形态上还是分子水平上,都被认为是分类学中的一个困难类群。基于以上研究背景,Zhang等(2011)利用新一代测序技术对六种木本竹类的叶绿体全基因组进行了测序,并结合已测序的18个禾本科叶绿体全基因组进行系统发育分析,以此评估叶绿体系统发育基因组学在竹亚科植物系统发育重建中的有效性。研究结果在叶绿体基因组水平上证实了禾本科BEP分支中竹亚科和早熟禾亚科为姊妹关系。与传统的分子系统学研究结果相比(Zeng 等,2010),利用叶绿体全基因组序列所构建的系统发育树在竹亚科内部具有更高的分辨率和支持率。由此可见,对于木本竹类这样一个分子变异率极低的类群来说,利用全叶绿体基因组数据

863植物分类与资源学报第33卷

对其系统发育进行重建是较为有效的,更多木本竹类的叶绿体基因组全序列的测定,将有助于竹亚科植物系统发育关系的重建。相信伴随着测序技术的发展,叶绿体系统发育基因组学在低阶元分类系统中的应用价值将得到更多的体现。2.3叶绿体系统发育基因组学在植物系统发育研究中的优势

从近年来的研究进展中不难看出,叶绿体系统发育基因组学已成为植物进化生物学的重要研究趋势之一。虽然基于核基因组数据的系统发育基因组学在植物系统发育研究中也扮演着重要的角色(Zou等,2008),但目前由于很多植物类群的基因组背景尚不清楚,而核基因组结构较为复杂,对于直系同源(orthology)基因的选择显得较为困难,因此使得基于核基因组的系统发育基因组学在植物的进化研究中受到了很大的限制。而叶绿体系统发育基因组学作为植物系统发育的新型研究手段之一,存在很多优势:(1)叶绿体基因组结构及基因含量较为保守,易于测序,且除了反向重复区外所有基因均为单拷贝,几乎不存在(或很少受)旁系同源(paralogy)基因的干扰。(2)叶绿体基因组中除包含大量的核苷酸和氨基酸序列信息,其基因组特征也可作为系统发育分析的有效资源,对正确理解物种之间的亲缘关系有着巨大的潜在价值。(3)对于一些低分类阶元类群,或由于分子进化速率较慢,分化时间较短的类群,往往因为分子水平的变异较低,能提供的信息位点较少,而成为分类学上的困难类群。而利用叶绿体系统发育基因组学,能提供大量的数据信息,对于这样一些分类困难的类群不失为一种很好的选择。(4)传统的分子系统学往往采用少数几个分子片段和密集取样的策略进行系统学研究,而叶绿体系统发育基因组学作为传统分子系统学的“对立面”(一般采用大规模基因组数据和较少分类群代表),可以从另一个全新的角度对传统分子系统学研究结果(特别是在分辨率低和基于不同片段建立的分子树存在冲突的情况下)进行补充和评估。

3叶绿体系统发育基因组学存在的问题基于分子序列推断系统发育关系时,因为随机误差(造成的取样误差)和系统误差(因系统分析方法与分子数据实际的进化模式不一致而带来的误差,是系统分析方法的固有误差)的存在,会导致基于不同分子片段或不同取样策略所进行的系统发育研究结果的不一致或者说是基因树与物种树之间的冲突。虽然叶绿体系统发育基因组学能尽可能的减少由随机误差带来的影响,但与传统的系统发育研究一样,它同样无法避免系统误差带来的影响。而这种系统误差不会因为数据量的增加而减小,在某些情况下还会因为数据量的增加而被不断放大。因此,系统发育基因组学带来的一个新的问题是,所构建的基因组树具有很高的支持率,却不一定反映真实的系统发育关系。因而相较于用较少基因片段所构建的系统发育树来说,用系统发育基因组树来判断物种之间的真实进化关系需更为谨慎(Phillips等,2004;Soltis和Sol-tis,2004;Stefanovi'c等,2004;Lockhart等,2005)。

近年来关于叶绿体系统发育基因组学的争议主要围绕由系统误差导致的长枝吸引假象展开。长枝吸引(long-branch attraction,LBA)假象是指在使用系统发育分析方法分析一个有限的数据集时,由于高频的平行突变、回复突变或快速进化等因素的存在使亲缘关系较远的序列达到相似状态,而分析方法中存在的固有偏差却错误的将这些不是来自共同祖先的序列聚在一起的现象(Bergsten,2005)。引起长枝吸引假象产生的原因很多,其中一个典型的原因就是由于取样不全所造成的长枝吸引。系统发育基因组学一般是基于大规模和多个基因数据信息,通常只有较少分类群代表的一种分析方法,因而相较于传统的系统发育研究方法,系统发育基因组学更容易出现因取样不全而导致的长枝吸引假象(Soltis等,2004;Philippe等,2005)。关于被子植物基部类群的争议,是叶绿体系统发育基因组学研究中因取样不当造成长枝吸引假象的典型例子。在对被子植物基部类群的研究中,基于一个或多个基因片段的分子系统学研究结果表明Amborella或Amborella-Nymphaeales为被子植物的基部类群。然而Goremykin等(2003,2004)在对Amborella trichopoda和Nymphaea alba的叶绿体全基因组测序后,结合数据库中12个叶绿体基因组的61个蛋白质编码基因进行系统学研究,指出单子叶植

963

4期张韵洁和李德铢:叶绿体系统发育基因组学的研究进展

物才是被子植物的基部类群。这一研究结果引起了学术界的强烈关注。此后,Soltis和Soltis (2004),Stefanovi'c等(2004)在Goremykin的数据基础上增加了一个关键类群后得出的结果表示Amborella或Amborell-Nymphaeales仍然为被子植物的基部类群。且这一研究结果在增大取样量后所进行的叶绿体系统发育基因组学研究中也得到了证实(Leebens-Mack,2005;Jansen等,2007;Moore等,2010)。Goremykin等的研究结果主要是由于取样不当造成的,禾本科植物在起源过程中经历了一个快速进化的过程(Chaw等,2004;Zhong等,2009),因而仅以禾本科植物叶绿体基因组作为单子叶植物的代表,就造成了禾本科植物因显著加快的进化速率而被“吸引”到基部的长枝吸引假象。

长枝吸引现象一直是系统发育研究中的热点和难点,众多研究结果指出避免长枝吸引产生的方法主要有以下几种:(1)选用对长枝吸引较不敏感的系统分析方法,如改良的简约分析法(Lake,1987;Willson,1999)或最大似然法(Swofford等,1996;Huelsenbeck,1997)等。(2)在分析时选取进化速率较慢的物种代表该物种所在的类群(Aguinaldo等,1997;Brinkmann 和Philippe,1999;Kim等,1999)或相应的去除长枝类群,即进化速率显著加快的类群。(3)去除进化速率较快的序列位点,如第三位密码子(Lyons-Weiler和Hoelzer,1997)。(4)密集取样以打断长枝,该方法目前被认为是避免长枝吸引假象产生的最有效办法(Hendy和Penny,1989;Hillis,1996;Swofford等,1996;Graybeal,1998;Hillis,1998)。然而对系统发育基因组学而言,由于获得基因组信息相对较难,因而目前阶段很难做到密集取样。而大量基因组数据的产生在增加了系统发育信号的同时,进化过程中的“噪音”(如回复突变、趋同突变、平行突变等)也随之被放大。为尽量减少这些“噪音”带来的影响,有学者提出在系统发育基因组学研究中,应适当的选取基因组数据信息(如使用氨基酸序列以减少由密码子简并性带来的进化“噪音”)或者适量的舍弃基因组数据信息中的“噪音”成分(如第三位密码子)(Jeffroy等,2006)。这中得到了证实。例如,买麻藤目的系统学关系一直以来备受争议,分子系统学研究结果主要存在三种假说:(1)买麻藤目与整个松柏类植物为姊妹关系(Chaw等,1997);(2)买麻藤目位于松柏类中,与松科植物为姊妹群(Bowe等,2000;Chaw等,2000;Hajibabaei等,2006;Wu等,2007);(3)买麻藤目位于松柏类中,与杉科植物为姊妹群(Nickrent等,2000;Doyle,2006)。各种研究证据表明在关于买麻藤目的研究中可能存在长枝吸引的影响(Felsenstein,1978;Hendy 和Penny,1989;Lockhart和Steel,2005;Hajib-abaei等,2006)。Zhong等(2010)利用叶绿体系统发育基因组学的手段对买麻藤目的系统学位置进行了研究。这一研究最初使用13个种的56个基因的氨基酸序列进行分析,结果表明买麻藤目与杉科更近,但买麻藤目和杉科的枝长均显著长于其他分支,有可能是受到长枝吸引的作用。因此该研究进一步结合多种取样手段及去除一些快速进化或受平行氨基酸替换影响的蛋白质序列和位点后,指出买麻藤目与松科关系更近这一假说更为合理。同时,这一研究中也对原有的cpREV模型进行了改进,并证明新的模型可相对减轻长枝吸引带来的影响。在这一研究基础上,作者指出在叶绿体基因组数据中长枝吸引及平行核苷酸替代(parallel substitutions)可能导致买麻藤目的系统学位置出现严重的偏差,而增加取样量和移除一些快速进化的基因能有效的避免长枝吸引带来的影响。基于目前非松科的松柏类植物仅有柳杉(Cryptomeria japonica)的叶绿体基因组作为代表种,作者也认为更多非松科的松柏类植物的叶绿体基因组测序将会为买麻藤目的系统学位置带来更好的解释。

以上两个例子可以说明在实际应用中,对于叶绿体系统发育基因组学因取样不全而带来的长枝吸引假象,应加以小心判断,通过不同的取样策略和不同的研究方法,可将这种影响降到最低。同时,随着系统发育基因组学的发展,对系统发育研究方法也提出了新的要求。如概率分析方法中应使用能尽量反映真实核苷酸替代模式的模型,以减少由模型不适带来的影响(Steel,2005)。用于动物线粒体蛋白质的氨基酸替代模型很多,但对于植物叶绿体蛋白质的氨基酸替代

073植物分类与资源学报第33卷

模型目前却只有cpREV一种报道(Adachi等,2000)。随着叶绿体系统发育基因组学的迅速发展,对新的氨基酸或核苷酸替代模型的需要也迫在眉睫。

虽然叶绿体基因组在系统发育研究中具有众多的优点,但是必须认识到的一点是叶绿体系统发育基因组学并不是解决植物系统学问题的万能药。例如对于一些在进化过程中经历了快速分化的类群,有研究表明全叶绿体基因组数据仍然不足以完全解决这些类群的系统发育关系(Parks 等,2009;Moore等,2010)。对于这样一些类群,结合大量核基因组数据进行分析仍然是必要的。其次,叶绿体在大多数植物类群中是单亲遗传,来自叶绿体基因组的信息一般情况下仅能反映母系或父系进化历程,并不能完全揭示植物生命进化的全部过程。但对叶绿体基因组树的正确认识是研究物种进化的前提,结合来自核基因组的数据,能更全面的揭示植物生命进化的全过程,并发现一些生命进化过程中有趣的现象,如杂交、渐渗等。

4新一代测序技术对叶绿体系统发育基因组学发展的促进作用

在新一代测序技术尚未出现以前,叶绿体全基因组的测序一般采用以下三种策略:(1)先分离纯化叶绿体基因组,并构建质粒文库,采用全基因组鸟枪法(Whole Genome Shotgun Sequen-cing)进行测序。该方法的一大难点在于分离纯化叶绿体基因组在实际操作中较为困难,叶绿体基因组的含量和纯度直接影响需挑取测序的克隆数目。对于一些高纤维含量的植物,分离纯化其叶绿体基因组相当困难(Jansen等,2005),且分离纯化叶绿体基因组需要新鲜幼嫩的材料,这在一定程度上限制了该方法的应用。(2)全基因组构建BAC(Bacterial Artificial Chromosome,细菌人工染色体)文库,利用叶绿体探针在BAC 文库中挑取含叶绿体基因组的克隆,再进一步采用鸟枪法进行测序。该方法一般是在已建立BAC文库的基础上进行的,因为成本较高,对于没有建立BAC文库的物种,想要获得其叶绿体基因组序列一般不采用这种方法。(3)利用叶绿体基因对长PCR(Long PCR)或PCR的方法进行测序,这是目前运用的比较多的方法,但仍然存在工作量大,耗时长等问题。

新一代测序技术(next-generation sequen-cing,NGS)是相对于传统的Sanger测序法(即末端终止法)而言的,又称第二代测序技术。它是对在末端终止法、连接酶测序法(sequencing by ligation,SbL)、焦磷酸测序法(pyrosequenc-ing)和杂交测序法(sequencing by hybridization,SbH)的基础上进行改良的测序技术的统称。新一代测序平台的典型代表有罗氏(Roche)公司的454测序平台,Illumina公司的Solexa测序平台以及ABI(Applied Biosystems)公司的SOLiD 测序平台(Shendure和Ji,2008)。新一代测序技术的诞生,使基因组学和功能基因组学进入了一个低成本、大规模、高通量测序的时代,同时也为叶绿体系统发育基因组学带来了新的契机。新一代测序技术的测序长度一般较短,根据测序平台不同,读长从25 450bp不等,适用于结构及成分较为简单的基因组的测序。叶绿体基因组因大小适中,且基因含量及基因组结构相对保守,基因组中重复序列含量相对较少,对于单个个体而言叶绿体基因组无变异或仅有极少量变异,因此新一代测序技术完全适用于叶绿体基因组的测序。

利用新一代测序技术获得叶绿体基因组数据相对于传统方法的优势在于成本较低,可在短时间内同时获得多个叶绿体基因组数据,测序深度(Sequencing Depth)为传统方法的2 10倍。Moore等(2006)首次应用454测序平台,对南天竹(Nandina domestica)和一球悬铃木(Plata-nus occidentalis)进行测序,两个基因组均获得了高于99.75%的基因组覆盖度,测序深度分别为24.6?(南天竹)和17.3?(一球悬铃木)。最近该方法也成功用于绿豆(Vigna radiata)叶绿体基因组的测序(Tangphatsornruang等,2010)。Cronn等(2008)首次利用Solexa测序平台同时测序了8个针叶树叶绿体基因组,基因组覆盖度为88% 94%,测序深度为55?到186?,证实了利用Solexa测序平台能高效快速的获得叶绿体基因组数据。随后该方法继续用于37个松属植物及其近缘种的叶绿体基因组测序,并在此基础

173

4期张韵洁和李德铢:叶绿体系统发育基因组学的研究进展

上对松属植物的系统发育关系进行了进一步探讨(Parks等,2009)。得益于新一代测序技术的发展,叶绿体全基因组数据不仅可用于研究较低分类阶元的系统关系,最近的研究还指出全叶绿体基因组数据在研究分布于不同地理位置的同一物种的种内变异中也存在着巨大的潜力(Whittall 等,2010)。叶绿体基因组在居群水平的应用可为研究种内分化时间和分化强度提供线索。结合核基因组数据进行分析还可为植物的花粉传播、迁移途径及物种进化动力等有更全面的了解。

由于叶绿体基因组数据在以前获得较为困难,使得基于叶绿体基因组的系统发育基因组学发展受到了很大程度的限制。随着新一代测序技术的日趋成熟以及序列拼接软件的不断完善,叶绿体基因组数据的获得变得高效快速,且大大降低了测序成本。这为同时获取多个叶绿体基因组数据提供了坚实的技术支持,随着叶绿体基因组数目的增加,因取样不全而带来的长枝吸引现象也能最大限度的避免。不仅如此,新一代测序技术的发展,将大大促进叶绿体系统发育基因组学在较低级分类阶元中的应用。从近年来新一代测序技术在叶绿体基因组数据获得中的成功运用不难看出,这一新技术的出现将大大推动叶绿体系统发育基因组学的发展,从而为植物的系统发育研究带来新的曙光。

〔参考文献〕

Adachi J,Waddell PJ,Martin W et al.,2000.Plastid genome phy-logeny and a model of amino acid substitution for proteins enco-ded by chloroplast DNA[J].Journal of Molecular Evolution,50(4):348—358

Aguinaldo AMA,Turbeville JM,Linford LS et al.,1997.Evidence for a clade of nematodes,arthropods and other moulting animals [J].Nature,387(6632):489—493

Barkman TJ,Chenery G,McNeal JR et al.,2000.Independent and combined analyses of sequences from all three genomic compart-ments converge on the root of flowering plant phylogeny[J].Proceedings of the National Academy of Sciences,97(24):13166—13171

Bergsten J,2005.A review of long-branch attraction[J].Cladis-tics,21(2):163—193

Bowe LM,Coat G,DePamphilis CW,2000.Phylogeny of seed plants based on all three genomic compartments:extant gymnosperms

are monophyletic and Gnetales'closest relatives are conifers [J].Proceedings of the National Academy of Sciences of the U-nited States of America,97(8):4092—4097

Brinkmann H,Philippe H,1999.Archaea sister group of Bacteria?

Indications from tree reconstruction artifacts in ancient phylogenies [J].Molecular Biology and Evolution,16(6):817—825 Burleigh JG,Hilu KW,Soltis DE,2009.Inferring phylogenies with incomplete data sets:a5-gene,567-taxon analysis of angiosperms [J].BMC Evolutionary Biology,9(1):61

Cai Z,Guisinger M,Kim HG et al.,2008.Extensive reorganization of the plastid genome of Trifolium subterraneum(Fabaceae)is as-sociated with numerous repeated sequences and novel DNA inser-tions[J].Journal of Molecular Evolution,67(6):696—704 Chase MW,Soltis DE,Olmstead RG et al.,1993.Phylogenetics of seed plants:an analysis of nucleotide sequences from the plastid gene rbcL[J].Annals of the Missouri Botanical Garden,80(3):528—580

Chaw SM,Chang CC,Chen HL et al.,2004.Dating the monocot-di-cot divergence and the origin of core eudicots using whole chlo-roplast genomes[J].Journal of Molecular Evolution,58(4):

424—441

Chaw SM,Parkinson CL,Cheng Y et al.,2000.Seed plant phyloge-ny inferred from all three plant genomes:monophyly of extant gymnosperms and origin of Gnetales from conifers[J].Pro-ceedings of the National Academy of Sciences of the United States of America,97(8):4086—4091

Chaw SM,Zharkikh A,Sung HM et al.,1997.Molecular phylogeny of extant gymnosperms and seed plant evolution:analysis of nu-clear18S rRNA sequences[J].Molecular Biology and Evolu-tion,14(1):56—68

Chu KH,Qi J,Yu ZG et al.,2004.Origin and phylogeny of chloro-plasts revealed by a simple correlation analysis of complete ge-nomes[J].Molecular Biology and Evolution,21(1):200—206 Clegg MT,Gaut BS,Learn GH et al.,1994.Rates and patterns of chloroplast DNA evolution[J].Proceedings of the National A-cademy of Sciences of the United States of America,91(15):6795—6801

Corriveau JL,Coleman AW,1988.Rapid screening method to detect potential biparental inheritance of plastid DNA and results for over 200angiosperm species[J].American Journal of Botany,75(10):1443—1458

Cosner ME,Jansen RK,Moret BME et al.,2000.An empirical com-parison of phylogenetic methods on chloroplast gene order data in Campanulaceae[A].In:Sankoff D,Nadeau JH eds.Compar-ative Genomics:Empirical and Analytical Approaches to Gene Or-der Dynamics,Map Alignment,and the Evolution of Gene Fami-lies[M].Dordrecht:Kluwer Academic Publishers,99—121 Cosner ME,Jansen RK,Palmer JD et al.,1997.The highly rear-ranged chloroplast genome of Trachelium caeruleum(Campanu-laceae):multiple inversions,inverted repeat and con-

273植物分类与资源学报第33卷

traction,transposition,insertions/deletions,and several repeat families[J].Current Genetics,31(5):419—429

Cosner ME,Raubeson LA,Jansen RK,2004.Chloroplast DNA rear-rangements in Campanulaceae:phylogenetic utility of highly rear-ranged genomes[J].BMC Evolutionary Biology,4(1):27 Cronn R,Liston A,Parks M et al.,2008.Multiplex sequencing of plant chloroplast genomes using Solexa sequencing-by-synthesis technology[J].Nucleic Acids Research,36(19):e122 Delsuc F,Brinkmann H,Philippe H,2005.Phylogenomics and the reconstruction of the tree of life[J].Nature Reviews Genetics,6(5):361—375

de Queiroz A,Donoghue MJ,Kim J,1995.Separate versus com-bined analysis of phylogenetic evidence[J].Annual Review of Ecology and Systematics,26(1):657—681

Doyle JA,2006.Seed ferns and the origin of angiosperms[J].The Journal of the Torrey Botanical Society,133(1):169—209 Eisen JA,1998.Phylogenomics:improving functional predictions for uncharacterized genes by evolutionary analysis[J].Genome re-search,8(3):163—167

Eisen JA,Hanawalt PC,1999.A phylogenomic study of DNA repair genes,proteins,and processes[J].Mutation Research,435(3):171—213

Felsenstein J,1978.Cases in which parsimony or compatibility meth-ods will be positively misleading[J].Systematic Biology,27(4):401—410

Goremykin VV,Hirsch-Ernst KI,Wolfl S et al.,2003.Analysis of the Amborella trichopoda chloroplast genome sequence suggests that Amborella is not a basal angiosperm[J].Molecular Biology and Evolution,20(9):1499—1505

Goremykin VV,Hirsch-Ernst KI,Wolfl S et al.,2004.The chloro-plast genome of Nymphaea alba:whole-genome analyses and the problem of identifying the most basal angiosperm[J].Molecular Biology and Evolution,21(7):1445—1454

Graybeal A,1998.Is it better to add taxa or characters to a difficult phylogenetic problem?[J].Systematic Biology,47(1):9—17 Hajibabaei M,Xia J,Drouin G,2006.Seed plant phylogeny:Gneto-phytes are derived conifers and a sister group to Pinaceae[J].Molecular Phylogenetics and Evolution,40(1):208—217 Hendy MD,Penny D,1989.A framework for the quantitative study of ev-olutionary trees[J].Systematic Biology,38(4):297—309

Hillis DM,1996.Inferring complex phylogenies[J].Nature,383:130—131

Hillis DM,1998.Taxonomic sampling,phylogenetic accuracy,and investigator bias[J].Systematic Biology,47(1):3—8

Hilu KW,Borsch T,Muller K et al.,2003.Angiosperm phylogeny based on matK sequence information[J].American Journal of Botany,90(12):1758—1776

Huelsenbeck JP,1997.Is the Felsenstein zone a fly trap?[J].Sys-tematic Biology,46(1):69—74

Jansen RK,Cai Z,Raubeson LA et al.,2007.Analysis of81genes

from64plastid genomes resolves relationships in angiosperms and identifies genome-scale evolutionary patterns[J].Proceedings of the National Academy of Sciences,104(49):19369—19374 Jansen RK,Kaittanis C,Saski C et al.,2006.Phylogenetic analyses of Vitis(Vitaceae)based on complete chloroplast genome se-quences:effects of taxon sampling and phylogenetic methods on resolving relationships among rosids[J].BMC Evolutionary Bi-ology,6(1):32

Jansen RK,Raubeson LA,Boore JL et al.,2005.Methods for obtai-ning and analyzing whole chloroplast genome sequences[J].Methods in Enzymology,395:348—384

Jeffroy O,Brinkmann H,Delsuc F et al.,2006.Phylogenomics:the beginning of incongruence?[J].Trends in Genetics,22(4):225—231

Kim J,Kim W,Cunningham CW,1999.A new perspective on lower metazoan relationships from18S rDNA sequences[J].Molecu-lar Biology and Evolution,16:423—427

Knox EB,Downie SR,Palmer JD,1993.Chloroplast genome rear-rangements and the evolution of giant lobelias from herbaceous ancestors[J].Molecular Biology and Evolution,10(2):

414—430

Knox EB,Palmer JD,1999.The chloroplast genome arrangement of Lobelia thuliniana(Lobeliaceae):expansion of the inverted re-peat in an ancestor of the Campanulales[J].Plant Systematics and Evolution,214(1):49—64

Lake JA,1987.A rate-independent technique for analysis of nucleic acid sequences:evolutionary parsimony[J].Molecular Biology and Evolution,4(2):167—191

Leebens-Mack J,Raubeson LA,Cui L et al.,2005.Identifying the basal angiosperm node in chloroplast genome phylogenies:sam-pling one's way out of the Felsenstein zone[J].Molecular Biol-ogy and Evolution,22(10):1948—1963

Lemieux C,Otis C,Turmel M,2007.A clade uniting the green algae Mesostigma viride and Chlorokybus atmophyticus represents the deepest branch of the Streptophyta in chloroplast genome-based phylogenies[J].BMC biology,5(1):2

Li W,Olmstead R,1997.Molecular Evolution[M].Sunderland,MA:Sinauer Associates

Lockhart PJ,Penny D,Soltis DE et al.,2005.The place of Amborel-la within the radiation of angiosperms[J].Trends in Plant Sci-ence,10(5):201—202

Lockhart P,Steel M,2005.A tale of two processes[J].Systematic Biology,54(6):948—951

Lonsdale DM,Brears T,Hodge TP et al.,1988.The plant mitochon-drial genome:homologous recombination as a mechanism for gen-erating heterogeneity[J].Philosophical Transactions of the Roy-al Society of London Series B,319(1193):149—163

Lyons-Weiler J,Hoelzer GA,1997.Escaping from the felsenstein zone by detecting long branches in phylogenetic Data[J].Mo-lecular Phylogenetics and Evolution,8(3):—384

373

4期张韵洁和李德铢:叶绿体系统发育基因组学的研究进展

Magallón S,Castillo A,2009.Angiosperm diversification through time[J].American Journal of Botany,96(1):349—365 Magallón S,Crane PR,Herendeen PS,1999.Phylogenetic pattern,diversity,and diversification of eudicots[J].Annals of the Mis-souri Botanical Garden,86(2):297—372

Moore MJ,Dhingra A,Soltis PS et al.,2006.Rapid and accurate py-rosequencing of angiosperm plastid genomes[J].BMC Plant Biology,6(1):17

Moore MJ,Soltis PS,Bell CD et al.,2010.Phylogenetic analysis of 83plastid genes further resolves the early diversification of eud-icots[J].Proceedings of the National Academy of Sciences,107(10):4623—4628

Nei M,Kumar S,2000.Molecular Evolution and Phylogenetics [M].New York:Oxford University Press

Nickrent DL,Parkinson CL,Palmer JD et al.,2000.Multigene phy-logeny of land plants with special reference to bryophytes and the earliest land plants[J].Molecular Biology and Evolution,17(12):1885—1895

Nozaki H,Ohta N,Matsuzaki M et al.,2003.Phylogeny of plastids based on cladistic analysis of gene loss inferred from complete plastid genome sequences[J].Journal of Molecular Evolution,57(4):377—382

Palmer JD,1992.Mitochondrial DNA in plant systematics:applica-tions and limitations[A].In:Soltis PS,Soltis DE,Doyle JJ eds.Molecular Systematics of Plants[M].New York:Chapman and Hall,36—49

Palmer JD,Herbon LA,1988.Plant mitochondrial DNA evolved rap-idly in structure,but slowly in sequence[J].Journal of Molec-ular Evolution,28(1):87—97

Parks M,Cronn R,Liston A,2009.Increasing phylogenetic resolu-tion at low taxonomic levels using massively parallel sequencing of chloroplast genomes[J].BMC biology,7(1):84

Philippe H,Lartillot N,Brinkmann H,2005.Multigene analyses of bilaterian animals corroborate the monophyly of Ecdysozoa,Loph-otrochozoa,and Protostomia[J].Molecular Biology and Evolu-tion,22(5):1246—1253

Phillips MJ,Delsuc F,Penny D,2004.Genome-scale phylogeny and the detection of systematic biases[J].Molecular Biology and E-volution,21(7):1455—1458

Pombert JF,Otis C,Lemieux C et al.,2005.The chloroplast genome sequence of the green alga Pseudendoclonium akinetum(Ulvo-phyceae)reveals unusual structural features and new insights in-to the branching order of chlorophyte lineages[J].Molecular Biology and Evolution,22(9):1903—1918

Qiu YL,Dombrovska O,Lee J et al.,2005.Phylogenetic analyses of basal angiosperms based on nine plastid,mitochondrial,and nu-clear genes[J].International Journal of Plant Sciences,166(5):815—842

Savolainen V,Chase MW,Hoot SB et al.,2000.Phylogenetics of flowering plants based on combined analysis of plastid atpB and

rbcL gene sequences[J].Systematic Biology,49(2):306—362 Shendure J,Ji H,2008.Next-generation DNA sequencing[J].Na-ture biotechnology,26(10):1135—1145

Soltis DE,Senters AE,Zanis MJ et al.,2003.Gunnerales are sister to other core eudicots:implications for the evolution of pentamery [J].American Journal of Botany,90(3):461—470

Soltis DE,Albert VA,Savolainen V et al.,2004.Genome-scale da-ta,angiosperm relationships,and‘ending incongruence’:a cau-tionary tale in phylogenetics[J].Trends in plant science,9(10):477—483

Soltis DE,Soltis PS,2004.Amborella not a“basal angiosperm”?Not so fast[J].American Journal of Botany,91(6):997—1001 Steel M,2005.Should phylogenetic models be trying to‘fit an ele-phant’?[J].Trends in Genetics,21(6):307—309 Stefanovi'c S,Rice DW,Palmer JD,2004.Long branch attraction,taxon sampling,and the earliest angiosperms:Amborella or mono-cots?[J].BMC Evolutionary Biology,4(1):35

Swofford DL,Olsen GJ,Waddell PJ et al.,1996.Phylogenetic infer-ence[A].In:Hillis DM,Moritz C,Mable BK eds.Phyloge-netic Inference[M].MA:Sinauer Associates,Sunderland,407—514

Tangphatsornruang S,Sangsrakru D,Chanprasert J et al.,2010.The chloroplast genome sequence of Mungbean(Vigna radiata)de-termined by high-throughput pyrosequencing:structural organiza-tion and phylogenetic relationships[J].DNA Research,17(1):11—22

Tian X(田欣),Li DZ(李德铢),2002.Application of DNA se-quences in plant phylogentic study[J].Acta Botanica Yunnani-ca(云南植物研究),24:170—184

Wakasugi T,Tsudzuki J,Ito S et al.,1994.Loss of all ndh genes as determined by sequencing the entire chloroplast genome of the black pine Pinus thunbergii[J].Proceedings of the National A-cademy of Sciences of the United States of America,91(21):

9794—9798

Wendel JF,Doyle JJ,1998.Phylogenetic incongruence:window into genome history and molecular evolution[A].In:Soltis DE,Soltis PS,Doyle JJ eds.Molecular Systematics of Plants II:DNA sequencing[M].Boston:Kluwer,265—296

Whittall JB,Syring J,Parks M et al.,2010.Finding a(pine)nee-dle in a haystack:chloroplast genome sequence divergence in rare and widespread pines[J].Molecular Ecology,19(S1):100—114

Willson SJ,1999.A higher order parsimony method to reduce long-branch attraction[J].Molecular Biology and Evolution,16:694—705

Wolfe KH,Morden CW,Palmer JD,1992.Function and evolution of

a minimal plastid genome from a nonphotosynthetic parasitic plant

[J].Proceedings of the National Academy of Sciences of the Unit-ed States of America,89(22):10648—10652

Wu CS,Wang YN,Liu SM et al.,2007.genome(cpD-

473植物分类与资源学报第33卷

NA )of Cycas taitungensis and 56cp protein-coding genes of Gnetum parvifolium :insights into cpDNA evolution and phyloge-ny of extant seed plants [J ].Molecular Biology and Evolution ,24(6):1366—1379

Yu L (于黎),Zhang YP (张亚平),2006.Phylogenomic ———An

attractive avenue to reconstruct “tree of life ”[J ].Hereditas (遗传),28(11):1445—1450

Yu ZG ,Zhou LQ ,Anh VV et al .,2005.Phylogeny of prokaryotes

and chloroplasts revealed by a simple composition approach on all protein sequences from complete genomes without sequence align-ment [J ].Journal of Molecular Evolution ,60(4):538—545Zeng CX ,Zhang YX ,Triplett JK et al .,2010.Large multi-locus plastid phylogeny of the tribe Arundinarieae (Poaceae :Bambu-soideae )reveals ten major lineages and low rate of molecular di-vergence [J ].Molecular Phylogenetics and Evolution ,56(2):

821—839

Zhang YJ ,Ma PF ,Li DZ ,2011.High-throughput sequencing of six

bamboo chloroplast genomes :phylogenetic implications for tem-perate woody bamboos (Poaceae :Bambusoideae )[J ].PloS ONE ,6(5):e20596

Zhong B ,Yonezawa T ,Zhong Y et al .,2009.Episodic evolution and

adaptation of chloroplast genomes in ancestral grasses [J ].PloS ONE ,

4(4):e5297Zhong B ,Yonezawa T ,Zhong Y et al .,2010.The position of Gne-tales among seed plants :overcoming pitfalls of chloroplast phy-logenomics [J ].Molecular Biology and Evolution ,27(12):2855—2863

Zou XH ,Zhang FM ,Zhang JG et al .,2008.Analysis of 142genes

resolves the rapid diversification of the rice genus [J ].Genome Biology ,9(3):R49

???????????????

书评

A review of Bamboos at TBGRI by K.C.Koshy

Koshy ,K.C.(2010).Bamboos at TBGRI.Pp.104,128colour photographs ,1painting ,1graph ,1map.India :Kerala ,Tropical Botanic Garden and Research Institute (TBGRI ),Palode ,Thiruvananthapuram 695562.Price Rs.600;US $30(postage &handling free ).ISBN 978-81-920098-0-3(soft cover ).

This book tells the story of the establishment of a bambusetum at the Tropical Botanic Garden and Re-search Institute in the state of Kerala in southern India.Started in 1987by the author ,it could be held up as a model of thoroughness in building up a living bamboo collection.Scrupulous care was taken to document all introductions and their location in the Garden.Although only 68species are represented ,great effort was taken to acquire a diversity of genotypes within them amounting to 933different accessions.This diversity is valuable for understanding specific variability ,flowering cycles ,and selecting the best clones for different u-ses.It is also indispensable for bamboo breeding which they have ventured into and have successfully pro-duced 12hybrids.For each species ,the information on nomenclature ,description ,distribution ,live collec-tions ,location ,planting date ,propagule and provenance ,dried specimens are given in detail.The species descriptions are focused on the vegetative characters ,which are very useful for identification.Many photo-graphs are helpful but some species don't have close-up pictures of the new shoots which are so important in i-dentifying species in a vegetative state.A number of species of Pseudoxytenanthera and Ochlandra ,native to south India ,which are seldom illustrated in bamboo books ,are depicted here.This book is a wonderful record of the live bamboo collection at TBGRI and a useful reference for understanding the conservation of the bamboo genetic diversity.It is a very useful handbook for bamboo researchers ,collectors ,growers as well as amateurs.

Prof.Dr.Xia Nianhe

Curator of the Living Collection South China Botanical Garden Chinese Academy of Sciences

5

734期张韵洁和李德铢:叶绿体系统发育基因组学的研究进展

第3章 人类基因组学

第三章人类基因组学 基因组指一个生命体的全套遗传物质。从基因组整体层次上研究各生物种群基因组的结构和功能及相互关系的科学即基因组学。基因组学的研究内容包括三个基本方面,即结构基因组学,功能基因组学和比较基因组学。 人类基因组计划(HGP)是20世纪90年代初开始,由世界多个国家参与合作的研究人类基因组的重大科研项目。其基本目标是测定人类基因组的全部DNA序列,从而为阐明人类全部基因的结构和功能,解码生命奥秘奠定基础。人类基因组计划的成果体现在人类基因组遗传图,物理图和序列图的完成,而基因图的完成还有待大量的工作。 后基因组计划(PGP)是在HGP的人类结构基因组学成果基础上的进一步探索计划,将主要探讨基因组的功能,即功能基因组学研究。由此派生了蛋白质组学,疾病基因组学,药物基因组学,环境基因组学等分支研究领域,同时也促进了比较基因组学的展开。后基因组计划研究的进展,促进了生命科学的变革,可以预见会对医学、药学和相关产业产生重大影响。 HGP的成就加速了基因定位研究的进展,也提高了基因克隆研究的效率。基因的定位与克隆是完成人类的基因图,进而解码每一个基因的结构和功能的基本研究手段。 一、基本纲要 1.掌握基因组,基因组学,结构基因组学,功能基因组学,比较基因组学,基因组医学, 后基因组医学的概念。 2.熟悉人类基因组计划(HGP)的历史,HGP的基本目标;了解遗传图,物理图,序列图,基因图的概念和构建各种图的方法原理。 3.了解RFLP,STR和SNP三代DNA遗传标记的特点。 4.熟悉后基因组计划(PGP)的各个研究领域即功能基因组学、蛋白质组学、疾病基因组学、药物基因组学,比较基因组学、生物信息学等的概念和意义。

【免费下载】真菌基因组学研究进展

真菌基因组学研究进展 真菌为低等真核生物,种类庞大而多样。据估计,全世界约有真菌150万种,已被描述的约8万种。真菌在自然界分布广泛,存在于土壤、水、空气和生物体内外,与人类生产和生活有着非常密切的关系。许多真菌在自然界的碳素和氮素循环中起主要作用,参与淀粉、纤维素、木质素等有机含碳化合物及蛋白质等含氮化合物的分解。有些真菌如蘑菇、草菇、木耳、麦角、虫草、茯苓等可直接供作食用和药用,或在发酵工业、食品加工业、抗生素生产中具有重要作用。然而,也有些种类引起许多植物特别是重要农作物的病害,如水稻稻瘟病、小麦锈病、玉米腥黑穗病、果树病害等。少数真菌甚至是人类和动物的致病菌,如白色假丝酵母Candida albicans等。因此,合理利用有益真菌,控制和预防有害 真菌具有重要意义。 本文整理了已完成基因组序列测定的真菌的信息,并对真菌染色体组的历史、测序策略及其基因组学的研究进展进行了评述。 1真菌染色体组的研究历史和资源 1986年美国科学家Thomas Rodefick提出基因组学概念,人类基因组计划带动了模式生物和其它重要生物体基因组学研究。阐明各种生物基因组DNA中碱基对的序列信息及破译相关遗传信息的基因组学已经成为与生物学和医学研究不可分割的学科。由欧洲、美国、加拿大和日本等近百个实验室六百多位科学家通力合作,1996年完成第一个真核生物酿酒酵母Saccharomyces cerevisiae的基因组测序,这 对于酵母菌类群来说是一个革命性的里程碑,并且激起了真核基因功能和表达的第一次全球性研究(Goffeau etal,1996)。随后粟酒裂殖酵母Schizosaccharomyces pombe(Wood etal.2002)和粗糙脉孢 霉Neurospora crassa(Galagan etal.2003)染色体组的完成显露出酿酒酵母作为真菌模式生物的局限性。尽管如此,真菌染色体组测序的进展最初是缓慢的。为加快真菌染色体组研究的步伐,2000年由 美国Broad研究所与真菌学研究团体发起真菌基因组行动(fungal genome initiative,FGI),目的是 促进在医药、农业和工业上具有重要作用的真菌代表性物种的基因组测序。2002年2月FGI发表了第 一份关于测定15种真菌基因组计划的白皮书。2003年6月,真菌基因组行动发表了第二份白皮书,列 出了44种真菌作为测序的目标,强调对其中10个属即青霉属Penicillium、曲霉属Aspergillus、组 织胞浆菌属Histoplasma、球孢子菌Coccidioides、镰刀菌属Fusarium、脉孢菌属Neurospora、假丝 酵母属Candida、裂殖酵母属Schizosaccharomyces、隐球酵母属Cryptococcus和柄锈病菌属Puccin& 的物种优先进行测序。之后,经过FGI、法国基因组学研究项目联(G6nolevures Consortium)、美国能 源部联合基因组研究所(The DOE Joint Genome Institute,JGI)DOE联合基因组研究所、基因组研究 院(The Institute for Genomic Research,TIGR)、英国The Wellcome Trust Sanger InstimteSanger和华盛顿大学基因组测序中心等共同努力;得到包括美国国家人类染色体研究所、国 家科学基金会、美国农业部和能源部等的资助,也有来自学术界和产业集团如著名的 Monsanto、Syngenta、Biozentrum、Bayer Crop Science AG和Exelixis等公司的持续合作,在最近 的几年里,真菌基因组学研究取得重大突破。至2008年6月1日,共有3734种生物的全基因组序列测定工作已经完成或正在进行,公开发表812个完整的基因组,其中,70余种真菌基因组测序工作已经 组装完成或正在组装,分别属于子囊菌门、担子菌门、接合菌门、壶菌门和微孢子虫(Microsporidia) 的代表。此外,还有Ajellomyces dermatitidis和Antonospora locustae等20余种真菌基因组序列 正在测定中(Bemal etal.2001)。这些真菌都是重要的人类病原菌、植物病原菌、腐生菌或者模式生物,基因组大小为2.5—81.5Mb,包含酵母或产生假菌丝的酵母、丝状真菌,或者具有二型性(或多型性) 生活史的真菌,拥有与动物和植物细胞一样的的细胞生理学和遗传学特征,包括多细胞性、细胞骨架结

第八章分子生物学常用技术的原理及其应用及人类基因组学

第八章分子生物学常用技术的原理及其应用及人类基因组学 测试题 一、名词解释 1.分子杂交 2.Southernblotting 3.Northernblotting 4.Westernblotting 5.dotblotting 6.DNA芯片技术 7.PCR 8.功能性克隆 9.转基因技术 二、填空题 1.Southernblotting用于研究、Northernblotting用于研究,Westernblotting用于研究。 2.PCR的基本反应步骤包括、和三步。 3.在PCR反应体系中,除了DNA模板外,还需加入、、和。 4.Sange法测序的基本步骤包括、、和。 5.目前克隆致病相关基因的主要策略有、、。 6.血友病第Ⅷ因子基因的首次克隆成功所采用的克隆策略是,而DMD致病基因的克隆所采用的克隆策略是。 三、选择题 A型题 1.经电泳分离后将RNA转移到硝酸纤维素(NC)膜上的技术是: A.SouthernblottingB.Northernblotting

C.WesternblottingD.dotblotting E.insituhybridization 2.不经电泳分离直接将样品点在NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.Dotblotting E.insituhybridization 3.经电泳分离后将蛋白质转移到NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.dotblotting E.insituhybridization 4.经电泳后将DNA转移至NC膜上的技术是A.SouthernblottingB.Northernblotting C.WesternblottingD.Easternblotting E.insituhybridization 5.PCR的特点不包括 A.时间短,只需数小时B.扩增产物量大 C.只需微量模板D.用途非常广泛 E.底物必须标记 6.用于PCR的DNA聚合酶必须 A.耐热B.耐高压C.耐酸D.耐碱E.耐低温7.PCR反应过程中,模板DNA变性所需温度一般是A.95?CB.85?CC.75?CD.65?CE.55?C 8.PCR反应过程中,退火温度一般是 A.72?CB.85?CC.75?CD.65?CE.55?C 9.PCR反应过程中,引物延伸所需温度一般是A.95?CB.82?CC.72?CD.62?CE.55?C

进化基因组学研究进展

研究进化基因组学进展 摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。 关键词:进化基因组学系统进化比较基因组学新基因 正文 随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学。 近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。 研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们可以分析基因组数据,利用进化基因组学研究系统进化。 一、目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学、基因注释的等方面;在新基因方面

基因组学研究的应用前景

基因组学研究的应用前景摘要:基因组学是一门研究基因组的结构,功能及表达产物的学科,基因组的结构不仅是蛋白质,还有许多复杂功能的RNA,包括三个不同的亚领域,及结构基因组学,功能基因组学和比较基因组学。近几年,基因组学在微生物药物,细菌,病毒基因,营养基因方面都有进展,其前景是光明的。 关键词:基因研究未来结构 一、微生物药物产生菌功能基因组学研究进展 微生物药物是一类化学结构和生物活性多样的次级代谢产物,近年来多个产生菌基因组序列已经被测定完成,在此基础上开展的功能基因组研究方兴未艾,并在抗生素生物合成,形态分化,调控,发育与进化及此生代谢产物挖掘等方面有着新的发现,展现出广阔的研究前景,青霉素及其衍生的《》内酰胺类抗生素极大地改善了人类的卫生保健和生活质量,并促进研究人员不断对其工业生产菌株类黄青霉进行遗传改良和提高其产量,从而降低生产成本。经过60年的随机诱变筛选,当前青霉素产量至少提高了三个数量级,同时,青霉素的生物合成机理也得到了较为清晰的阐述,其pcbAB编码的非核糖体肽合酶ACVS~DPcbc编码的异青霉素N合成酶IPNS位于细胞质中,而苯乙酸COA连接酶PenDE编码的IPN酰基转移酶位于特殊细胞器一微体中。 研究发现,青霉素合成基因区域串联扩增,产黄青细霉胞中微体含量增加都可显著提高青霉素产量。然而随机诱变筛选得到的黄青霉工业菌株高产的分子机制尚不明确。为此,2008年荷兰研究人员联合国美国venter基因组研究所对黄青霉wisconsin54—1225进行了基因组测试和分析,并进一步利用DNA芯片技术研究了wisconsin54—1255及其高产菌株DS17690在培养基中是否添加侧链前体苯乙酸情况下的转录组变化,四组数据的比较分析发现,有2470个基因至少在其中一个条件下是差异表达的,根据更为严格的筛选标准,在PPA存在的条件下,高产菌相比测序菌株有307个基因转录是上调的,和生长代谢,青霉素前体合成及其初级代谢和转运等功能相关,另有271个基因显著下调,主要是与生长代谢及发育分化相关的功能基因。 二、乳酸菌基因组学的研究进展

基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物 具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成 新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。 外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌 基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。 非编码序列扩张方式:滑序复制、转座因子 模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低 如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子 内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。 基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短 基因功能的检测:基因失活、基因过表达、RNAi干涉 双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。 要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。 酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制 合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。 遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁 衡量遗传图谱的水平覆盖程度饱和程度 基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因 基因组(genome):生物所具有的携带遗传信息的遗传物质总和。 基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

进化基因组学研究进展

进化基因组学研究进展 刘超 (山东大学生命科学学院济南250100) 摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。 关键词:进化基因组学系统进化比较基因组学新基因 前言 随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学(Evolutional Genomics)。 近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。 1进化基因组学研究内容 研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们可以分析基因组数据,利用进化基因组学研究系统进化。

目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面[2](如图1)。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学[2]、基因注释的等方面;在新基因方面主要分析基因产生机制和新基因固定及其动力学研究。 图1 进化基因组学主要研究内容 目前进化基因组学的研究有力的解决了一些基础性的进化问题,但也出现了一些未来需要急需解决的挑战。例如生物进化的本质和目前重建系统进化树方法的限制[1]。 2研究进化基因组学的方法 研究进化基因组学的方法主要包括利用基因组数据分析和研究新基因的产生和演化两种。 2.1利用基因组数据进行系统进化分析 利用基因组数据进行系统进化分析,常有基于基因序列的方法和基于全基因特征的方法。(如图2)

基因组学(结构基因组学和功能基因组学).

问:基因组学、转录组学、蛋白质组学、结构基因组学、功能基因组学、比较基因组学研究有哪些特点? 答:人类基因组计划完成后生物科学进入了人类后基因组时代,即大规模开展基因组生物学功能研究和应用研究的时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。以功能基因组学为代表的后基因组时代主要为利用基因组学提供的信息。 基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(struc tural genomics和以基因功能鉴定为目标的功能基因组学(functional genomics。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。 功能基因组学(functional genomics又往往被称为后基因组学(postgenomics,它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。 基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。 功能基因组学

真菌生命树的系统发生和系统基因组学

真菌生命树的系统发生和系统基因组学 近二三十年来,分子系统发生学从最初的建立到不断发展,已成为真菌的比较生物学的重要研究手段。曾经仅局限于分类学的系统树如今已广泛地应用到真菌生物学中并为了解主要生命形式的进化、描述复杂的生物群落以及实验生物学的预测提供了广泛的进化进化理论基础。在基因组领域这一趋势愈发显著,系统发生学和基因组学逐渐结合到一起并孕育出了一门崭新的学科—系统基因组学。虽然这是一门年轻的学科,但它已经应用到通过进化关系来预测同源性和不规则基因,以及基于基因组范围的对离散同源序列数据基因组的最大量—至少是大量—的采样对比分析。下面,让我们来了解一些目前这一领域的相关进展:(i)基于多基因系统发育的真菌系统发生学目前的地位;(ii)目前在分类真菌界里的进化关系中的进化假说;(iii)通过基因组采样来推断进化关系的应用。 真菌分子系统学 作为真菌分子系统发育的第一个领域,rRNA在鉴定推断这一界的系统发生关系时发挥了极其重要的关系。rRNA以各种形态广泛分布在自然界中,含有核苷酸保守区域,并以此为基础促进了宇宙原初物种的进化。既而,rRNA核苷酸数据的收集和排序也因此变得浅显易懂并使真菌分子系统发生的研究从上世纪90年代开始呈指数级增长。虽然这些分析仅是基于少量的数据,但是针对真菌和类真菌的系统发生的研究已取得了大量的里程碑式的发现。这些发现包括异鞭毛水霉菌和黏液菌的胞外替换,动物界和真菌界间的封闭进化关系识别,壶菌,结合菌,担子菌,子囊菌的单元菌物鉴定,子囊菌和担子菌的单源支持及他们间的姊妹组关系。 ??尽管取得了这些进展,由于rRNA数据仅限于与之相关的功能,要不断地了解真菌世界的进化过程还需要掌握更多相似不同源基因,特别是蛋白质编码的基因。由于在真菌系统中最大的两个RNA聚合酶(RPB1 RPB2)和翻译延伸因子TEF广泛地得到应用,PCR技术和测序引物也随之得到极大发展。这些基因提供了对rRNA系统发育的测评支持,并提供了更多形态学和生物学上的稳定性测试,他们还提供了起始多基因系统发生产生的未加工数据,致使真菌系统发生从基因树形式过渡到物种树。 ??为使多基因系统发生得到进一步发展,真菌系统协会创办了Research Coordination Network Deep Hypha.该协会的主要宗旨在于加快收集真菌系统生命树的多基因序列数据采集。这也是AFTOL工程的贡献之一。该工程推动了以下六方面的核苷酸序列采集:细胞核小亚基rRNA,细胞核大亚基rRNA,线粒体小亚基rRNA,RPB1,RPB2和TEF---真菌中目和科的分类单元目标集(Lutzoni et al., 2004)。AFTOL筹集了2000多个分类单元的5000多条公开可用序列并发展了真菌中额外引物的数据采集(更多完整序列及引物请登录WASABI研办的网站:https://www.doczj.com/doc/6e13914365.html, Kauffet al.,2007])。在多基因数据集的采集日趋完善的同时,基于模型的复杂核苷酸序列数据集系统发生分析算法也在不断发展。由于电脑处理器愈发强大以及相关计算分析软件的支撑(如:RAxML [Stamatakis,2006] GARLI [Zwickl,2008] MRBAYES[Ronquist and Huelsenbeck, 2003] and PhyloBayes [Lartillot and Philippe,2004] ),对大型多基因数据集的最大似然估计和贝叶斯计算如今也得到广泛应用。今年来对多基因编码数据的强化分析也提高了系统发生的分辨率测算(Matheny et.al.,2007; Hofstetter et.al.,2007),并且证明了蛋白质编码的基因RPB1,RPB2和TEF比rRNA基因拥有更高层次的系统发生信息量(Townsend,2007; schoch et.al.,2009)。当我们把筹集相对大的多基因序列以及分析他们的能力有机地结合在一起时,我们就获得了目前对于真菌进化的最精确的了解。 真菌生命树 这里提到的真菌生命树,我们是指单源种的真菌界以及其下的各个亚门中所包含的。简明起见,这里不再讨论真菌以外的其它门类(例如:卵菌门),尽管他们很重要并且很多学者也在研究。我们的讨论将集中在更高级的分类学中,侧重于真菌进化中主要的真菌进化枝。

环境基因组学的研究进展及其应用

环境基因组学的研究进展及其应用 贾海鹰 张徐祥 孙石磊 赵大勇 程树培* (南京大学,环境学院,南京,210093) E-mail(jhy194@https://www.doczj.com/doc/6e13914365.html,) 摘 要:本文系统地介绍了环境基因组学的基本概念、研究的主流技术平台及其在环境污染控制、健康风险检测与评价等方面地应用,并阐明了环境基因组学与生物信息学两者之间的关系。环境基因组学在分子水平上揭示了环境污染物与生物之间的相互作用,为检测、控制环境污染维护环境健康注入了新的活力。 关键词:环境基因组学 生物信息学 健康风险评价 环境污染 环境健康 1.引言 2003年4月14日,人类基因组计划(Human Genome Project)顺利完成。HGP成功地绘制出了遗传图谱、物理图谱、序列图谱和转录图谱4张图谱。这标志着人类基因组计划的所有目标全部实现。至此,HGP的研究发生了翻天覆地的变化,已从结构基因组学研究时代进入了功能基因组(后基因组)时代[1-2],因此也就有了“人类后基因组计划”。HGP正朝着生物信息科学、计算机生物技术、数据处理、知识产权及社会伦理学研究等多方面发展,对生命科学、环境科学、医疗卫生、食品制药、人文科学各领域产生了广泛而深远的影响。环境基因组学(environmental genomics)是在人类基因组基础上发展的功能基因组内容之一,由基因组学和环境科学交叉融合而成,是一个近期发展起来的新型边缘学科,是基因组学技术和成果在环境污染保护与控制和生态风险评价中的应用,在其发展的短短的几年时间内已渗透到环境科学研究的各个研究领域并发挥着日益重要的作用。 2.环境基因组学的概念与定义 至今,国内外学者对环境基因组学还没有统一明确的定义。但是,大多数学者认为,环境基因组学(environmental genomics)的概念与毒理基因组学(toxicogenomics)密切相关。自从1999年Nuwaysir等[3]首次提出毒理基因组学概念至今,在短短的八年的时间里这一概念不断地发展和完善着。目前人们普遍采纳的定义有两种,一种是美国国家毒理学规划机构给出的定义[3]:毒物基因组学是研究外来化学物对基因活性和基因产物的影响及相互作用的科学;另一种是由世界卫生组织给出的定义[3],认为毒物基因组学是一门与遗传学、基因组水平上RNA表达(转录组学) 、细胞和组织范围的蛋白表达(蛋白质组学)、代谢谱(代谢组学) 、生物信息学和常规毒理学结合,以阐明化学物作用模式和基因-环境相互作用的潜在意义的科学。1998年4月4日,美国国会顾问环境卫生科学委员会正式投资专项基金进行环境基因组计划研究,其目的是专门研究与环境相关疾病的遗传易感性,寻找对化学损伤易感的基因,鉴定对环境发生反应基因中有重要功能的多态性,并确定它们在环境暴露引起疾病的危险度方面的差异;在疾病流行病学中研究基因与环境的相互作用,从而改善遗传分析技术,优化研究设计,建立样品资源库,把公用的多态性应用于社会、法律和伦理学[4-7]。2001年,Miller 提出环境基因组(Environmental Genomics)是在人类基因组(HGP)基础上发展起来的后 - 1 -

基因组学答案

1.什么是基因组学?基因组学有哪些特点? 以基因组分析为手段,研究基因组的结构组成、时序表达模式和功能,并提供有关生物物种及其细胞功能进化信息的一门学科。特点:Genome sciences are sequence-based,Genome sciences are data-guided (not so hypothesis-driven),Genome sciences is a systematic approach。 2.什么是模式生物? 生物学家通过对选定的生物物种进行科学研究,用于揭示某种具有普遍规律的生命现象,此时,这种被选定的生物物种为模式生物。在人类基因组计划中,包括对五种生 物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。 3.人类基因组计划是哪一年完成的?在科学上有什么意义? 2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。 意义: 首先,获得人类全部基因序列将有助于人类认识许多遗传疾病以及癌症等疾病的致病机理,为分子诊断、基因治疗等新方法提供理论依据。 第二,破译生命密码的人类基因组计划有助于人们对基因的表达调控有更深入的了解。4.基因组学的发展方向是什么? 5. 3 大公共DNA 数据库名称是什么? EMBL,GenBank,DDBJ。 6.什么是一级数据库和二级数据库? Primary Databases:Original submissions by experimentalists,Content controlled by the submitter。 Derivative Databases:Built from primary data,Content controlled by third party。 7.什么是NCBI 的Refseq?什么是Unigene?Unigene 和Refseq 的区别和联系。 RefSeq (accessible via the main page of NCBI) provides an expertly curated accession number that corresponds to the most stable, agreed-upon “reference” version of a sequence. Unigene:MegaBlast based automated sequence clustering,Nonredundant set of gene oriented clusters,Each cluster a unique gene,Information on tissue types and map locations,Includes known genes and uncharacterized ESTs,Useful for gene discovery and selection of mapping reagents。 8.GEO 是什么类型数据库,主要包含什么类型数据? 9.大致介绍一下UCSC GENOME BROWSER? Stands for “Encyclopedia Of DNA Elements”,Public research consortium to carry out a project to identify all functional elements in the human genome sequence,Launched by The National Human Genome Research Institute (NHGRI),Conducted in three phases:pilot project phase,technology development phase,planned production phase。 10.HAVANA 基因是什么类型数据? 11.什么是细菌人工染色体(BAC) 是指一种以F质粒(F-plasmid)为基础建构而成的细菌染色体克隆载体,常用来克隆150kb左右大小的DNA片段,最多可保存300kb个碱基对。 12.什么是遗传图谱?用来构建遗传图谱的标记有哪些?

叶绿体DNA(cpDNA)研究与植物系统学

一.叶绿体DNA(cpDNA)研究与植物系统学 1. 分子系统学研究中常用的标记 分子生物学技术的发展为植物育种提供了一种基于DNA变异的新型遗传标记——DNA分子标记,或简称分子标记。与传统应用的常规遗传标记相比,分子标记具有许多明显的优点,因而已被广泛应用于现代作物遗传育种研究的各个方面,大量以前无法进行的研究目前利用分子标记手段正蓬勃开展,并取得丰硕的成果。尤其是当分子标记技术走出实验室与常规育种紧密结合后,正在为植物的系统学研究带来一场新的变革。 目前用于植物系统进化、遗传多样性以及植物地理学研究的分子标记和方法有多种。总体来看可以分为4类,即:(1)蛋白质标记;(2)DNA序列分析;(3)DNA指纹分析;(4)DNA构象变化与SSCP 分析[1]。 DNA序列可以直接反映物种的基因型,并记录进化过程中发生的每一个变化,含有极为丰富的进化信息。依据DNA序列上的差异来比较植物的亲缘和演化关系,可以为植物系统与进化研究提供最直接的证据。当前用于研究的DNA序列主要分为两大类:叶绿体基因组(Chloroplast DNA,cpDNA)和核基因组(nuclear DNA,nDNA)本文采用的是叶绿体DNA(cpDNA)序列分析,故在此主要接介绍cpDNA序列分析。 2.cpDNA 叶绿体基因组(cpDNA)占植物总基因组DNA的10-20%,为

双链闭环结构,一般为120-220kb(多在120-160kb之间),被2个长约22-25kb的反向重复序列(IR)分成大拷贝区(LSc)和小两个单拷贝区(SSC)。 在过去二十年里,.植物系统学家们依据叶绿体DNA序列进行了大量的系统发育分析[2]。因为cpDNA具有一下优势:第一,叶绿体基因组在植物细胞中虽为多拷贝,但其序列都是一样的,便于操作[3];第二,叶绿体基因组是单亲遗传的,不存在核基因中出现的基因重组等问题;第三,由于叶绿体基因组序列的保守性,扩增叶绿体片段的引物是通用的;第四,非编码区的叶绿体DNA具有更多的信息位点,且测序的工作量不大,更适合于低等级类群的系统发育研究。尽管叶绿体基因在系统发育研究中有众多优点,但仍然存在不少缺点限制其使用[4]首先,相对缓慢的进化速率使得叶绿体基因序列在系统发育研究应用中局限于较高等级的类群;其次,由于是单亲遗传(在被子植物中是母系遗传),叶绿体DNA序列只能够推断杂交物种形成中的母系来源,比较适合于低等级类群的系统发育研究。如Araujol 等(2003)利用2个叶绿体片段研究柑橘亚科12个属的系统进化关系[5]。Makarevitch等〔2003)使用cpDNA(trnL和trnL-trnF基因间隔区)和RAPDs对22种俄罗斯莺尾进行研究,认为其中16个种来自亚属Subgen.Limniris下亚组sect.Limniri[6]。 目前常用的片段有两种类型,即叶绿体基因的编码区和非编码区。由于进化速率不同,两种片段分别用于解决不同的系统学问题。

9 人类基因组研究

9.1人类基因组计划简介 人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法国、德国、日本和我国科学家共同参与了这一价值达30亿美元的人类基因组计划。这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。与曼哈顿原子弹计划和阿波罗登月计划并称为三大科学计划。 1986年,诺贝尔奖获得者Renato Dulbecco发表短文《肿瘤研究的转折点:人类基因组测序》(Science, 231: 1055-1056)。文中指出:如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。…… 从哪个物种着手努力?如果我们想理解人类肿瘤,那就应从人类开始。……人类肿瘤研究将因对 DNA 的详细知识而得到巨大推动。” 什么是基因组(Genome)?基因组就是一个物种中所有基因的整体组成。人类基因组有两层意义:遗传信息和遗传物质。要揭开生命的奥秘,就需要从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。

为什么选择人类的基因组进行研究?因为人类是在“进化”历程上最高级的生物,对它的研究有助于认识自身、掌握生老病死规律、疾病的诊断和治疗、了解生命的起源。 在人类基因组计划中,还包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。 HGP的目的是解码生命、了解生命的起源、了解生命体生长发育的规律、认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。 HGP的诞生和启动: 对人类基因组的研究在70年代已具有一定的雏形,在80年代在许多国家已形成一定规模。 1984年在Utah州的Alta,White R and Mendelsonhn M受美国能源部(DOE)的委托主持召开了一个小型专业会议讨论测定人类整个基因组的DNA序列的意义和前景(Cook Deegan RM,1989) 1985年5月在加州Santa Cruz由美国DOE的Sinsheimer RL主持的会议上提出了测定人类基因组全序列的动议,形成了美国能源部的“人类基因组计划”草案。 1986年3月,在新墨西哥州的Santa Fe讨论了这一计划的可行性,随后DOE 宣布实施这一计划。 1986年遗传学家McKusick V提出从整个基因组的层次研究遗传的科学称为“基因组学” 1987年初,美国能源部和国立卫生研究院为HGP下拨了启动经费约550万美元(全年1.66亿美元) 1988年,美国成立了“国家人类基因组研究中心”由Watson J出任第一任主任

植物基因组学的的研究进展

基因组学课程论文 题目:植物基因组学的的研究进展姓名:秦冉 学号:11316040

植物基因组学的的研究进展 摘要:随着模式植物——拟南芥和水稻基因组测序的完成,近年来关于植物基因组学的研究越来越多。本文主要对拟南芥、水稻2种重要的模式植物在结构基因组学、比较基因组学、功能基因组学等领域的研究进展以及研究所使用的技术方法进行简单介绍。 关键词:植物;基因组学;研究进展 The recent progress in plant genomics research Abstract: With the completion of genome sequencing ofthe model plant-- Arabid opsis and rice,more and more researches on plant genomics emerge in recent yea rs. The research progress of the 2 important model plant--Arabidopsis and rice in structural genomics,comparative genomics,functional genomics and technology methods used in this research are introduced briefly in this paper. Keywords:plant; genomics; research advances 前言 基因组是1924年提出用于描述生物的全部基因和染色体组成的概念。1986年由美国科学家Thomas Roderick提出的基因组学是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学。自从1990年人类基因组计划实施以来,基因组学发生了翻天覆地的变化,已发展成了一门生命科学的前沿和热点领域。而植物基因组研究与其他真核生物和人类基因组研究有很大的不同。首先,不同植物的基因组大小即使在亲缘关系非常近的种类之间差别也很大; 其次,很多植物是异源多倍体,即便是二倍体植物中有些种类也存在较为广泛的体细胞内多倍化( endopolyp loidy)现象[1]。基因组研究主要包括三个层次:①结构基因组学,以全序列测序为目标,构建高分辨率的以染色体重组交换为基础的遗传图谱和以DNA 的核苷酸序列为基础的物理图谱。②功能基因组学,即“后基因组计划”,是结构基因组研究的延伸,利用结构基因组提供的遗传信息,利用表达序列标签,建立以转录图谱为基础的功能图谱( 基因组表达图谱),系统研究基因的功能,植物功能基因组学是当前植物学最前沿的领域之一。③蛋白质组学,是功能基因组学的深入,因为基因的功能最终将以蛋白质的形式体现。 近来,以水稻( Oryza sativa)和拟南芥(Arabadopsis thaliana)为代表的植物基因组研究取得了很大进展,如植物分子连锁遗传图谱的构建,在此基础上,已经在植物基因组的组织结构和基因组进化等方面得到了有重要价值的结论; 植物基因组物理作图和序列测定的研究集中于拟南芥和水稻上; 植物比较基因组作图证实在许多近缘植物甚至整个植物界的部分染色体区段或整个基因组中都存在着广泛的基因共线性,使得我们可以利用同源性对各种植物的基因组结构进行研究、分析和利用。本文主要对拟南芥、水稻2种重要的模

相关主题
文本预览
相关文档 最新文档