当前位置:文档之家› 真菌生命树的系统发生和系统基因组学

真菌生命树的系统发生和系统基因组学

真菌生命树的系统发生和系统基因组学
真菌生命树的系统发生和系统基因组学

真菌生命树的系统发生和系统基因组学

近二三十年来,分子系统发生学从最初的建立到不断发展,已成为真菌的比较生物学的重要研究手段。曾经仅局限于分类学的系统树如今已广泛地应用到真菌生物学中并为了解主要生命形式的进化、描述复杂的生物群落以及实验生物学的预测提供了广泛的进化进化理论基础。在基因组领域这一趋势愈发显著,系统发生学和基因组学逐渐结合到一起并孕育出了一门崭新的学科—系统基因组学。虽然这是一门年轻的学科,但它已经应用到通过进化关系来预测同源性和不规则基因,以及基于基因组范围的对离散同源序列数据基因组的最大量—至少是大量—的采样对比分析。下面,让我们来了解一些目前这一领域的相关进展:(i)基于多基因系统发育的真菌系统发生学目前的地位;(ii)目前在分类真菌界里的进化关系中的进化假说;(iii)通过基因组采样来推断进化关系的应用。

真菌分子系统学

作为真菌分子系统发育的第一个领域,rRNA在鉴定推断这一界的系统发生关系时发挥了极其重要的关系。rRNA以各种形态广泛分布在自然界中,含有核苷酸保守区域,并以此为基础促进了宇宙原初物种的进化。既而,rRNA核苷酸数据的收集和排序也因此变得浅显易懂并使真菌分子系统发生的研究从上世纪90年代开始呈指数级增长。虽然这些分析仅是基于少量的数据,但是针对真菌和类真菌的系统发生的研究已取得了大量的里程碑式的发现。这些发现包括异鞭毛水霉菌和黏液菌的胞外替换,动物界和真菌界间的封闭进化关系识别,壶菌,结合菌,担子菌,子囊菌的单元菌物鉴定,子囊菌和担子菌的单源支持及他们间的姊妹组关系。

??尽管取得了这些进展,由于rRNA数据仅限于与之相关的功能,要不断地了解真菌世界的进化过程还需要掌握更多相似不同源基因,特别是蛋白质编码的基因。由于在真菌系统中最大的两个RNA聚合酶(RPB1 RPB2)和翻译延伸因子TEF广泛地得到应用,PCR技术和测序引物也随之得到极大发展。这些基因提供了对rRNA系统发育的测评支持,并提供了更多形态学和生物学上的稳定性测试,他们还提供了起始多基因系统发生产生的未加工数据,致使真菌系统发生从基因树形式过渡到物种树。

??为使多基因系统发生得到进一步发展,真菌系统协会创办了Research Coordination Network Deep Hypha.该协会的主要宗旨在于加快收集真菌系统生命树的多基因序列数据采集。这也是AFTOL工程的贡献之一。该工程推动了以下六方面的核苷酸序列采集:细胞核小亚基rRNA,细胞核大亚基rRNA,线粒体小亚基rRNA,RPB1,RPB2和TEF---真菌中目和科的分类单元目标集(Lutzoni et al., 2004)。AFTOL筹集了2000多个分类单元的5000多条公开可用序列并发展了真菌中额外引物的数据采集(更多完整序列及引物请登录WASABI研办的网站:https://www.doczj.com/doc/269459605.html, Kauffet al.,2007])。在多基因数据集的采集日趋完善的同时,基于模型的复杂核苷酸序列数据集系统发生分析算法也在不断发展。由于电脑处理器愈发强大以及相关计算分析软件的支撑(如:RAxML [Stamatakis,2006] GARLI [Zwickl,2008] MRBAYES[Ronquist and Huelsenbeck, 2003] and PhyloBayes [Lartillot and Philippe,2004] ),对大型多基因数据集的最大似然估计和贝叶斯计算如今也得到广泛应用。今年来对多基因编码数据的强化分析也提高了系统发生的分辨率测算(Matheny et.al.,2007; Hofstetter et.al.,2007),并且证明了蛋白质编码的基因RPB1,RPB2和TEF比rRNA基因拥有更高层次的系统发生信息量(Townsend,2007; schoch et.al.,2009)。当我们把筹集相对大的多基因序列以及分析他们的能力有机地结合在一起时,我们就获得了目前对于真菌进化的最精确的了解。

真菌生命树

这里提到的真菌生命树,我们是指单源种的真菌界以及其下的各个亚门中所包含的。简明起见,这里不再讨论真菌以外的其它门类(例如:卵菌门),尽管他们很重要并且很多学者也在研究。我们的讨论将集中在更高级的分类学中,侧重于真菌进化中主要的真菌进化枝。

目前真菌包含1个亚界,6个类群,10个亚门,35个纲,12个亚纲以及129个目(Hibbett Et.al.,2007)。这些分类群主要是以系统发生学的分析为基础区分,并能支持对单源群种的研究。因此,一些传统意义上的分类并未被编入此分类办法中,其他门类的真菌(如,壶菌)对此有更为精细的用途。毋庸赘言,随着近年来更细致地研究,这个分类办法也随之得到完善,基于这一标准的多基因分类系统发生学分析也应提供更为可信的准则。Hibbett提出的命名法是基于在2007年最初被Eriksson 和Wynka应用到子囊菌门中的相关命名细则,这就是说,针对更高级的分类命名必须具有详尽的描述以及归入合理的种类,唯有如此方能消除之前的命名中存在的混淆和不确定性。

真菌生命树的早期家系分枝

对于真菌生命树的早期家系分类包含早期被分类在壶菌门中的游动孢子类(James et. Al.,2006),结核菌门中的无鞭毛丝状真菌(White et. al.,2006)和小孢子目(Keeling and Fast 2002)(见图1)。小孢子目主要是一类单细胞的动物细胞内寄生虫(Gill and Fast 2006;Liu et.al.,2006),他们的系统发生学替换一直存在争议。他们拥有高度退化的基因组及相对高的核苷酸替换率(Keeling and Slamovits,2004)。继而,相比起其它分类来说,他们拥有更少的轮廓鲜明的共同直系同源基因的。由于这些基因明显属于直系同源,核苷酸位置上的同源性往往很难获得,这还体现在显著的核苷酸替换率以及DNA分子复杂的平面构型上。起初小孢子目被分类在真核原生生物界,这被公认为为了分类上的简便性以及是属于非单源的。近来的针对蛋白质编码数据的系统发生学分析则支持了小孢子目是真菌界家系的早期分枝(Keeling,2003;James et. al., 2006),或者至少是真菌界的一个姊妹类群(Liu et al., 2006)。Hibbett亦是按照前面提及的配置将小孢子目归为真菌的一类。其中更为激发人们的一个关于小孢子目系统发育的假设是由James在2006年提出的,基于5个细胞核基因和1个线粒体位点,该假设认为小孢子目属于Rozella, 壶菌的一类,是其它真菌的细胞内寄生物,这形成了真菌最早的进化分枝。当然,不得不说,这也有可能是分子进化研究中由于常规手段的疏漏而造成一个分类上的误区。一个更近期的对基因组组构的分析通过同线性模型的性位点提供了对这个分析模型关系的支持。由此可见,对于小孢子目和Rozella, 的定位仍旧难以捉摸,这两个重要分类的区划仍需后续研究。

尽管已知游动孢子(有鞭毛的)由一个<1000的真菌物种群体组成,但要了解早期该门类关键的系统发生关系仍需更为精确的细节。所有的游动孢子类别均会产由本应只具有单根鞭毛的多鞭毛游动孢子。直到前些年真菌中的游动孢子的类别才被编目到壶菌中(Barr,1992)。通过对多基因的系统发生分析才得出壶菌的组成并不是单源的(James et. al., 2000,2006a 2006b)。并且,这些真菌中的多源家系占据了大部分的真菌生命树的较原始的分枝。

双核亚界

双核亚界包括大多数已知的真菌物种(大于95000种),还包括子囊菌和担子类群。通过判断在整个生命进程中是否出现常规的菌丝和一个双核状态来确定属不属于双核亚界,尽管两个类群在整个生命周期内的构成部分有很大差别。典型的是,双核状态在担子菌门中是个历时长久的、生长迅速的状态。但对于子囊菌类来说,双核状态是个短暂的产囊或性生殖状态。在多核亚界中真菌也出现多细胞生物(子实体量产),它像一个独立的产品在子囊菌类和子但菌类中进化发展。

担子菌门包括三个亚门:柄锈菌亚门、黑粉菌亚门和伞菌亚门。正如之前提过的,为避免混淆单元名称和非正式名称,每个亚门都以一个属别来命名。然而,这些亚门在生态和形态上有所不同,分别还包括锈菌类、黑粉菌类和蘑菇。三种亚门之间彼此的关系还不完全清楚,

目前只是以担子菌为主干网,描绘并把它们分成了三个类群。

柄锈菌亚门是第二大亚门,包含了八类和十八种。尽管大多数研究人员对锈菌类很熟悉,但这个亚门还包括担子菌类酵母、黑粉真菌、昆虫共生体以及之前归类为子囊类的真菌。因此,柄锈菌亚门是又一个更为多样的分支。由于它们经常处于活体营养的性质和复杂的生活史,现在仍然是一个更具挑战性的实验群体。

黑粉菌亚门包括两类九种及大多数植物的病原-黑粉真菌。它存在于柄锈菌亚门和黑粉菌亚门中,因此我们可以看到冬孢子的产生,核配和减数分裂发生在这些包子的原菌丝上。

三菌亚门包括三类(分别是银耳纲、花耳纲和伞菌纲)和二十一种由孢子果形成的肉质担子菌门。伞菌亚门中银耳纲是最早分叉的血统,他包括胶质菌类和有丝状酵母生长形式的物种。这些真菌包括木头衰变的中介菌、真菌寄生物及医学上对人类越来越重要的病原体。花耳纲也产生凝胶状的孢子果,这些常常是木质产物。,但它们的祖先与伞菌纲的更为相似,而不是银耳纲。伞菌亚门包含所有的肉质担子菌类,特别是蘑菇、牛肝菌、海螺、痂和尘菌,它代表了已知担子菌门中最大的群体及尚存在争议,与森林系统息息相关的最为重要的真菌,包括外生菌根、树木的致病菌还有木头、垃圾衰变的中介菌。它还包括绝大多数在蘑菇产业中普遍培养的种类(例如:中国黑果冻蘑菇、小蘑菇、香菇、平菇)和一些更为值钱的烹饪蘑菇(例如:鸡油菌、牛肝菌、松茸)。一些更具特色的生物模型,从担子菌类基因学和细胞生物学的角度来说,也都属于伞菌亚门。

对担子菌门的形态和生态进化特征方面的了解已经有了可观的突破,这些对了解其基因发展史有重要意义。有隔膜的担子和重复性的孢子萌发是柄锈菌亚门的代表,黑粉菌亚门、银耳纲、花耳纲和伞菌纲很有可能是担子菌的祖先,传统无隔担子和担子萌发受限于牙管的形成,目前限制到了伞菌亚门。腐生生态是多个独立派生根菌血统的祖先。最后,孢子果形态学对进化关系的预测不准。这或许是对分子系统最为戏剧性的影响,正如许多之前存在的关于进化关系及他们的关系的假设都是建立在孢子形态学的基础上的。利用分子系统学对孢子形态学的祖先特征状态进行重组,反映出孢子形态学是在真菌进化中更为可靠的特征。这些在所有的主要孢子形态学都显现了出来(例如:蘑菇、尘菌、海螺、痂等等),并在担子菌门的整个进化过程中已经被追溯过多次。目前,在伞菌亚门中有十一个被认可的酵母分支,其中大多数都与孢子形态学相关。

真菌生命树的系统基因组学

系统基因组学最初的时候得到比较广泛的推广应用并产生了很多不同的定义(Philippe et al.,2005; Delsuc et al.,2006)在这里我们主要关注其在基因组规模上的数据系列。目前,真核生物中真菌的已测序基因组远多于其它界(https://www.doczj.com/doc/269459605.html,/ and https://www.doczj.com/doc/269459605.html,/genome)这其中大部分是子囊菌,进来由于在取样时存在一定的针对性尤其是在树木泛滥组织、植物、以及人类病原上的愈发关注似的担子菌被人们认识得越来越多。许多真菌分枝的模式基因组缺少序列信息,特别是一些较原始的家系。这一情况主要是由于对分类采样的过度依赖,以及错误认为过度采样更有利于系统发生的相关分析。随着基因组测序成本逐渐降低并在很多分子实验室得到普及,这一境况将会明显好转。下面我们来大致看一下一些分析方法如同源探测及节点支持推断,我们还提供了一个简明的对已录真菌的系统发生基因组学分析。

直系同源探测及节点支持

由于分子系统发生学依靠其对直系同源基因的分析,若对基因树相似复制产生错误分析将导致对物种树的错误估计。逻辑倒错问题在很大程度上影响了基因组数据,特别是在由于基因缺失或重叠导致的对基因家系特征未知的基因上这一现象更为明显。为了解开这些复杂的直系同源模式,不同的运算法则及方法随之应运而生。大量的运算法则和方法被用来估测他们的同源性。蛋白的直系同源组也被应用到对基因组的注解中。

近来,Kazniar等于2008年对已公布的各种相关程序及数据库从他们的优点及劣势方面作了一个浅显易懂全面的测评。一些主要的探测方法可通过直系同源数据库预测编译。(COCOCL [Jothi et al.,2006];Orthostrapper[Storm and Sonnhammer,2002];LOFT[Van der Heijden et al.,2007]; RIO [Zmasek and Eddy,2002]),其它的则是一些可从头开始的程序。如Inparanoid(Remm et al.,2001)、Ortholuge(Fulton etal,2006)和Ortho MLC(Lietal.,2003)。这些从头开始的程序中只是后两个可以对多基因组作直系同源预测。此外,Markvo的取样方法比依靠手工置模的KOG(Tatusov et al.,2003)更为可靠。

从某种程度上来说,这些Markvo簇类方法使不同级别的假阴性和假阳性错误率中的敏感度和特异性得到平衡(Chen et al.,2007)。这种错误率可通过详细测绘并有良好注解的基因模型来估量。将近来测序的基因数据应用到系统发生分析中去的合并应用将能囊括假阴性(包括非直系同源的蛋白)和假阴性(除去直系同源蛋白)的释例。毋庸置疑,这一领域的研究将在接下来的几年中慢慢成熟。

早期的系统发生分析发展进程中给我们的两个重要启示是个体基因树间的冲突及在某些特定的进化枝中对节点支持的估计或是统计置信度的不确定。随着基因组水平上的数据进一步得到分析,具有重效基因的更大组别的基因将能被查明(Rokas et al.,2003)。这种矛盾毛事克能越来越易被发现并需要被传导的单拷贝直系同源基因的选择(Robbertse et al.,2006),对精确DNA及进化氨基酸模型的应用(Philippe et.al.,2005;Liu et al.,2009)以及系统发生冲突的可伸缩测试(Felsenstein,1985)等的支持。

在传统的系统发生分析中,节点支持的长剑手段采用非参数的辅助程序(Felsenstein,1985),BPs,或是用后验概率(Ronquist and Huelsen beck,2003)。后者被更多认为是一类自由度较高的统计方法,大家更为重视BPs(Suzuki et al.,2002; Alfaro et al.,2003;Taylor and Piel,2004)。重要的是通过BPs得到的不是一个置信区间,当输入大于70%到75%的引导比例时,里面的每一个节点都将被充分用来作支持(Lutzoni et al.,2004)。当将其应用到系统发生基因组学的分析时,BPs很少会出现低于70%到75%的情况,尽管其中的一些节点并不稳定,这作为不同的方法在同源性探测作用到预设同源直系蛋白的不同组别是带来了麻烦,这一困扰目前仍旧未得到解决。由于在进行分类抽样和象征抽样时用到的方法及知识理论不同,所以我们应该保守地看待BPs,分析中的差异程度也反应了BP作为一个已知节点的特性。

真菌全基因组范围的系统发育分析

第一个包含真菌序列的全基因组系统发育分析是于2003年被Rocks等完成的,这项研究从酵母中选取了106个基因进行分析,这106个基因树反映在20个交替的拓扑结构上,对全部106个基因的连锁排列分析得出了一个极可靠的拓扑结构,这与之前提及的20个交替单基因拓扑结构至少在一个方面吻合。Jeffroy等在2006年分析了同样的106个基因,在分类单元取样中补充了14个酵母物种。他们的分析解释了个体基因树间的不一致是由于偏差度、饱和度和研究方法上的不同造成的。之后的一些相关研究也证明了WGD(全基因组复写)和TG(组织翻译CTG时用丝氨酸代替亮氨酸)这两个是属于酵亚门的分枝。

Robbertse等在2006年完成了对子囊菌门的更广泛的取样,他们的分析包括17个类

群(酵母亚门4种,盘菌亚门10种,裂殖酵母亚门1种,担子菌2种)的781个串联体排列的基因,用最大似然法分析显示拓扑结构一致,然而对S taganosporanodorum(座囊菌唯一的代表分类单元)的最大保守分析却得到了与上述不同的结果。其它科学家也发现了类似的不确定性。不过值得一提的是,Robbertse等在2006年将直系同源的发现、蛋白排列及系统发育判断三者结合起来阐述了其在半自动计算的传输管道中的功效。

Fitzpartick等在2006年通过扩大真菌分类单元的取样方法得到了真菌中42个物种(盘菌17种,酵母19种,外囊菌1种,担子菌1种,接合菌1种)的关系,该分析基于对4805个单基因的超级树分析和对153种广泛分布的直系同源分析。该研究鉴定得出了酵母中CTG 分枝中的两个目均具有有性阶段,上述研究与其它一些研究(Robbertse等,2006;Liu等2009)偏向于认为leotiomycetes-Sordariomycetes姊妹组应排除在盘菌目之外,这样便解决他们的单囊壁、无囊盖子囊的同源性,并在超科目水平上阐明了子实体在形态学上的可塑性。

Liu等在2009年第一次对核基因和线粒体基因数据的大规模比对后进行了一次系统发育基因组分析,其间涉及到包括全基因组式EST序列在内的113种核基因及13种线粒体基因。为了确定外子囊目的单系,取样来自16种盘菌,13种酵母,4种外囊菌,10种担子菌,6种接合菌,5种壶菌。由于用到了EST序列,所有的113种都存在数据丢失的情况,只有1个单蛋白能代表所有的54类,每一类平均丢失25%的数据。该文章的作者认为丢失的数据并不会显著影响系统发育的分析,但这些丢失确实引起了核基因与线粒体基因间的矛盾。他们给出了快速进化的点位置从而使他们的分析能够支持外囊菌是单源的并且是更偏于酵母亚科的一个姊妹组。

结语

多基因分析对真菌系统发育产生的主要影响体现在它使我们在弄清楚整个真菌界的进化关系时有了确定的年代(Blackwell et al.,2006; Hibbett et al., 2007)。全基因组测序包含异质基因测序的出现把系统发育的问题和分离同源的序列数据最大量紧密地结合了起来,尽管基因组区域为我们提供了充足的基因及其序列数据,在对直向同源基因估测、分析问题序列数据、快速进化的位点以及异源超基质时仍存在重要挑战。

分类采样技术上的障碍是目前影响在基因组规模上进行系统发生分析的主要因素,我们应侧重于对真菌主要进化枝上的研究。最后,在向更为宽广的真菌分类采样进军时,把高生产力的技术手段应用到小的真核基因组和cDNA文库里将能使对系统发育分析有用的序列数据种类更为多样化,并将可能孕育出新的研究手段。

进化基因组学研究进展

研究进化基因组学进展 摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。 关键词:进化基因组学系统进化比较基因组学新基因 正文 随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学。 近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。 研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们可以分析基因组数据,利用进化基因组学研究系统进化。 一、目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学、基因注释的等方面;在新基因方面

基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物 具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成 新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。 外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌 基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。 非编码序列扩张方式:滑序复制、转座因子 模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低 如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子 内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。 基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短 基因功能的检测:基因失活、基因过表达、RNAi干涉 双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。 要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。 酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制 合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。 遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁 衡量遗传图谱的水平覆盖程度饱和程度 基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因 基因组(genome):生物所具有的携带遗传信息的遗传物质总和。 基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

基因组学(结构基因组学和功能基因组学).

问:基因组学、转录组学、蛋白质组学、结构基因组学、功能基因组学、比较基因组学研究有哪些特点? 答:人类基因组计划完成后生物科学进入了人类后基因组时代,即大规模开展基因组生物学功能研究和应用研究的时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。以功能基因组学为代表的后基因组时代主要为利用基因组学提供的信息。 基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(struc tural genomics和以基因功能鉴定为目标的功能基因组学(functional genomics。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。 功能基因组学(functional genomics又往往被称为后基因组学(postgenomics,它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。 基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。 功能基因组学

全基因组重测序数据分析

全基因组重测序数据分析 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic和germ line 突变,结构变异-SNV,包括重排 突变(deletioin, duplication 以及copy number variation)以及SNP的座位;针对重排突变和SNP的功能性进行综合分析;我们将分析基因功能(包括miRNA),重组率(Recombination)情况,杂合性缺失(LOH)以及进化选择与mutation之间的关系;以及这些关系将怎样使 得在disease(cancer)genome中的mutation产生对应的易感机制和功能。我们将在基因组 学以及比较基因组学,群体遗传学综合层面上深入探索疾病基因组和癌症基因组。 实验设计与样本 (1)Case-Control 对照组设计; (2)家庭成员组设计:父母-子女组(4人、3人组或多人); 初级数据分析 1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计,测序深度分析。 2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基 因组信息对检测到的变异进行注释。 4.InDel检测及在基因组的分布: 在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需 要3个Paired-End序列的支持。 5.Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。

真菌生命树的系统发生和系统基因组学

真菌生命树的系统发生和系统基因组学 近二三十年来,分子系统发生学从最初的建立到不断发展,已成为真菌的比较生物学的重要研究手段。曾经仅局限于分类学的系统树如今已广泛地应用到真菌生物学中并为了解主要生命形式的进化、描述复杂的生物群落以及实验生物学的预测提供了广泛的进化进化理论基础。在基因组领域这一趋势愈发显著,系统发生学和基因组学逐渐结合到一起并孕育出了一门崭新的学科—系统基因组学。虽然这是一门年轻的学科,但它已经应用到通过进化关系来预测同源性和不规则基因,以及基于基因组范围的对离散同源序列数据基因组的最大量—至少是大量—的采样对比分析。下面,让我们来了解一些目前这一领域的相关进展:(i)基于多基因系统发育的真菌系统发生学目前的地位;(ii)目前在分类真菌界里的进化关系中的进化假说;(iii)通过基因组采样来推断进化关系的应用。 真菌分子系统学 作为真菌分子系统发育的第一个领域,rRNA在鉴定推断这一界的系统发生关系时发挥了极其重要的关系。rRNA以各种形态广泛分布在自然界中,含有核苷酸保守区域,并以此为基础促进了宇宙原初物种的进化。既而,rRNA核苷酸数据的收集和排序也因此变得浅显易懂并使真菌分子系统发生的研究从上世纪90年代开始呈指数级增长。虽然这些分析仅是基于少量的数据,但是针对真菌和类真菌的系统发生的研究已取得了大量的里程碑式的发现。这些发现包括异鞭毛水霉菌和黏液菌的胞外替换,动物界和真菌界间的封闭进化关系识别,壶菌,结合菌,担子菌,子囊菌的单元菌物鉴定,子囊菌和担子菌的单源支持及他们间的姊妹组关系。 ??尽管取得了这些进展,由于rRNA数据仅限于与之相关的功能,要不断地了解真菌世界的进化过程还需要掌握更多相似不同源基因,特别是蛋白质编码的基因。由于在真菌系统中最大的两个RNA聚合酶(RPB1 RPB2)和翻译延伸因子TEF广泛地得到应用,PCR技术和测序引物也随之得到极大发展。这些基因提供了对rRNA系统发育的测评支持,并提供了更多形态学和生物学上的稳定性测试,他们还提供了起始多基因系统发生产生的未加工数据,致使真菌系统发生从基因树形式过渡到物种树。 ??为使多基因系统发生得到进一步发展,真菌系统协会创办了Research Coordination Network Deep Hypha.该协会的主要宗旨在于加快收集真菌系统生命树的多基因序列数据采集。这也是AFTOL工程的贡献之一。该工程推动了以下六方面的核苷酸序列采集:细胞核小亚基rRNA,细胞核大亚基rRNA,线粒体小亚基rRNA,RPB1,RPB2和TEF---真菌中目和科的分类单元目标集(Lutzoni et al., 2004)。AFTOL筹集了2000多个分类单元的5000多条公开可用序列并发展了真菌中额外引物的数据采集(更多完整序列及引物请登录WASABI研办的网站:https://www.doczj.com/doc/269459605.html, Kauffet al.,2007])。在多基因数据集的采集日趋完善的同时,基于模型的复杂核苷酸序列数据集系统发生分析算法也在不断发展。由于电脑处理器愈发强大以及相关计算分析软件的支撑(如:RAxML [Stamatakis,2006] GARLI [Zwickl,2008] MRBAYES[Ronquist and Huelsenbeck, 2003] and PhyloBayes [Lartillot and Philippe,2004] ),对大型多基因数据集的最大似然估计和贝叶斯计算如今也得到广泛应用。今年来对多基因编码数据的强化分析也提高了系统发生的分辨率测算(Matheny et.al.,2007; Hofstetter et.al.,2007),并且证明了蛋白质编码的基因RPB1,RPB2和TEF比rRNA基因拥有更高层次的系统发生信息量(Townsend,2007; schoch et.al.,2009)。当我们把筹集相对大的多基因序列以及分析他们的能力有机地结合在一起时,我们就获得了目前对于真菌进化的最精确的了解。 真菌生命树 这里提到的真菌生命树,我们是指单源种的真菌界以及其下的各个亚门中所包含的。简明起见,这里不再讨论真菌以外的其它门类(例如:卵菌门),尽管他们很重要并且很多学者也在研究。我们的讨论将集中在更高级的分类学中,侧重于真菌进化中主要的真菌进化枝。

药物基因组学相关大数据库

药物基因组学数据库 1、Drugbank .drugbank.ca/ 2、dgidb https://www.doczj.com/doc/269459605.html,/ 3、pharmGKB https://https://www.doczj.com/doc/269459605.html,/ 4、cancercommon cancercommon./ 5、ChEMBL https://https://www.doczj.com/doc/269459605.html,/chembldb/ 6、mycancergenome https://www.doczj.com/doc/269459605.html,/ 7、TTD https://www.doczj.com/doc/269459605.html,.sg/group/cjttd/ 8、guidetopharmcology https://www.doczj.com/doc/269459605.html,/ 9、clearityfoundation https://www.doczj.com/doc/269459605.html,/ 10、CIViC https://https://www.doczj.com/doc/269459605.html,/#/home 11、DoCM https://www.doczj.com/doc/269459605.html,/ 1 Drugbank 药物和药物靶标资源库。DrugBank是一个独特的生物信息学/化学信息学资源,它结合了详细的药物(例如化学制品)数据和综合的药物靶点(即:蛋白质)信息。该数据库包含了超过4100个药物条目,包括超过800个FDA认可的小分子和生物技术药物,以及超过3200个试验性药物。此外,超过1.4万条蛋白质或药物靶序列被到这些药物条目。每个DrugCard条目包含超过80个数据域,其中一半信息致力于药物/化学制品数据,另一半致力于药物靶点和蛋白质数据。许多数据域超到其他数据库(KEGG、PubChem、ChEBI、Swiss-Prot和GenBank)和各种结构查看小应用程序。该数据库是完全可搜索的,支持大量的文本、序列、化学结构和关系查询搜索。DrugBank的潜在应用包括模拟药物靶点发现、药物设计、药物对接或筛选、药物代谢预测、药物相互作用预测和普通药学教育。DrugBank可以在www.drugbank.ca使用。广泛应用于计算机辅助的药物靶标的发现、药物设计、药物分子对接或筛选、药物活性和作用预

基因组学专题课程作业

基因组学专题课程作业 考试题目: 假如你发现一个新基因,请利用基因组学的思路,方法,技术路线设计可 行的假如你发现个新基因,请利用基因组学的思路,方法,技术路线设计可行的实验方案,研究它的功能,寻找出它所影响的下游基因,可能与此蛋白相互 作用的其它蛋白,以及调控它表达的上游基因。(选择一个你所熟知的模式生物。) 答案: 微生物是包括细菌、病毒、真菌以及一些小型的原生动物等在内的一大类 生物群体,它个体微小,却与人类生活密切相关。微生物在自然界中可谓“无 处不在,无处不有”,涵盖了有益有害的众多种类,广泛涉及健康、医药、工 农业、环保等诸多领域。 微生物对人类最重要的影响之一是导致传染病的流行。在疾病的预防和治 疗方面,人类取得了长足的进展,但是新现和再现的微生物感染还是不断发生,像大量的病毒性疾病一直缺乏有效的治疗药物。一些疾病的致病机制并不清楚。大量的广谱抗生素的滥用造成了强大的选择压力,使许多菌株发生变异,导致 耐药性的产生。微生物能够致病,能够造成食品、布匹、皮革等发霉腐烂,但 是微生物也有有益的一面。青霉素的发现对医药界来讲是一个划时代的发现。 后来大量的抗生素从放线菌等的代谢产物中筛选出来。一些微生物被广泛应用 于工业发酵,生产食品及各种酶制剂等;一部分微生物能够降解塑料、处理废 水废气等等,并且可再生资源的潜力极大,称为环保微生物;还有一些能在极 端环境中生存的微生物,例如:高温、低温、高盐、高碱以及高辐射等普通生 命体不能生存的环境,依然存在着一部分微生物等等。 随着医学研究进入分子水平,人们对基因、遗传物质等专业术语也日渐熟悉。人们认识到,是遗传信息决定了生物体具有的生命特征,包括外部形态以

基因组学答案

1.什么是基因组学?基因组学有哪些特点? 以基因组分析为手段,研究基因组的结构组成、时序表达模式和功能,并提供有关生物物种及其细胞功能进化信息的一门学科。特点:Genome sciences are sequence-based,Genome sciences are data-guided (not so hypothesis-driven),Genome sciences is a systematic approach。 2.什么是模式生物? 生物学家通过对选定的生物物种进行科学研究,用于揭示某种具有普遍规律的生命现象,此时,这种被选定的生物物种为模式生物。在人类基因组计划中,包括对五种生 物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。 3.人类基因组计划是哪一年完成的?在科学上有什么意义? 2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。 意义: 首先,获得人类全部基因序列将有助于人类认识许多遗传疾病以及癌症等疾病的致病机理,为分子诊断、基因治疗等新方法提供理论依据。 第二,破译生命密码的人类基因组计划有助于人们对基因的表达调控有更深入的了解。4.基因组学的发展方向是什么? 5. 3 大公共DNA 数据库名称是什么? EMBL,GenBank,DDBJ。 6.什么是一级数据库和二级数据库? Primary Databases:Original submissions by experimentalists,Content controlled by the submitter。 Derivative Databases:Built from primary data,Content controlled by third party。 7.什么是NCBI 的Refseq?什么是Unigene?Unigene 和Refseq 的区别和联系。 RefSeq (accessible via the main page of NCBI) provides an expertly curated accession number that corresponds to the most stable, agreed-upon “reference” version of a sequence. Unigene:MegaBlast based automated sequence clustering,Nonredundant set of gene oriented clusters,Each cluster a unique gene,Information on tissue types and map locations,Includes known genes and uncharacterized ESTs,Useful for gene discovery and selection of mapping reagents。 8.GEO 是什么类型数据库,主要包含什么类型数据? 9.大致介绍一下UCSC GENOME BROWSER? Stands for “Encyclopedia Of DNA Elements”,Public research consortium to carry out a project to identify all functional elements in the human genome sequence,Launched by The National Human Genome Research Institute (NHGRI),Conducted in three phases:pilot project phase,technology development phase,planned production phase。 10.HAVANA 基因是什么类型数据? 11.什么是细菌人工染色体(BAC) 是指一种以F质粒(F-plasmid)为基础建构而成的细菌染色体克隆载体,常用来克隆150kb左右大小的DNA片段,最多可保存300kb个碱基对。 12.什么是遗传图谱?用来构建遗传图谱的标记有哪些?

豆科比较功能基因组学研究

豆科比较功能基因组学研究 豆科(Leguminosae)为被子植物中仅次于菊科和兰科的三个最大的科之一,约650属,18000种。豆科分为3个亚科:含羞草亚科(Mimosaceae)、云实亚科(Caesalpiniacae)和蝶形花亚科(Papilionaceae)。豆科作物的经济地位仅次于禾本科,但豆科作物是许多发展中国家老百姓主要的蛋白质来源。同时,随着人们对植物来源油脂、蛋白质对人体的健康价值认识的深入,发达国家以及发展中国家中的富裕人群,对豆类食品的需求量正快速增长。但是,豆科经济作物一般基因组较大、且复杂,如大豆为古异源四倍体,单倍体基因组大小为1115 Mb,豌豆的基因组为4300Mb等等;同时,豆科经济作物种类均缺乏有效的遗传操作系统,所有这些对在豆科作物中开展构建物理图谱、图位克隆基因、分子标记辅助育种、基因功能等研究的开展造成严重的障碍。 我国是大豆的起源中心,拥有丰富的资源优势。如何充分挖掘我国已有的3万余份大豆资源中具有重要农艺价值的基因资源,是目前迅速提升我国大豆育种水平停滞不前的一个重要途径;同时研究植物的重要功能基因与农艺性状之间的关系,也是世界各国所普遍关注的一个研究领域。近十几年来,基因组研究方面的进展,已经并正在继续改变整个生命科学领域的面貌。同时有两个模式物种(蒺藜苜蓿(Medicago truncatula),百脉根(Lotus japonicus)正在开展全基因组测序,这是豆科植物科学研究得天独厚的优越条件,加上已经完成全基因组测序工作的拟南芥(Arabidopsis thaliana)、水稻(Oryza sativa)的基因组信息,为深入开展大豆优异基因资源的研究提供了很好的契机。 在自然科学基金重大项目、“863”等项目的支助下,通过国内外合作,初步建成了比较功能基因学研究的平台,包括:大规模突变体库的构建与筛选、基因定位与克隆、穿梭Marker构建、基于温度梯度凝胶电泳(TTGE)的高通量SNP检测、豆科基因组信息库、生物信息学分析平台等关键技术。为开展对重要农艺性状的农作物比较基因组研究打下基础。 依托现有的平台,我们实验室已获得以下阶段性成果: (1)已获得了34个跨5个豆科物种的穿梭Marker (2)成功地在大豆中克隆了6个花型发育的关键调控基因 (3)利用百脉根与豌豆的共线性关系,在豌豆中克隆了花型(腹背性)控制基因。 关键词:大豆豆科模式物种比较功能基因组

比较基因组学

比较基因组学 摘要:比较基因组学是在基因组图谱和测序的基础上, 利用某个基因组研究获得的信息推测其他原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科。该学科在后基因组时代是一门重要的工具学科。通过不同物种间的基因组序列比较, 可以发现生物体中蕴涵的大量生物学信息,其发展及所取得的成果与序列的积累相同步, 尤其是人类全基因组序列的分析与比较使比较基因组学成为整个生物学领域最新、最重要、进展最快和影响最大的学科之一。 关键词:比较基因组学;同源性;单核苷酸多态性;拷贝数多态性 世界范围内的多物种基因组计划和各类测序工作已经形成了海量的序列数据资源,它们正在使基因组研究发生革命性变化,信息和新技术的迅速发展也表明:分子遗传革新将是今后几十年的发展方向。尤其是从整体上而不是仅仅从某个或少数几个基因入手来研究生物体基因组的机能,己经在短短几年迅速发展壮大起来,比较基因组学已成为解读海量基因组序列数据及其相关生物学含义的强有力工具。通过物种之间的一比较能够了解基因组的进化,从而加速对人类基因结构和功能的了解。为阐明基因表达机制提供重要线索。达到从根本上了解认识生命的起源,物种及个体差异的原因,疾病产生的机制以及长寿、衰老等困扰着人类的最基本的生命现象,最终解析生命奥秘。 比较基因组学是通过对不同物种的基因组数据进行比较分析,揭示彼此的相似性和差异性,以了解不同物种进化上的差异,综合这些信息能进一步帮助我们了解物种形成的机制、基因或基因组上非编码区的功能。 1、种间比较基因组学 比较基因组学的基础是相关生物的相似性,序列间有显著的相似性即意味着序列之间有同源关系。同源是指被比较的物种是由共同的祖先经过自然选择进化而来。同源又可分为两种:直系同源和旁系同源直系同源的序列因物种形成而被区分开,若一个基因原先存在于某个物种,而该物种分化为了两个物种,那么新物种中的基因是直系同源的;旁系同源的序列因基因繁殖而被区分开,若生物体中的某个基因被复制了,那么两个副本序列就是旁系同源的。直系同源体通常有相同或相似的功能,但旁系同源体则不一定:由于缺乏原始的自然选择的力量,一繁殖出的基因副本可以自由的变异并获得新的功能。所有现代物种都是由相关的物种演化而来,现代的每一个基因都是由其它基因演化而来的。每一个基因都可以在其相关物种中找到直系同源基因,大部分的基因都可以在同一物种中找到旁系同源基因。如果两个物种非常相近,它们的基因组相关性就越高,基因组会表现出同线性,即基因序列的部分或全部保守。这样就可以利用模式基因组之间编码顺序上和结构上的同源性,通过已知基因组作图信息定位另外基因组中的基因,从而揭示基因潜在的功能、阐明物种进化关系及基因组的内在结构。 此外比较基因组分析还扩展到对序列相似性的分析、基因位置的比较、基因编码区长度或外显子数的变异、基因组上非编码区的比例、进化关系较远的物种间高度保守区域的比较

高通量测序生物信息学分析(内部极品资料,初学者必看)

基因组测序基础知识 ㈠De Novo测序也叫从头测序,是首次对一个物种的基因组进行测序,用生物信息学的分析方法对测序所得序列进行组装,从而获得该物种的基因组序列图谱。 目前国际上通用的基因组De Novo测序方法有三种: 1. 用Illumina Solexa GA IIx 测序仪直接测序; 2. 用Roche GS FLX Titanium直接完成全基因组测序; 3. 用ABI 3730 或Roche GS FLX Titanium测序,搭建骨架,再用Illumina Solexa GA IIx 进行深度测序,完成基因组拼接。 采用De Novo测序有助于研究者了解未知物种的个体全基因组序列、鉴定新基因组中全部的结构和功能元件,并且将这些信息在基因组水平上进行集成和展示、可以预测新的功能基因及进行比较基因组学研究,为后续的相关研究奠定基础。 实验流程: 公司服务内容 1.基本服务:DNA样品检测;测序文库构建;高通量测序;数据基本分析(Base calling,去接头, 去污染);序列组装达到精细图标准 2.定制服务:基因组注释及功能注释;比较基因组及分子进化分析,数据库搭建;基因组信息展 示平台搭建 1.基因组De Novo测序对DNA样品有什么要求?

(1) 对于细菌真菌,样品来源一定要单一菌落无污染,否则会严重影响测序结果的质量。基因组完整无降解(23 kb以上), OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;每次样品制备需要10 μg样品,如果需要多次制备样品,则需要样品总量=制备样品次数*10 μg。 (2) 对于植物,样品来源要求是黑暗无菌条件下培养的黄化苗或组培样品,最好为纯合或单倍体。基因组完整无降解(23 kb以上),OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;样品总量不小于500 μg,详细要求参见项目合同附件。 (3) 对于动物,样品来源应选用肌肉,血等脂肪含量少的部位,同一个体取样,最好为纯合。基因组完整无降解(23 kb以上),OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;样品总量不小于500 μg,详细要求参见项目合同附件。 (4) 基因组De Novo组装完毕后需要构建BAC或Fosmid文库进行测序验证,用于BAC 或Fosmid文库构建的样品需要保证跟De Novo测序样本同一来源。 2. De Novo有几种测序方式 目前3种测序技术 Roche 454,Solexa和ABI SOLID均有单端测序和双端测序两种方式。在基因组De Novo测序过程中,Roche 454的单端测序读长可以达到400 bp,经常用于基因组骨架的组装,而Solexa和ABI SOLID双端测序可以用于组装scaffolds和填补gap。下面以solexa 为例,对单端测序(Single-read)和双端测序(Paired-end和Mate-pair)进行介绍。Single-read、Paired-end和Mate-pair主要区别在测序文库的构建方法上。 单端测序(Single-read)首先将DNA样本进行片段化处理形成200-500bp的片段,引物序列连接到DNA片段的一端,然后末端加上接头,将片段固定在flow cell上生成DNA簇,上机测序单端读取序列(图1)。 Paired-end方法是指在构建待测DNA文库时在两端的接头上都加上测序引物结合位点,在第一轮测序完成后,去除第一轮测序的模板链,用对读测序模块(Paired-End Module)引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量,进行第二轮互补链的合成测序(图2)。 图1 Single-read文库构建方法图2 Paired-end文库构建方法

基因组学教学大纲

附件1: 二、课程性质、地位和任务 《比较基因组学》是在基因组图谱和序列分析的基础上,对已知基因和基因的结构进行比较,了解基因的功能,表达调控机制和物种进化过程的学科。它通过对不同物种的基因组数据进行比较分析,揭示彼此的相似性和差异性,以了解不同物种间进化上的差异。进行基因组比较分析时,研究并不仅限于基因编码区,还扩展到对序列相似性的分析、基因位置的比较、基因编码区长度或外显子数的变异、基因组上非编码区的比例、进化关系较远的物种间高度保守区域的比较分析等等(例如从最简单的细菌到非常复杂的人类基因组之间的比较)。比较基因组学和其它相关学科(如分子生物学、生物信息学和遗传学等)的交叉渗透,起着承前启后的作用,对这些学科的基础理论研究和生产实践都将产生巨大的影响。 通过本课程的学习,希望使学生了解比较基因组学在生物学研究领域的重要地位,发展现状,能够全面掌握基因组学的发展历史,病毒、原核生物和真核生物的基因组结构,基因组水平上的遗传图谱与物理图谱的绘制,基因组的测序与序列组装,基因组的比较分析,基因组水平的表达与调控以及基因组进化的分子机制以及进化模式。 三、课程基本要求 理论和知识方面: 通过课程讲授,使学生了解比较基因组学诞生的背景、发展概况和应用前景;掌握比较基因组学的基本理论和基本分析方法,包括基因组的结构、基因组水平上的遗传物理图谱绘制、基因组的测序与组装、基因组水平的基因表达与功能研究、基因组的比较分析(外显子数目、共线性分析、基因组上非编码区的变异)、基因组与生物进化等。 能力和技能方面: 以系统的理论知识学习为主,并以课堂讨论当前不断发展的基因组学新知识和新动态为辅助内容,在了解掌握基因组学基本知识的基础上,针对该学科的特点,要求学生能够进行简单的比较基因组学分析。同时注意培养分析思考问题的能力,能运用比较基因组学知识分析鉴定重要的功能基因,并在课堂上介绍当前一些领域的最新动态。课堂教学、课堂讨论、国内外发展动态介绍是基本学习方法。 四、课程内容及学时分配 第一章绪论(3学时) 教学基本要求:通过对引论的学习,明确比较基因组学的含义,比较基因组学的研究对象、内容和课程的主要任务,了解比较基因组学的发展历程及其展望,为学习好本门课程奠定良好基础。 教学重点和难点:基因组学及比较基因组学的产生及概念,比较基因组学的研究内容 教学方法与手段:多媒体教学、自学与课堂讨论相结合 第一节基因组学与(比较基因组学)的含义、研究范畴和发展历程 第二节病毒、原核生物和真核生物基因组的特点 第三节人类基因组计划

线粒体基因组全序列及 系统发育地位研究

2009年 第54卷 第9期: 1250 ~ 1261 https://www.doczj.com/doc/269459605.html, https://www.doczj.com/doc/269459605.html, 《中国科学》杂志社 SCIENCE IN CHINA PRESS 论 文 美姑脊蛇Achalinus meiguensis 线粒体基因组全序列及系统发育地位研究 王广力①, 何舜平②, 黄松③, 何苗①, 赵尔宓①④* ① 四川大学生命科学学院, 成都 610064; ② 中国科学院水生生物研究所, 武汉 430072; ③ 黄山学院生命与环境科学学院, 黄山 245041; ④ 中国科学院成都生物研究所, 成都 610041 * 联系人, E-mail: zem006@https://www.doczj.com/doc/269459605.html, 2008-10-21收稿, 2009-03-13接受 摘要 报道了美姑脊蛇Achalinus meiguensis 线粒体基因组全序列. 美姑脊蛇线粒体全序列长17239 bp, 由22个tRNA, 2个rRNA 和13个蛋白质基因及2个非编码的控制区或D-loop 组成, 存在着基因重排现象. 对已报道蛇类线粒体基因组全序列进行比对分析后, 发现一些蛇类线粒体基因组进化规律: 双控制区现象在爬行动物进化历史中独立地发生, 有不同的演化历史; tRNA 假基因是在真蛇下目(Caenophidia)中进化形成的; T ΨC 臂的相对较短(一般少于 5 bp)和缺失“DHU”臂造成蛇类tRNA 较短. 通过MP 和BI 分析确定美姑脊蛇系统发育位置应该位于瘰鳞蛇Acrochordus granulatus 和其他真蛇下目蛇类之间, 而不应该属于游蛇科Colubridae 或者眼镜蛇科Elapidae. 由于美姑脊蛇与真蛇下目中蝰科Viperidae 、游蛇科以及眼镜蛇科之间的单系性都被统计检验拒绝(P < 0.01), 由此认为美姑脊蛇所在的闪皮蛇亚科(Subfamily, Xenodermatinae)应该提升到科或者更高的分类阶元. 依据系统发育统计检验结果, 我们选择Bayesian 树来进行分歧时间的估算. 原蛇下目与真蛇下目的分化时间为109.50 Mya; 而瘰鳞蛇与其他真蛇下目种类的分化时间为106.18 Mya; 美姑脊蛇的分化时间在103 Mya; 蝰科与眼镜蛇科和游蛇科构成的单系群的分化时间发生在96.06 Mya. 关键词 美姑脊蛇 线粒体全序列系统发育 分化时间 在不同动物类群中, 线粒体基因组在基因结构和基因排列方式等方面均显示了极大的多样性, 这种多样性可能反映了真核细胞不同的进化路线[1]. 就目前的研究而言, 线粒体基因组是一个能够从基因组水平上来分析动物系统发生的分子标记, 可以从线粒体基因组序列信息、基因组成及基因排列方式等进行多方位的分子进化研究. 因而线粒体基因组全序列成为研究动物分子系统发生最有力的证据之一[1] . 蛇的线粒体基因组大体构造与其他脊椎动物相似, 2个rRNA, 22个左右的tRNA 和13个左右的蛋白编码基因, 至少一个非编码区(control region), 但是蛇类线粒体全序列在其组成、结构与功能等方面又有着一 些与众不同的特点, 如紧凑的基因结构、双控制区、 缩短的tRNA 以及较快的进化速度等[2~5]. 脊蛇属Genus Achalinus Peters, 1869在分类上隶属于游蛇科Family Colubridae, 闪皮蛇亚科Subfamily Xenodermatinae [6,7]. 该属的模式种是黑脊蛇(Acha- linus spinalis ). 脊蛇属蛇类已知有9种, 除1种外, 在中国均有分布, 其中5种是中国特有种. 美姑脊蛇(Achalinus meiguensis Hu and Zhao, 1966)是中国的特产蛇类, 区别于其他脊蛇的主要形态特征是具鼻间鳞和一枚极小的眶后鳞[8]. 目前仅见于四川的美姑、安县、洪雅、峨眉、宝兴、汶川、卧龙、屏山等以及云南省水富县, 已报道的分布海拔在1500~3000 m 之

叶绿体系统发育基因组学的研究进展

叶绿体系统发育基因组学的研究进展* 张韵洁,李德铢** (中国科学院昆明植物研究所生物多样性与生物地理学重点实验室,云南昆明650201) 摘要:系统发育基因组学是由系统发育研究和基因组学相结合产生的一门崭新的交叉学科。近年来,在植物系统发育研究中,基于叶绿体基因组的系统发育基因组学研究优势渐显端倪,为一些分类困难类群的系统学问题提出了解决方案,但同时也存在某些问题。本文结合近年来叶绿体系统发育基因组学研究中的一些典型实例,讨论了叶绿体系统发育基因组学在植物系统关系重建中的价值和应用前景,并针对其存在问题进行了探讨,其中也涉及了新一代测序技术对叶绿体系统发育基因组学的影响。 关键词:系统发育基因组学;叶绿体基因组;新一代测序技术;长枝吸引 中图分类号:Q75,Q949文献标识码:A文章编号:2095-0845(2011)04-365-11 Advances in Phylogenomics Based on Complete Chloroplast Genomes ZHANG Yun-Jie,LI De-Zhu** (Key Laboratory of Biodiversity and Biogeography,Kunming Institute of Botany,Chinese Academy of Sciences,Kunming650201,China) Abstract:Phylogenomics is a new synthesized discipline which combines genomics with phylogenetics.Phylogenom-ics based on chloroplast genomes has shown many great advantages in plant phylogenetic research in recent years,providing resolutions for phylogeny of some taxonomically difficult groups of plants.However,there are some prob-lems coming along with chloroplast phylogenomics as well.In this review,the application prospects and potential problems of chloroplast phylogenomics in plant phylogenetic reconstruction were discussed based on recent phylog-enomic case studies.The influence of next-generation sequencing on chloroplast phylogenomics was also discussed.Key words:Phylogenomics;Chloroplast genome;Next-generation sequencing;Long-branch attraction 地球上的生命形式多种多样,它们因有着共同的进化历史而有着或近或远的渊源。正确理解不同生物类群之间的关系不仅是进化生物学研究的前提,生物分类和命名的依据,而且也是开展生物学其它分支学科研究的基础。因而构建可靠的系统发育树(即将各生物类群之间的关系形象地以树的形式描绘出来)不仅是系统发育研究的重点,也是生物学研究的重要内容之一。早期系统发育学家通过对化石记录、比较形态学和比较生理学的研究,构建出了物种进化历史的主要框架(Nei和Kumar,2000)。20世纪80年代以后,随着分子生物学的快速发展,系统发育研究开始由比较形态学转向分子系统学研究领域,即利用生物大分子(如DNA序列、氨基酸序列等)所提供的信息来推断生物的进化历史(Li和Olmstead,1997;Nei和Kumar,2000;田欣和李德铢,2002)。分子系统学研究的出现使我们对生命进化过程有了更深刻的认识。然而随着分子证据的不断积累,基于不同分子片段对同一类群所进行的分子系统学研究结果之间存在的差异, 植物分类与资源学报2011,33(4):365 375 Plant Diversity and Resources DOI:10.3724/SP.J.1143.2011.10202 ***基金项目:中国科学院现代农业科技创新基地重要方向性项目“重要野生禾本科植物的比较基因组学和重要功能基因的研究(KSCX2-YW-N-029)” 通讯作者:Author for correspondence;E-mail:dzl@mail.kib.ac.cn 收稿日期:2010-11-15,2010-12-01接受发表 作者简介:张韵洁(1984-)女,在读硕士研究生,主要从事植物系统发育基因组学研究。

相关主题
文本预览
相关文档 最新文档