分子系统发育分析
- 格式:pdf
- 大小:1.55 MB
- 文档页数:22
分子系统发育分析的生物信息学方法作者:郭一冉来源:《山西农经》 2016年第12期!生命的进化是漫长的。
史学界针对物种的进化史进行研究,都试图从生物化石中寻找物种进化的证据,但毕竟化石数量有限,而且通过这种方式所获得的进化信息是零散的。
所以,要对生物的进化史以及生物之间的进化关系充分掌握,目前的学术界会普遍采用解剖学、发育学的相关理论进行研究。
但是,这些研究方法都不同程度地存在着依赖性,这就必然会导致研究中存在着局限性。
生物的结构相似,但是,进化的途径并不完全相同。
比如,鱼类和脊椎动物的眼睛所发挥的功能是相同的,但是,进化的途径却是完全不同的。
随着分子生物学的发展,对物种进化的研究就可以从生物分子的层面展开,以获得更为准确的物种进化信息。
1 物种进化研究中分子系统发育分析所发挥的作用系统发育学又被称为“系统发生学”,主要的研究内容是物种形成的历史和进化的历史,而且还针对物种在进化过程中相互之间所存在的关系进行研究。
在生物信息学研究领域中,系统发育学是重要的分支。
在对物种进化进行研究的过程中,从系统发育学的角度进行研究,可以对物种的进化史更好地掌握,基于此而对生命的起源进行探索,包括物种的变异、物种的差异、物种的基因功能以及从生态学的角度对微生物的研究等等。
随着生物学的研究进入到分子层面,基因技术开始融入到生物进化史研究中。
特别是基因测序技术的发展,诸如RNA、DNA 以及蛋白质等等的生物序列逐渐积累起来,这就使得生物进化史研究进入到分析层面。
在很多生物学专家看来,在生物分子中就可以获得物种进化的信息,而且相比较于从生物化石获取信息要容易得多[1]。
所以,生物研究领域对于物种的进化进行研究,多会从分析层面展开。
随着学界对物种发育的研究采用生物信息学的方法,能够涉及到的研究学科越来越多,除了计算机技术和生物学之外,包括数学、统计学等等都被用于研究中,从分子的层面对生物进化史研究水平逐渐提高,而且在研究方法上不断实现创新。
分子进化和系统发育的研究及其应用进化是生物学的核心概念之一,分子进化是现代进化生物学的重要组成部分,而分子系统发育则是分子进化研究的一项重要应用。
本文将从分子进化的基本原理出发,介绍分子系统发育的原理、方法与应用,并探讨其在不同领域中的意义。
一、分子进化的基本原理分子进化是基于DNA/RNA序列或蛋白质序列的进化研究分支。
基因等遗传物质包含了生物过去和现在的大部分信息,通过比较彼此的差异,就能推导出它们之间的进化关系。
分子进化的基本原理在于遗传突变的随机性和累积性。
在生物个体复制时,遗传物质会随机地产生突变,这些突变可以累积,最终就会形成差异。
这些差异可以代表生物的基因型和表型的演化历史。
二、分子系统发育的原理分子系统发育是根据生物体DNA/RNA序列或蛋白质序列的变化,推断生物之间的进化关系和亲缘关系的科学。
生物之间的相似性是由共同的祖先所造成的,相似性越大,共同祖先的距离就越近。
分子系统发育利用各个物种之间的序列差异,通过复杂的计算机分析推断各个物种之间的进化关系及其进化时间。
分子系统发育中通常用到的基本原理之一是“钟模型”,即基因变异率(即分子钟)是在所有物种中大致相同的。
换句话说,如果我们确定了一组基因序列的共同祖先时间,我们就可以根据不同物种间的分子差异推定这些物种的进化时间。
三、分子系统发育的方法分子系统发育研究通常使用序列比对、物种树构建、分支支持度评估和模型选择等方法。
下面简要介绍每种方法的基本原理:1. 序列比对序列比对是分子系统发育分析的基础之一,其目的是从一组相关序列中确定基因组中位点、简化不必要的信息,减小计算量。
序列比对中使用的最常用算法是 Needleman-Wunsch(NW)算法和Smith-Waterman(SW)算法。
这些算法旨在寻找两个(或多个)序列之间的最长公共子序列(LCS),并且可以计算序列间的“匹配”和“不匹配”得分。
2. 物种树构建分子系统发育分析的主要目的是构建物种树,物种树是表示生物之间进化关系的分枝图。
分子系统发育分析的生物信息学方法一、概述分子系统发育分析的生物信息学方法,是生物信息学领域中的重要研究手段,其核心在于利用分子层面的数据揭示生物体之间的进化关系。
该方法主要通过对DNA或蛋白质的分子序列信息进行分析,计算序列间的相似性,从而估计基因分子进化的速率、基因间序列的分歧时间以及物种或基因在系统发育中的位置。
在分子系统发育分析中,生物信息学方法的应用不仅限于单条生物序列的进化信息提取,还涉及到多条生物序列之间的比对与关联分析。
通过比较不同物种间的基因序列,可以揭示它们之间的进化关系和亲缘关系。
生物信息学方法还可以利用数学模型和计算机程序,构建系统发育树,直观地展示物种之间的进化历程。
随着生物信息学技术的不断发展,分子系统发育分析的生物信息学方法也在不断更新和完善。
新的算法和工具不断涌现,使得我们能够更准确地分析生物序列数据,揭示生物进化的奥秘。
分子系统发育分析的生物信息学方法在生物学研究中具有广泛的应用前景和重要的实践价值。
本文将详细介绍分子系统发育分析的生物信息学方法,包括单条生物序列的进化信息提取、多条生物序列的比对与关联分析、系统发育树的构建等方面,并探讨这些方法在生物学研究中的应用和未来发展。
1. 分子系统发育学概述分子系统发育学,作为系统发育系统学的一个重要分支,致力于通过深入剖析生物大分子(如蛋白质、核酸等)的结构与功能,揭示生物各类群之间的谱系发生关系。
这一学科不仅涵盖了生物进化历程的宏观视角,更通过分子生物学技术和计算机技术的结合,深入到微观层面,从而为我们提供了生物演化的全新理解。
在分子系统发育学的研究中,基因或生物体的系统发育关系常常通过构建有根或无根的树状结构来展示。
这种树状结构不仅揭示了物种之间的亲缘关系,还为我们理解物种的进化历程和演化模式提供了关键线索。
通过多重序列比对,研究者可以分析一组相关基因或蛋白质,进而推断和评估不同基因间的进化关系,这包括分子进化(基因树)和物种进化(物种树)的研究。
生物的分子进化与系统发育学生物的分子进化与系统发育学是一门研究生物进化过程以及生物种类之间关系的学科。
它通过对生物的分子遗传物质(如DNA、RNA和蛋白质)进行研究,揭示了生物种类的起源和进化历程,并为生物分类和系统发育提供了重要依据。
本文将从分子进化和系统发育两个方面来探讨生物的分子进化与系统发育学。
一、分子进化1. DNA序列分析DNA是生物遗传信息的载体,通过对DNA序列的比较和分析,可以推测物种的亲缘关系和进化历史。
例如,比较不同物种的DNA序列,可以计算出它们之间的遗传距离,从而判断它们的亲缘程度。
同时,DNA序列的碱基组成和变异情况也能揭示生物的进化过程。
2. 蛋白质序列比较蛋白质是生物体内重要的功能分子,不同物种的蛋白质序列差异可以反映它们的进化关系。
通过比较蛋白质序列的同源性,可以推断物种之间的相似性和差异性,进一步揭示它们的进化途径和演化过程。
二、系统发育1. 系统发育树系统发育树是研究生物种类关系的重要工具。
通过对不同物种的分子数据进行分析,可以构建系统发育树,揭示物种之间的进化关系。
系统发育树可以有不同的构建方法,如最大简约法、邻接法等,每种方法都可以提供不同的进化关系图。
2. 分子钟分子钟是一种通过分子数据估算物种分化时间的方法。
它基于遗传变异的推移速率,根据物种的分子特征,估算出不同物种之间的分化时间。
分子钟为研究生物种类的起源和进化历程提供了重要依据。
综上所述,生物的分子进化与系统发育学通过对生物遗传物质进行研究,揭示了生物种类的起源、进化历程以及物种之间的进化关系。
通过分析DNA和蛋白质序列,可以推断物种的亲缘关系和进化途径;通过构建系统发育树和使用分子钟,可以揭示物种之间的进化时间和分化关系。
生物的分子进化与系统发育学在生物分类、物种演化和保护生物多样性等领域具有重要应用价值。
第 6 讲分子进化与系统发育生化与分子生物学教研室郭俣第一节进化的分子基础第二节分子系统发育分析第三节系统发育树的构建及应用第一节进化的分子基础 1.1 物种进化树 Tree of Life重建所有生物的进化历史并以系统树的形式加以描述。
研究生物进化历史的途径Ø最确凿证据:生物化石缺点:零散、不完整大猩猩、直立人与智人头骨的比较图。
Ø比较形态学、比较解剖学和生理学等缺点:细节存很多的争议生物进化理论n 达尔文进化论:物竞天择,适者生存。
–进化:变异的遗传–自然选择:解释为何演变发生的机制生物是通过遗传、变异和自然选择,从低级到高级,从简单到复杂,种类由少到多地进化着、发展着。
n 中性进化论:并非所有种群中保留下来的突变都由自然选择所形成。
大多数突变是中性或接近中性,不妨碍种群的生存与繁衍。
n 分子进化论Ø1964年 , Linus Pauling 提出分子进化理论; Ø从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。
Ø发生在分子层面的进化过程 :DNA, RNA和蛋白质分子。
Ø基本假设 :核苷酸和氨基酸序列中含有生物进化历史的全部信息。
1.2 分子进化 Molecular Evolution主要指在生物进化过程中, 构成生物体的大分子物质 , 如蛋白质、核酸的演变过程。
n 机制基因突变n 特点1. 进化速率的相对恒定性。
2. 进化的保守性。
DNA 突变基本类型缺插入 (insertion失 (deletion倒位 (inversion替代 (substitution转换颠换(transvertion 基因突变A G T CA/GC/TDNA 突变的模式替代插入缺失倒位核苷酸替代:转换 & 颠换转换 :嘌呤替代嘌呤 ,或嘧啶替代嘧啶。
颠换 :嘌呤替代嘧啶 ,或嘧啶替代嘌呤。
Ø转换发生的频率一般比颠换高。
1.2.1 中性突变 (neutral mutation 1968, , 提出分子Kimura 进化中性学说。
分子进化与系统发育分子进化与系统发育是现代生物学的重要研究领域之一。
它通过研究生物体内的分子结构和遗传信息,来揭示不同物种之间的亲缘关系和进化历程。
本文将介绍分子进化与系统发育的基本原理、研究方法和应用。
一、分子进化的基本原理分子进化是指物种内基因组或蛋白质组的遗传信息发生变化的过程。
在分子水平上,进化主要表现为DNA序列的突变和基因组结构的变化。
分子进化的基本原理主要包括以下几点:1. 遗传变异:遗传变异是生物进化的基础,是物种产生多样性的原因。
遗传变异可通过突变、基因重组和基因转移等途径实现。
2. 自然选择:自然选择是分子进化过程中的重要机制。
根据环境变化和适应性需求,具有更有利基因型的个体会在繁殖中获得更高的生存优势,从而逐渐在种群中占据主导地位。
3. 基因漂变:基因漂变是指随机性的基因频率变异,特别在小种群中影响较大。
基因漂变可以导致分子进化的随机性增加,进而导致遗传多样性的减少。
二、分子系统发育的基本原理分子系统发育是通过比较不同物种的DNA序列或蛋白质结构,构建物种间的进化关系树。
它基于分子进化的原理,通过计算相似性或差异性来推断物种的亲缘关系和进化历程。
分子系统发育的基本原理主要包括以下几点:1. 保守性进化:保守性进化是指在漫长的进化历程中,一些基因或蛋白质序列在物种间保持相对稳定的变化。
这些保守性的变化为系统发育提供了可比较的基础。
2. 数据分析:分子系统发育的关键步骤是对获得的分子数据进行分析。
常用的分析方法包括序列比对、构建进化树和计算进化速率等。
3. 进化树的构建:进化树是分子系统发育的主要结果之一。
它通过对不同物种之间的分子差异性进行比较和计算,来揭示它们的亲缘关系和共同祖先。
构建进化树的方法主要包括距离法、最大似然法和贝叶斯法等。
三、分子进化与系统发育的研究方法分子进化与系统发育的研究方法主要包括分子时钟、基因家族分析和基因组学等。
1. 分子时钟:分子时钟是一种基于分子进化速率的方法,用来估计物种的分化时间和进化速度。
分子系统发育分析用于研究生物体在分子水平的进化式样、方向、速率以及各种分子机制对基因和基因组的结构与功能的影响。
同源——最基本的意义就是具有共同祖先一般来说,如果两个物种中有两个性状(状态)满足以下两个条件中的任意一个,就可以称这两个性状为一对同源性状:1)它们与这些物种的祖先类群中所发现的某个性状相同;(2)它们是具有祖先—后裔关系的不同性状。
同源性一般是指核酸分子的核苷酸序列之间或蛋白质分子的氨基酸序列之间的相似程度。
直系同源(rothology)可反映五种血统上的同源性,既物种进化的历史。
祖先类群:如果一个类群或物种至少有一个子裔类群,这个原始类群就是祖先类群。
单系类群:包含一个祖先类群所有子裔的群组称为单系类群。
并系类群:不满足单系类群要求,各成员间又具有共通祖先特征的群组。
姊妹群:与某一类群在谱系关系上最为密切的类群称为姊妹群。
内类群和外类群:一项研究所涉及的某一特定类群可称为内类群,不包括在内类群中又与之有一定关系的类群可称为外类群。
序列分析是最终测定同源性程度的方法。
DNA-DNA杂交或DNA-RNA杂交也是有用的估计途径。
在分子系统发育分析中,首先应考虑直系同源基因序列。
系统树(phylogenetic tree) :用来表达类群(或序列)间系统发育关系的一种树状图。
可划分为以下几种类型: 有根树(rooted tree)和无根树(unrooted tree) 以外类群作为树根的系统树称为有根树;没有外类群为树根的系统树称为无根树。
有根树数目的计算方法:Nr=(2n—3)!{2n-2(n—2)!}无根树数目的计算方法:Nu=(2n—5)!{2n-3(n—3)!}基因树(gene tree)是由一个基因所构建的系统树。
物种树(species tree):则表达了某一特定类群的进化路径。
核苷酸置换模型可以用4X4的矩阵表示。
估算两个蛋白质序列间置换数的方法中必须将同义置换和非同义置换非分开考虑,而起始和终止密码子应排除在外因为它们几乎不随时间变化。
生物的分子演化与系统发育生物的分子演化与系统发育是生物学中的重要领域,它涉及到生物种群的遗传变化、进化关系的推断以及分类学的建立。
本文将从分子演化与系统发育的基本概念、分子演化分析方法、分子演化与系统发育的应用以及未来发展方向等方面进行论述。
一、分子演化与系统发育的基本概念分子演化是指分子水平上的遗传变化,包括DNA序列、蛋白质序列以及其他分子的演化过程。
系统发育是通过比较不同物种的相似性与差异性,推断它们之间的进化关系,建立生物分类学体系的过程。
分子演化与系统发育之间存在着密切的联系和相互作用。
二、分子演化分析方法1. 比较基因组学:通过比较不同物种的基因组序列,发现基因组的结构与功能的变化,揭示分子水平上的遗传变化及其在进化中的作用。
2. 分子钟:利用核苷酸或氨基酸序列的变化速率,推断物种的分化时间,进而构建进化时间树。
3. 进化基因组学:通过比较物种在表观遗传学、蛋白质组学和基因组学等方面的差异,研究进化过程中基因家族的增益与丧失以及功能的变化。
三、分子演化与系统发育的应用1. 生物分类学:通过分析不同物种的分子特征,确定它们之间的进化关系,构建分类学体系,为物种鉴定和分类提供依据。
2. 进化关系研究:通过分析物种间的分子差异,推断它们之间的进化关系,揭示物种之间的亲缘关系以及演化过程中的分化和分布模式。
3. 系统发育重建:通过分析分子数据,重建物种的进化树,推断进化历程和进化速率,为生物学、医学和生态学等领域的研究提供基础。
四、分子演化与系统发育的未来发展方向1. 大数据时代的挑战:随着高通量测序技术的发展,分子数据的规模和复杂性不断增加,如何处理和分析大规模的分子数据成为重要的研究方向。
2. 结合多种数据源的分析:将不同层次的分子数据(如基因组、转录组、蛋白质组等)和形态学、地理学等信息相结合,综合分析物种的进化历程和适应性演化。
3. 系统发育模型的改进:如何建立更准确、更可靠的进化模型,提高系统发育推断的准确性和精确度。
分子进化学中的系统发育分析分子进化学是研究生物物种演化过程的学科,也是分子生物学和进化生物学的交叉领域。
它主要依靠分子生物学技术研究DNAs、RNAs、蛋白质等分子在物种演化过程中的变异和进化规律。
分子进化学的重要应用之一是系统发育分析,即利用分子标记刻画不同物种之间的亲缘关系。
系统发育分析可以为生物分类学、生态学、医学等领域提供重要的支持和参考。
一、分子标记在系统发育分析中的应用分子标记是在分子水平上进行物种识别和进化研究的重要工具。
常用的分子标记包括DNA序列、蛋白质序列、限制性酶切位点等。
其中,DNA序列和蛋白质序列由于其具有高度的可变性和易于测定的优点,被广泛应用于系统发育分析中。
DNA序列包括基因组DNA和线粒体DNA,它们分别对应不同的遗传特征和进化速率。
基因组DNA具有比较慢的进化速率,适合于较深层次的亲缘关系研究;而线粒体DNA则具有相对较快的进化速率,适合于较浅层次的亲缘关系研究。
二、系统发育分析的方法系统发育分析的基本方法是构建物种的演化树。
演化树是通过分析物种间的共同祖先和衍生特征等信息,画出演化历程中物种进化关系的图示。
常用的方法包括距离法、最大简约法、贝叶斯法等。
其中,最大简约法是目前最为常用的方法之一,其基本思想是寻找相对简单的演化树解释被分析序列的特征,从而推断物种间的演化关系。
贝叶斯法则利用统计模型和贝叶斯公式,计算出演化树的概率分布。
三、系统发育分析在分子生态学研究中的应用分子生态学是研究生态过程和生态系统中物种之间的相互作用和关系的学科。
系统发育分析可以为分子生态学研究提供重要的理论和方法支持。
例如,在研究微生物群落的物种演化关系时,可以利用16S rRNA序列作为分子标记,进行系统发育分析,研究不同微生物群落的分布和功能。
此外,利用系统发育分析还可以研究野生动植物种群的遗传多样性、遗传漂变和适应性等。
四、系统发育分析在医学研究中的应用系统发育分析在医学研究中也具有重要的应用价值。
分子进化与系统发育分析转:系统发育学研究的是进化关系,系统发育分析就根据同源性状的分歧来推断或者评估这些进化关系。
通过系统发育分析所推断出来的进化关系一般用分枝图(进化树) 来描述,这个进化树描述了分子(基因树)、物种以及二者之间遗传关系的谱系。
由于“Glade”这个词(拥有共同祖先的同一谱系)在西腊文中的本意是分支,所以系统发育学有时被称为遗传分类学(cladistics) 。
在现代系统发育研究中,重点己不再是生物的形态学特征或其他特征,而是生物大分子尤其是序列,对序列的系统发育分析又称为分子系统学或分子系统发育研究。
它的发展得益于大量序列的测定和分析程序的完善。
比起许多其他实验性学科,分子系统学与其他进化研究一样有其局限,即系统发育的发生过程都是己经完成的历史,只能在拥有大量序列信息的基础上去推断过去曾经发生过什么,而不能再现。
由于系统发育分析不太可能拥有实验基础,至多是些模拟实验或者病毒实验:如何处理序列从中得到有用信息、如何用计算的办法得到可信的系统树、如何从有限的数据得到进化模式成为这个领域的研究热点。
1进化树构建构建进化树的方法包括两种:一类是基于序列类似性比较,主要是基于氨基酸/核酸相对突变率矩阵计算不同序列差异性积分作为它们的差异性量度而构建的进化树;另一类是在难以通过序列比较构建进化树的情况下,通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立的进化树。
2评估进化树和数据现在己经有一些程序可以用来评估数据中的系统发育信号和进化树的健壮性。
对于前者,最流行的方法是用数据信号和随机数据作对比实验(偏斜和排列实验):对于后者,可以对观察到的数据重新取样,进行进化树的支持实验(非参数自引导和对折方法)。
似然比例实验可以对取代模型和进化树都进行评估。
本文只阐述几个常用的方法:偏斜实验(Skewness Test):统计的临界值随着分类群数口的不同和序列中点的不同而不同,对随机数据集呈现的信号很敏感,可以用来决定系统发育信号是否保留着。