第七章分子系统发育分析 进化树
- 格式:ppt
- 大小:7.84 MB
- 文档页数:113
分子进化与生物系统发育分子进化和生物系统发育是生物学领域的两个重要研究方向,它们通过研究分子遗传材料的演化和生物体之间的关系,揭示了生物界多样性的起源和发展。
本文将介绍分子进化和生物系统发育的基本概念、研究方法以及其在生物学研究和应用中的重要性。
一、分子进化的概念和意义分子进化是指从分子水平上研究生物种群和物种之间的遗传关系和演化过程。
它基于遗传物质的变异和传递规律,通过比较生物体内DNA、RNA和蛋白质序列的差异和相似性,推断生物种群的演化关系和进化历史。
分子进化的重要意义在于,它能够提供关于物种形成、进化速率、群体迁移和自然选择等方面的证据和解释。
通过分析不同物种之间的序列差异,可以推断它们的共同祖先、分化时间和进化关系,从而帮助我们理解种群的形成和演化过程。
二、分子进化的研究方法1. 分子演化树的构建分子演化树是表示不同物种或类群之间进化关系的图形化工具。
构建分子演化树的基本方法包括距离法、最大似然法和贝叶斯法等。
其中,距离法基于不同序列之间的差异程度构建演化树,最大似然法则通过计算出现观察到的数据的概率来估计最合理的演化树,而贝叶斯法则则通过概率模型进行演化树的推断。
2. 分子钟模型分子钟模型是一种用于估计物种分化时间的方法。
该模型假设基因的变化速率是恒定的,从而可以通过测量不同物种中特定基因的差异来推算它们的分化时间。
分子钟模型在分子进化研究中被广泛应用,为了更准确地估计物种的分化时间,研究人员通常使用多个基因进行分析。
三、生物系统发育的概念和意义生物系统发育研究的是生物界中不同物种和分类单元之间的系统关系和谱系发展。
它基于生物形态、生理和分子特征的相似性和差异性,通过构建系统发育树来揭示物种分类和多样性的起源和发展。
生物系统发育具有重要的意义,它为我们了解不同物种的亲缘关系和进化历史提供了重要线索。
通过构建系统发育树,可以揭示不同物种之间的共同祖先、演化路径和物种间的近亲关系。
此外,在进化生物学、生态学和保护生物学等应用领域,生物系统发育也为物种保护、进化机制研究等提供了理论和实证基础。
分子进化与系统进化树的构建分子进化与系统进化树的构建分子进化与系统进化树的构建主要内容:1、分子进化的研究方法2、系统进化树的构建方法3、系统进化树构建常用软件汇集4、系统进化树构建方法及软件的选择5、Phylip分子进化分析软件包简介及使用6、如何利用MEGA3.1构建进化树声明:1、本篇涉及的资源主要源于网络及相关书籍,由酷友搜集、分析、整理、审改,供大家学习参考用,如有转载、传播请注明源于基因酷及本篇的工作人员;若本篇侵犯了您的版权或有任何不妥,请Email genecool@告知。
2、由于我们的学识、经验有限,本篇难免会存在一些错误及缺陷,敬请不吝赐教:请到基因酷论坛(/bbs)本篇对应的专题跟贴指出或Email genecool@。
致谢:整编者:flashhyh主要参考资料:《生物信息学札记》樊龙江;《分子进化分析与相关软件的应用》作者不详;《进化树构建》ZHAO Yangguo;《如何用MEGA 3.1构建进化树》作者不详;《MEGA3指南》作者不详;分子进化的研究方法分子进化的研究方法分子进化的研究方法分子进化研究的意义自20世纪中叶,随着分子生物学的不断发展,进化研究也进入了分子进化(molecularevolution)研究水平,并建立了一套依赖于核酸、蛋白质序列信息的理论和方法。
随着基因组测序计划的实施,基因组的巨量信息对若干生物领域重大问题的研究提供了有力的帮助,分子进化研究再次成为生命科学中最引人注目的领域之一。
这些重大问题包括:遗传密码的起源、基因组结构的形成与演化、进化的动力、生物进化等等。
分子进化研究目前更多地是集中在分子序列上,但随着越来越多生物基因组的测序完成,从基因组水平上探索进化奥秘,将开创进化研究的新天地。
分子进化研究最根本的目的就是从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。
通过核酸、蛋白质序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律。
第 6 讲分子进化与系统发育生化与分子生物学教研室郭俣第一节进化的分子基础第二节分子系统发育分析第三节系统发育树的构建及应用第一节进化的分子基础 1.1 物种进化树 Tree of Life重建所有生物的进化历史并以系统树的形式加以描述。
研究生物进化历史的途径Ø最确凿证据:生物化石缺点:零散、不完整大猩猩、直立人与智人头骨的比较图。
Ø比较形态学、比较解剖学和生理学等缺点:细节存很多的争议生物进化理论n 达尔文进化论:物竞天择,适者生存。
–进化:变异的遗传–自然选择:解释为何演变发生的机制生物是通过遗传、变异和自然选择,从低级到高级,从简单到复杂,种类由少到多地进化着、发展着。
n 中性进化论:并非所有种群中保留下来的突变都由自然选择所形成。
大多数突变是中性或接近中性,不妨碍种群的生存与繁衍。
n 分子进化论Ø1964年 , Linus Pauling 提出分子进化理论; Ø从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。
Ø发生在分子层面的进化过程 :DNA, RNA和蛋白质分子。
Ø基本假设 :核苷酸和氨基酸序列中含有生物进化历史的全部信息。
1.2 分子进化 Molecular Evolution主要指在生物进化过程中, 构成生物体的大分子物质 , 如蛋白质、核酸的演变过程。
n 机制基因突变n 特点1. 进化速率的相对恒定性。
2. 进化的保守性。
DNA 突变基本类型缺插入 (insertion失 (deletion倒位 (inversion替代 (substitution转换颠换(transvertion 基因突变A G T CA/GC/TDNA 突变的模式替代插入缺失倒位核苷酸替代:转换 & 颠换转换 :嘌呤替代嘌呤 ,或嘧啶替代嘧啶。
颠换 :嘌呤替代嘧啶 ,或嘧啶替代嘌呤。
Ø转换发生的频率一般比颠换高。
1.2.1 中性突变 (neutral mutation 1968, , 提出分子Kimura 进化中性学说。
系统发育树的构建与分析方法系统发育学是一门研究物种进化关系的学科,通过对不同物种的形态特征、生理生态特性、分子遗传信息等数据进行分析,可以得出它们在进化树中的位置。
而系统发育树则是用来表示各物种间进化历程和亲缘关系的图形表示。
它不仅可以揭示物种之间的起源和进化演化,而且可以对生物多样性的保护和利用产生重要影响。
本文将介绍系统发育树的构建和分析方法。
一、系统发育树的构建方法1. 形态学方法形态学方法是最早用于构建系统发育树的方法。
它是根据物种的形态特征进行比较研究,如昆虫的翅膀、花的形态、动物的身体部位等。
这种方法的优点是简单易行,但缺点是由于不同物种形态特征的相似性,并不能完全反映它们在进化树上的亲缘程度,有一定局限性。
2. 分子系统发育学方法随着分子生物学的发展,分子数据也开始被应用于系统发育树的构建。
这种方法通过对物种不同基因的序列进行修建的,如rRNA、DNA、蛋白质序列等来了解它们进化的历程和亲缘关系。
因为DNA和蛋白质在进化过程中往往较为保守,且具有一定统一性,因此这种方法比形态学方法更为精确,同时也能够构建更多样化的进化模型。
3. 固定标记法固定标记法是结合形态学和分子方法的一种新技术。
它利用生物体细胞核DNA中的高度变异的区域,如微卫星(Simple Sequence Repeats, SSR)等,通过引物特异性地扩增这些标记区域,将扩增产物的大小与数量(即大小因素和数量因素)组成一个确定的数字序列,用于构建系统发育树。
这种方法因能够同时反映形态和分子信息,且具有标记简单、修建渐进、多样性较高等优点,逐渐成为研究系统发育的新方法。
二、系统发育树的分析方法一旦构建了系统发育树,便需要进行分析以研究物种间的亲缘关系、进化历程等信息。
1. 树形态分析树形态分析包括节点分支的长度、角度、直线距离等进化遗传参数的分析。
通过对树形态的分析,可以更全面地了解不同物种亲缘关系的演化特点。
2. 分子位点分析分子位点分析是指对系统发育树上指定基因位点的序列进行分析,如进化速率、突变次数、转换和替换等信息。
分子系统树分子系统树是一种用于描述分子间相似性和进化关系的树状结构。
它通过分析分子的序列或结构特征,将不同分子按照其相似性程度进行分类和排序。
分子系统树不仅可以帮助我们理解分子的进化历程和亲缘关系,还可以为新分子的分类和功能研究提供指导。
在构建分子系统树的过程中,首先需要选择合适的分子特征进行比较。
常用的特征包括DNA序列、蛋白质序列、化学结构等。
对于DNA或蛋白质序列,可以使用比对算法对不同序列进行比较,计算它们之间的相似性。
而对于化学结构,可以使用分子指纹或化学描述符来表示分子的特征,然后计算不同分子之间的相似性。
在获得分子的相似性矩阵后,可以使用聚类算法将相似的分子分到同一类别中。
常用的聚类算法有UPGMA、Neighbor-Joining等。
这些算法基于分子之间的距离或相似性矩阵,通过计算最小进化距离或最大相似性来构建分子系统树。
在构建树的过程中,可以选择不同的根节点和分支长度的计算方法,以及不同的聚类算法参数,来获得不同层次的分子分类信息。
分子系统树的构建结果可以通过树状图的形式展示。
树状图上的每个节点代表一个分子或一个分子类别,节点之间的连线代表它们之间的相似性或进化关系。
树状图的分支长度可以表示分子之间的距离或进化时间。
通过观察树状图的结构,我们可以了解分子之间的亲缘关系、进化历程以及共同祖先。
同时,树状图还可以帮助我们预测未知分子的分类和功能。
分子系统树在生物学、药物研发、化学等领域有着广泛的应用。
在生物学中,分子系统树可以帮助我们理解生物种群的进化历程和亲缘关系,从而揭示物种的起源和演化规律。
在药物研发中,分子系统树可以帮助我们发现新的药物靶点和药物分子,提高药物研发的效率和成功率。
在化学中,分子系统树可以帮助我们理解分子的结构与性质之间的关系,指导新化合物的设计和合成。
分子系统树是一种用于描述分子间相似性和进化关系的重要工具。
通过分析分子的特征和相似性,构建分子系统树可以帮助我们理解分子的进化历程和亲缘关系,为新分子的分类和功能研究提供指导。
⼀⽂读懂进化树(图⽂详解)⽬录Content⼀、什么是进化树⼆、进化树的构成1. 根 (Root)2. 结点 (Node)3. 进化⽀ (Branch)4. 外群5. 进化分⽀长度6. 距离标尺7. Bootstrap value三、进化树评估1. Bootstrap检验2. 重复取样值3. Bootstrap value 阈值4. Bootstrap value 与分⽀四、⼏种进化树图1.经典树图(Traditional)Rectangle Tree2.圈图(Circle Tree)3.辐射树(Radiation Tree)什么是进化树系统发育进化树 (Phylogenetic tree):⼀般也叫系统进化树,进化树。
它可以利⽤树状分⽀图形来表⽰各物种或基因间的亲缘关系。
建进化树的过程,⽤术语讲:分⽀系统发育分析 (Molecular phylogenetic analysis):是⽤来研究物种或序列进化和系统分类的⼀种⽅法。
⼀般研究对象是碱基序列或氨基酸序列,通过数理统计算法来计算⽣物间进化关系。
最后,根据计算结果,可视化为系统进化树。
进化树的构成我们模拟⼀个项⽬,使⽤⼈和⿏的各两个基因做进化树,结果如下:可以看到上⾯有⼀堆标注,下⾯来看看它们代表什么意义:1. 根 (所有分⽀的共同祖先叫做根根据有⽆根可分为:有根树:上⾯的图就是有根树,可以从树中找到共同的祖先。
⽆根树:顾名思义,没有根,也就找不到共同的祖先。
⽐如后边会提到的 Straight Tree2. 结点 (每个结点代表⼀个分类单元,物种上可以是属,种群等,基因上可以是基因家族,同源物等。
这⾥需要注意,有的⼈会把 node 翻译为节点,但是节点与结点有着不⼀样的含义:节点:通常被认为是⼀个实体,⽐如互联⽹上的每台计算机,蛋⽩互作⽹络的每个蛋⽩质。
结点:只是⼀个交叉点,指交汇点,并不代表⼀个实体或事物但是,也有另外⼀种解释:这种解释将 node 分为外部节点与内部节点:外部节点⼜叫叶节点,也就是最外层的⼈基因1,⼈基因2等,代表参与分析的序列样本内部节点,也就是我们使⽤蓝⾊标注的位置,代表假定祖先。
系统发育进化树构建
系统发育进化树是一种用来表示生物种类和它们之间进化关系的图表。
它基于共有衍征和演化关系的分析,可以帮助我们理解物种的起源和演化过程。
下面是一个示例的系统发育进化树构建过程:
1. 收集数据:我们需要收集关于不同物种的特征和遗传信息的数据。
这些数据可以包括形态特征、分子序列等。
2. 数据处理:接下来,将收集到的数据进行处理,例如进行序列比对、计算相似性指数等。
这些处理会将数据转化为可以进行系统发育树分析的形式。
3. 构建系统发育树:通过使用系统发育树构建软件,如MEGA、PHYLIP等,我们可以利用处理后的数据构建系统发育树。
这些软件通常使用一些统计模型和算法来计算物种之间的相似性和进化关系。
4. 评估树的可靠性:构建系统发育树后,还需要对树的可靠性进行评估。
这可以通过计算支持值或进行自举分析等方法来实现。
支持值表示构建树的数据集中的信息支持树的某个分支。
5. 进行树的修正:如果评估发现树的某些分支的可靠性较低,我们可以根据需要进行进一步的分析,例如添加更多的数据或调整分析的参数。
6. 结果解读:在构建了系统发育树之后,可以通过对树的结构和分支进行解读,了解物种的起源和演化过程。
树的结构可以显示物种之间的近缘关系和进化路径。
注意:以上只是一个概括的系统发育进化树构建过程,具体的步骤和方法可能会因不同的研究目的和数据类型而有所不同。
在实际研究中,还需要根据具体情况选择适合的分析方法和工具。
计:ˆ1 + v ˆ 2 = K 12 v ˆ1 + v ˆ3 = K 13 v ˆ2 + v ˆ3 = K 23 v 估值为 1 ( K 12 + K 13 − K 23 2 1 ˆ2 = ( K 12 + K 23 − K 13 v 2 1 ˆ3 = (K 13 + K 23 − K 12 v 2 实际序列并非具有相等的碱基频率,因而 Jukes-Cantor 距离不会使似然值最大,但它们的确为迭代法提供了很好的初始值。
Newton-Raphson 迭代法为找 -vi 到最大似然值的数值解提供了直接的方法,且从寻求 pi=1-e 的估值来看,这一方法在描述上是最为简单的。
表 5.7 给出了图 5.4 中人类(1、大猩猩(2、长臂猿(3线粒体序列收敛过程的例子。
三个序列间的平均碱基频率用作模型中的概率项πi。
ˆ1 = v 表 5.7 图 5.4 中人类、大猩猩和长臂猿线粒体序列非约束型最大似然树分枝长度的连续迭代 v2 v3 迭代 v1 初始值 0.0423 0.0174 0.2215 1 0.0420 0.0196 0.2230 2 0.0420 0.01990.2299 3 0.0420 0.0199 0.2299 标准差 0.0297 0.0218 0.0600 用几个序列作为树端来构建系统树时,可采用以上所述的一般方法。
先指定一种系统树,然后对来自该系统树似然函数的方程进行 Newton-Raphson 迭代来估计分枝长度。
在理论上,应研究所有可能的系统树来寻找具有最大似然值的系统树。
Fukami 和 Tateno(1989证实至多存在一组对于 L 给出平稳值的分枝长度,且这组分枝长度提供了所需的最大似然估计。
将这一方法应用于图 5.4 所列的 5 种线粒体序列,获得了图 5.16 所示的无根树状图。
117人类 0.015 0.030 1 0.000 黑猩猩大猩猩 0.000 0.051 0.045 2 3 0.138 猩猩长臂猿图 5.16 利用 Felsenstein 的 PHYLIP 软件构建的图 5.4 线粒体序列资料的最大似然树四.对系统树 Bootstrap 抽样在任一特定的树状拓扑结构内,已知最大似然值提供了分枝长度的一致估计值,这意味着随着资料量的增加,估计值逐渐接近真值。