系统进化树的构建
- 格式:ppt
- 大小:764.00 KB
- 文档页数:17
构建进化树的步骤通常包括以下几个关键环节:
1. 数据收集:收集相关的生物序列数据,这些数据可以来自于公共数据库,如NCBI的GenBank,也可以通过实验获得。
序列数据包括DNA或蛋白质序列。
2. 序列alignment(序列比对):使用比对软件如Clustal Omega、MAFFT、MUSCLE等,将收集到的序列进行比对,以确保序列的同源性,并消除由于序列变异导致的噪音。
3. 序列拼接和校正:对测序得到的正向和反向序列进行拼接和校正,以获得完整的序列。
常用的拼接软件有Contig Express、Geneious 和Sequencher等。
4. 选择合适的模型:根据序列数据选择合适的进化模型。
可以使用软件如Modeltest来评估不同的进化模型,选择BIC(Bayesian Information Criterion)分数最低的模型。
5. 建树:选择合适的软件和建树方法来构建进化树。
常用的软件有MEGA、PhyML、MrBayes等,建树方法包括NJ(邻接法)、MP (最大简约法)、ML(最大似然法)等。
6. 建树检验:使用如Bootstrap方法等来检验所建树的稳定性和可靠性。
Bootstrap方法通过重复抽样来检验建树的节点支持度。
7. 绘制进化树:使用软件如TreeDraw、FigTree或在线工具来绘制进化树的图像,以便于分析和展示。
系统进化树的构建方法系统进化树(systematic phylogenetic tree)是用于描述不同物种之间进化关系的一种图形化表示方法,可以帮助我们理解物种的起源、演化和分类。
构建系统进化树主要涉及到物种的分类学和进化生物学知识,以及系统发育分析方法。
下面将介绍系统进化树的构建方法。
1.选择研究对象:确定研究的物种范围,通常会选择有代表性的物种,包括已知的和新发现的物种。
2.收集DNA序列数据:从每个研究对象中提取DNA样本,并通过PCR扩增得到所需的基因序列。
常用的基因包括线粒体基因COI、核基因ITS 等,根据具体研究目的和对象进行选择。
3.序列比对:将收集到的DNA序列进行比对,通常采用计算机程序进行全局比对,比对结果会显示序列之间的同源区域和差异。
4. 构建系统进化树:有多种方法可以构建系统进化树,其中最常用的是系统发育建模方法,如最大简约法(maximum parsimony)、最大似然法(maximum likelihood)和贝叶斯推断(Bayesian inference)等。
最大简约法是最简单和最常用的构建系统进化树的方法之一、它基于简约原则,认为进化过程中最少的演化步骤是最可能的。
方法将不同物种的序列进行比对,统计共有的字符以及不同的字符,根据最小化改变的原则,得到进化树。
最大似然法使用概率模型来计算物种之间的进化关系,根据序列数据的概率分布确定最可能的进化树。
这种方法考虑了不同序列字符的不同演化速率以及序列之间的相关性。
贝叶斯推断方法基于贝叶斯统计学原理,通过计算不同进化树的后验概率来确定最有可能的进化树。
该方法能够对不同进化模型和参数进行全面的推断,但计算复杂度较高。
5.进行分支长度调整和进化树根的定位:进化树的分支长度表示物种间的差异,可以根据各个物种间的差异大小进行调整。
进化树的根通常是已知的进化历史或已知的进化事件,如灭绝事件等,可以通过分析群体间的基因流动等信息进行推断。
菌株系统进化树的构建-概述说明以及解释1.引言1.1 概述概述菌株系统进化树的构建是一项重要的研究工作,它能够帮助我们了解不同菌株之间的进化关系和演化历史。
菌株系统进化树可以被看作是一种表示不同菌株间亲缘关系的有向无环图,它能够揭示这些菌株之间的共同祖先和演化路径。
菌株系统进化树是基于菌株间的遗传差异来构建的。
通过对不同菌株的基因组、基因序列和遗传标记进行比较分析,我们可以获得它们之间的遗传距离或相异度。
这些数据可以用来构建菌株系统进化树,从而揭示菌株间的进化关系。
构建菌株系统进化树的过程通常包括以下几个步骤:首先收集不同菌株的样本,提取其基因组或基因序列;然后对这些样本进行测序并得到相应的遗传数据;接着利用生物信息学方法对这些数据进行分析和比较,计算出菌株间的遗传距离;最后利用分子进化模型和统计方法构建进化树,并对其进行进一步的验证和分析。
菌株系统进化树的构建具有重要的应用价值。
首先,它可以帮助我们确定不同菌株之间的亲缘关系,进一步理解它们之间的演化过程和机制。
其次,菌株系统进化树可以为微生物分类学和菌群动态变化研究提供重要的参考和指导。
此外,对于研究菌株的致病性、抗药性和生物学特性等方面,菌株系统进化树也具有重要意义。
综上所述,构建菌株系统进化树是一个重要而复杂的研究课题。
通过比较和分析菌株间的遗传数据,我们可以揭示菌株间的亲缘关系和进化历史,进一步推动微生物学和生物进化学的发展。
在接下来的内容中,我们将详细介绍构建菌株系统进化树的方法和应用,以及对未来研究的展望。
1.2 文章结构文章结构是指文章的组织框架和各个部分的排列顺序。
一个良好的文章结构能够帮助读者更好地理解和掌握文章的内容,并且能够使文章的逻辑关系更加清晰和流畅。
本文的结构分为引言、正文和结论三个部分,具体如下:引言部分(Introduction):在引言部分,首先要对菌株系统进化树的概念进行介绍,解释其所涉及的基本概念和理论背景。
MEGA-5软件——系统发育树构建方法MEGAv5软件——系统发育树构建方法1)序列文本构树之前先将每个样品的序列都分别保存为txt文本文件中,序列只包含序列字母(ATCG或氨基酸简写字母)。
文件名名称可以已经您的想法随意编辑。
2)序列导入MEGA 5首先打开MEGA 5软件,界面如下:然后,导入需要构建系统进化树的序列:点击OK如果是DNA序列,点击DNA,如果是蛋白序列,点击Protein。
出现新的对话框,创建新的数据文件如果是DNA序列,点击DNA,如果是蛋白序列,点击Protein。
导入成功3)序列比对分析点击W,开始比对。
比对完成后删除序列两端不能完全对其的碱基。
系统分析然后,关闭该窗口,在弹出的对话框中选择保存文件,文件名随便去,比如保存为1。
4)系统发育树构建以NJ为例Bootstrap选择1000,点Computer,开始计算计算完毕后,生成系统发育树。
以下“系统发育树树的修饰”方法沿用斑竹brightfuture01的方法5)树的修饰建好树之后,往往需要对树做一些美化。
这个工作完全可以在word中完成,达到发表文章的要求。
点击image,copy to clipboard。
新建一个word文档,选择粘贴。
见下图:在图上点击右键-编辑图片,就可以对文字的字体大小,倾斜等做出修饰。
见下图:这个时候可以通过Adobe professional 对其进行图像导出:先将此word文档打印成PDF,见下图:将打印出来的PDF保存在桌面上,打开,如下图:此时,点击工具,高级编辑工具,裁剪工具,如下图所示:选择需要的区域以删除周围的空白区,双击发育树,会出现下图:点击确定,出现下图 (把空边切掉了):点击文件,另存为,在保存类型一栏中选择TIFF格式,点击确定后会生成下面这个图片,所生成图片绝对可以满足文章的发表:OK,结束了,自己玩一把吧。
upgma系统发育构建原理UPGMA(Unweighted Pair Group Method with Arithmetic Mean)是一种常用的系统发育构建方法,也被称为加权平均群组法。
它基于一种原理,即越相似的物种在进化过程中越早分离,而越不相似的物种在进化过程中越晚分离。
UPGMA方法的基本思想是通过计算物种间的距离来构建进化树。
距离可以根据物种间的相似性或差异性来衡量。
在UPGMA中,距离被定义为物种间的平均距离,即将两个物种的距离相加后除以2。
这样做的好处是避免了过分关注某些个别物种的距离,使得整个进化树更加平衡。
UPGMA方法的构建过程如下:1. 首先,计算物种间的距离矩阵。
这可以通过比较它们的特征或基因序列等来实现。
距离矩阵是一个对称矩阵,其中的每个元素表示两个物种之间的距离。
2. 选择距离最小的两个物种作为一对,并将它们合并成一个新的群组。
这个新的群组的距离可以通过计算这两个物种的距离的平均值来获得。
3. 更新距离矩阵。
合并后的群组与其他物种的距离需要重新计算。
这可以通过计算新的群组与其他物种的平均距离来实现。
4. 重复步骤2和步骤3,直到所有的物种都被合并成一个群组,形成一颗完整的进化树。
UPGMA方法的优点是简单易懂,计算速度快。
但它也有一些局限性,比如对于一些复杂的进化关系,它可能无法准确地反映出物种间的真实关系。
总结起来,UPGMA方法是一种基于物种间距离的系统发育构建方法。
通过计算物种间的平均距离,并逐步合并最相似的物种,可以构建出一颗简单而合理的进化树。
这种方法在研究物种间的亲缘关系和进化历史时具有重要的应用价值。
系统进化树的构建一、什么是系统进化树系统进化树,又称为生命进化树或物种树,是描述生物进化关系的一种图形表达方式。
它通过比较不同物种之间的形态、生理特征以及遗传信息等多方面的数据,将它们按照演化顺序排列在一个分枝结构图中,以展示各个物种之间的亲缘关系和演化历程。
二、系统进化树的构建方法1. 形态学比较法形态学比较法是最早被使用的构建系统进化树的方法。
该方法主要通过对不同物种之间形态特征的比较,确定它们之间的亲缘关系。
例如,通过对鸟类翅膀长度和颜色等特征进行比较,可以确定它们之间的亲缘关系,并将它们排列在一个分枝结构图中。
2. 分子生物学方法随着分子生物学技术的发展,越来越多的研究者开始使用DNA序列等遗传信息来构建系统进化树。
这种方法主要是通过比较不同物种DNA 序列或蛋白质序列之间的差异性,来推断它们之间的亲缘关系。
例如,通过对人类、猩猩和大猩猩的DNA序列进行比较,可以确定它们在进化过程中的亲缘关系。
3. 综合方法综合方法是将形态学比较法和分子生物学方法结合起来,以获得更准确的系统进化树。
该方法主要是通过对不同物种之间形态特征和遗传信息等多方面的数据进行综合分析,来推断它们之间的亲缘关系。
例如,通过对恐龙化石的形态特征和DNA序列进行比较,可以确定它们在进化过程中的亲缘关系。
三、系统进化树的构建步骤1. 收集数据构建系统进化树需要收集大量的数据,包括形态特征、遗传信息等多方面的数据。
这些数据可以通过实验、文献调查等方式获取。
2. 数据处理收集到的数据需要进行处理和分析,以便于构建系统进化树。
这些处理包括序列比对、计算差异性等操作。
3. 构建树型结构在经过数据处理后,就可以开始构建系统进化树了。
该步骤主要是将不同物种之间的亲缘关系按照演化顺序排列在一个分枝结构图中。
4. 树型验证构建完系统进化树后,需要对其进行验证。
这可以通过计算分支长度、计算拓扑稳定性等方式来实现。
四、系统进化树的应用1. 生物分类学研究系统进化树可以帮助生物学家更准确地确定不同物种之间的亲缘关系,从而更好地进行生物分类学研究。
系统进化树系统进化树是描述通过演化进化过程及其结果的一种有机形式图。
它有助于追溯系统演化的过程,并了解广泛系统之间的关系。
它将复杂的演化过程形象化,以方便理解和记忆。
据研究,在不可追溯的历史时期,系统进化树已经被广泛应用于演化生物学、演化遗传学、演化系统学以及演化基因组学等研究领域中,它可用来描述系统的演化路径、解释种类之间的演化关系以及解释演化系统如何形成和演化。
从这一点来看,系统进化树可以用来指导演化进化研究,反映物种系统演化的大概形态,以及种类之间的演化关系,甚至可以推断物种的演化。
在建立系统进化树时,首先要考虑的是所涉及的物种之间的关系。
系统进化树按照演化过程及其产物,将研究对象分类、组合和排序,以表明它们之间的关系。
系统进化树的建模过程需要使用到构建模型的数据方法。
此外,系统进化树的研究还需要运用演化计算学方法,包括遗传算法和聚类分析。
这些方法可用于量化评估演化过程的多样性,并计算进化距离,从而建立系统进化树。
此外,系统进化树也可以应用于其他领域,如分析社会网络之间的演化过程或研究两个相关事物之间的关系。
系统进化树作为一种用于追溯系统演化的形式图,它有助于追溯系统演化的过程,并了解广泛系统之间的关系。
它是一种有效的演化模型,可用于描述物种系统演化、进行演化建模以及研究两个相关事物之间的关系。
系统进化树是一种有效的演化模型,它可以帮助人们理解进化过程及其产物,探索物种系统演化的大概形态,以及种类之间的演化关系。
同时,系统进化树也可以应用于其他领域,如分析社会网络之间的演化过程或研究两个相关事物之间的关系。
从这一点来看,系统进化树在研究演化进化的过程和结果方面具有重要的应用价值。
在追溯系统演化的过程中,系统进化树是非常有用的,它可以帮助研究者更加容易地理解和追溯演化过程,以及演化结果之间的关系,从而更好地探索生物演化过程。
因此,系统进化树有助于我们更深入地理解演化过程,有助于满足研究者对演化机制的关注。
系统发育进化树作用-概述说明以及解释1.引言1.1 概述系统发育进化树是生物学领域一个重要的概念和工具。
它通过对物种之间的遗传关系和演化历史进行系统分析和分类,构建出一颗树状结构,用以揭示物种之间的进化关系。
这种树状结构可以帮助我们更好地理解物种之间的演化历史以及它们之间的亲缘关系。
系统发育进化树的构建方法经历了长期的发展和完善,目前主要包括分子系统学和形态系统学两种方法。
分子系统学通过比对物种之间的DNA 或蛋白质序列,来推断它们之间的遗传关系;而形态系统学则是通过对物种的形态、生理学特征等进行比较和分类。
这些方法的结合可以更准确地揭示物种之间的演化关系。
系统发育进化树在生物学领域有着广泛的应用,不仅可以帮助我们解答物种起源、分化等基础科学问题,还可以指导生物分类学、生物地理学等实际应用领域的研究。
因此,系统发育进化树的建立和应用具有重要的理论和实践价值。
1.2 文章结构本文将分为三个主要部分来探讨系统发育进化树的作用。
首先,我们将在引言部分对本文的内容进行概述,介绍系统发育的基本概念以及文章的目的。
接下来,在正文部分,我们将详细介绍系统发育和进化树的构建方法,以及系统发育进化树在生物学研究中的应用。
最后,在结论部分,我们将强调系统发育进化树的重要性,并展望未来其在科学研究中的发展前景。
通过以上结构的安排,我们希望读者能够更全面地了解系统发育进化树的作用及其在生物学领域的重要性。
1.3 目的在本文中,我们的主要目的是探讨系统发育进化树在生物学研究中的重要作用。
我们将首先介绍系统发育的概念,探讨进化树的构建方法,然后详细讨论系统发育进化树在生物学领域中的应用。
通过对这些内容的分析和探讨,我们旨在揭示系统发育进化树在生物学研究中的重要性,为今后更深入的研究提供参考和启示。
同时,我们也将展望未来系统发育进化树在生物学领域的发展潜力,希望能为相关研究提供一定的借鉴和指导。
最终,我们将对本文进行总结,强调系统发育进化树在生物学研究中的重要性和必要性。
一步一步教你如何做系统进化树在此介绍几个进化树分析及其相关软件的使用和应用范围。
这几个软件分别是PHYLIP 、PUZZLE 、PAUP 、TREEVIEW 、CLUSTALX 和PHYLO-WIN (LINUX )。
在介绍软件之前,我先简要地叙述一下有关进化树分析的一些方法学问题。
进化树也称种系树,英文名叫“Phyligenetic tree ”。
对于一个完整的进化树分析需要以下几个步骤:⑴ 要对所分析的多序列目标进行排列(To align sequences )。
做ALIGNMENT 的软件很多,最经常使用的有CLUSTALX 和CLUSTALW ,前者是在WINDOW 下的而后者是在DOS 下的。
⑵ 要构建一个进化树(To reconstrut phyligenetic tree )。
构建进化树的算法主要分为两类:独立元素法(discrete character methods )和距离依靠法(distance methods )。
所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。
而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。
进化树枝条的长度代表着进化距离。
独立元素法包括最大简约性法(Maximum Parsimony methods )和最大可能性法(Maximum Likelihood methods );距离依靠法包括除权配对法(UPGMAM )和邻位相连法(Neighbor-joining )。
⑶ 对进化树进行评估。
主要采用Bootstraping 法。
进化树的构建是一个统计学问题。
我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。
系统发育树构建的三种方法
系统发育树(Systems 发育 Tree,简称Stree)是一种用于描述生物系统进化的图形化工具,通常用于模拟生物系统行为的演化过程。
以下是三种构建系统发育树的方法:
1. 基于规则的方法:这种方法使用预定义的规则和偏好来构建
系统发育树。
例如,可以使用遗传算法或人工神经网络等机器学习方法,来预测一个物种的遗传特征或行为演化轨迹。
这种方法需要大量
的人工工作,但可以生成较为准确的演化树。
2. 基于统计方法的方法:这种方法使用统计学方法来推断物种
之间的演化关系。
例如,可以使用最大似然估计或贝叶斯推断等方法,来预测一个物种的遗传特征或行为演化轨迹。
这种方法不需要人工工作,但需要更多的计算资源和时间,才能得到比较准确的演化树。
3. 基于模型的方法:这种方法使用已经建立的模型和数据来构
建系统发育树。
例如,可以使用层次结构模型(如生物进化树、社会网络模型等)来预测一个物种的遗传特征或行为演化轨迹。
这种方法可
以快速构建系统发育树,但需要更多的人工工作来验证模型的准确性。
系统发育进化树构建系统发育进化树(Phylogenetic tree)是一种用于描述物种或群体之间进化关系的图形表示。
通过构建系统发育进化树,我们可以了解不同物种之间的亲缘关系,以及它们的共同祖先。
本文将介绍系统发育进化树的构建方法和其在生物学领域中的应用。
一、系统发育进化树的构建方法1. 选择合适的基因或序列:构建系统发育进化树需要选择适当的基因或序列进行分析。
常用的基因包括核糖体RNA(rRNA)和线粒体DNA(mtDNA)等。
2. 收集物种样本:从不同物种中收集样本,并提取相应的基因或序列。
3. 序列比对:将收集到的序列进行比对,找出它们之间的相同和差异。
4. 构建进化模型:根据序列比对的结果,选择适当的进化模型,如最大似然法或贝叶斯推断等。
5. 构建进化树:利用选定的进化模型,根据序列的相似性和差异性,构建系统发育进化树。
二、系统发育进化树的应用1. 物种分类:系统发育进化树可用于物种分类,帮助我们理解不同物种之间的亲缘关系。
通过比较进化树上的分支长度和节点位置,我们可以判断物种之间的相似性和差异性。
2. 进化研究:系统发育进化树可用于研究物种的进化历史和进化速率。
通过比较不同物种之间的进化树,我们可以了解它们的共同祖先以及它们之间的演化路径。
3. 分子演化研究:系统发育进化树在分子演化研究中起着重要的作用。
通过比较不同物种的基因或序列,我们可以推断它们的演化历史和演化速率。
4. 物种保护:系统发育进化树可用于指导物种保护工作。
通过研究物种的进化关系,我们可以了解哪些物种是濒危物种或有特殊保护需求的物种。
5. 药物开发:系统发育进化树可用于药物开发。
通过比较不同物种的基因或序列,我们可以了解它们之间的差异,并找到可能具有药用潜力的物种。
总结:系统发育进化树是一种重要的工具,用于描述物种或群体之间的进化关系。
通过构建系统发育进化树,我们可以了解不同物种之间的亲缘关系,以及它们的共同祖先。
系统发育进化树在物种分类、进化研究、分子演化研究、物种保护和药物开发等领域都有着广泛的应用。
MEGA构建系统进化树的步骤(以MEGA7为例)本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。
研究某个基因的进化,是用它的DNA序列,还是翻译后的蛋白质序列呢?序列的选取要遵循以下原则:1)如果DNA序列的两两间的一致度≥70%,选用DNA 序列。
因为,如果DNA序列都如此相似,它的蛋白质会相似到看不出区别,这对构建系统发生树是不利的。
所以这种情况下应该选用DNA序列,而不选蛋白质序列。
2)如果DNA序列的两两间的一致度≤70%,DNA序列和蛋白质序列都可以选用。
1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
想要做系统发生树先要做多序列比对,然后把多序列比对的结果提交给建树软件进行建树,所以在用MEGA建树时可以输入一个已经比对好的多序列比对,也可以输入一条原始序列,让MEGA先来做多序列比对,再建树(一般我们都是原始序列)。
所以我们以后者为例。
2.打开MEGA软件,选择主窗口的”File”→“Open A File”→找到并打开fasta文件,这时会询问以何种方式打开,我们是原始序列,需要先进行多序列比对,所以选择“Align”。
如果是比对好的多序列比对可以直接选择“Analyze”。
3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对(MEGA提供了ClustalW和Muscle两种多序列比对方法,这里选择熟悉的ClustalW),弹出窗口询问“Nothing selected for alignment,Select all?”选择“OK”。
4. 之后,弹出多序列比对参数设置窗口。
这个窗口和EMBL在线多序列比对一样,可以设置替换记分矩阵、不同的空位罚分(罚分填写的是正数,计算时按负数计算)等参数。
生物大数据技术的进化树构建方法与工具随着现代生物学研究范式不断发展,生物大数据成为生物学研究的重要资源。
在生物大数据中,进化树构建是解决物种分类和亲缘关系的关键环节之一。
进化树提供了生物物种之间的演化关系,帮助我们理解生物多样性的起源和演化过程。
在本文中,我将介绍生物大数据技术中用于构建进化树的方法与工具。
进化树构建的方法包括距离法、最大简约法和贝叶斯法等。
距离法是一种基于物种间差异的测量方法,常用的距离指标有进化距离、遗传距离和相似性距离等。
最大简约法则基于进化过程中最简单的演化树,寻找一棵树,使得所有的观察数据与这棵树的解释最为一致。
贝叶斯法是一种基于概率统计的方法,利用贝叶斯统计推断物种之间的关系,它可以通过蒙特卡罗马尔科夫链蒙特卡罗(MCMC)方法来求解。
生物大数据技术的进化树构建方法中有许多重要的工具。
其中,最广泛使用的方法之一是分子系统学。
分子系统学利用生物大数据中的遗传序列信息来构建进化树,最常用的序列包括基因组序列和蛋白质序列。
常见的分子系统学工具有MEGA、PHYLIP、RAxML和MrBayes等。
MEGA是一个综合的分子进化分析软件,集成了多种进化模型和构建方法。
PHYLIP是最早的公开可用的构建进化树的软件包,其中包含了多种构建方法和分析工具。
RAxML是一种用于大规模物种分类研究的软件,它具有高效的计算性能和准确的模型选择。
MrBayes是一种基于贝叶斯统计学的软件,能够估计单个和多个基因的进化树。
此外,还有一些新兴的工具用于生物大数据中进化树的构建。
一种常见的方法是使用基于物种演化树的软件包,例如ASTRAL和PhyloNet。
ASTRAL利用结合物种组织树关系和基因树关系的联合推断来构建物种进化树,它能够处理物种树混淆或基因树不完整的情况。
PhyloNet是一种基于网络理论和统计学的方法,可以推断出复杂的物种进化网络,包括基因水平的基因转移和混合。
除了这些方法和工具外,还有一些改进的技术被用于生物大数据中的进化树构建。
MEGA构建系统进化树的步骤(以MEGA7为例)本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。
研究某个基因的进化,是用它的DNA序列,还是翻译后的蛋白质序列呢?序列的选取要遵循以下原则:1)如果DNA序列的两两间的一致度≥70%,选用DNA 序列。
因为,如果DNA序列都如此相似,它的蛋白质会相似到看不出区别,这对构建系统发生树是不利的。
所以这种情况下应该选用DNA序列,而不选蛋白质序列。
2)如果DNA序列的两两间的一致度≤70%,DNA序列和蛋白质序列都可以选用。
1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
想要做系统发生树先要做多序列比对,然后把多序列比对的结果提交给建树软件进行建树,所以在用MEGA建树时可以输入一个已经比对好的多序列比对,也可以输入一条原始序列,让MEGA先来做多序列比对,再建树(一般我们都是原始序列)。
所以我们以后者为例。
2.打开MEGA软件,选择主窗口的”File”→“Open A File”→找到并打开fasta文件,这时会询问以何种方式打开,我们是原始序列,需要先进行多序列比对,所以选择“Align”。
如果是比对好的多序列比对可以直接选择“Analyze”。
3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对(MEGA提供了ClustalW 和Muscle两种多序列比对方法,这里选择熟悉的ClustalW),弹出窗口询问“Nothing selected for alignment,Select all?”选择“OK”。
4. 之后,弹出多序列比对参数设置窗口。
这个窗口和EMBL在线多序列比对一样,可以设置替换记分矩阵、不同的空位罚分(罚分填写的是正数,计算时按负数计算)等参数。