生物学利用MEGA50和Clustalx软件构建进化树
- 格式:doc
- 大小:3.29 MB
- 文档页数:13
保守结构域序列构建进化树是一个非常常见且重要的生物信息学分析步骤。
通过将同源蛋白中的保守序列区域聚合在一起,研究者可以对同一蛋白家族的多种蛋白质进行分析,并且使用这些保守结构域的序列信息进行进化树的构建,可以帮助我们理解蛋白质家族的进化关系和进化历程。
首先,我们需要收集一组同源蛋白的保守结构域序列。
这些序列通常来自于生物数据库中的已知蛋白质序列,通过比对和分析,我们可以找到这些序列中的保守区域。
这些保守区域通常代表了蛋白质的功能和结构的重要部分,因此,通过比较和分析这些序列,我们可以了解蛋白质家族的进化关系。
接下来,我们需要将这些序列导入到一个进化树构建软件中。
常用的软件包括MEGA、PHYLIP、Clustal等。
这些软件通常会使用一种叫做邻接法(Neighbor-joining)的算法来构建进化树。
邻接法是一种基于距离的算法,它通过比较序列之间的差异来构建树状图。
这种方法在处理大样本和复杂的进化关系时表现得尤为出色。
在构建进化树的过程中,我们需要对软件中的参数进行适当的设置。
例如,我们可能需要选择适当的距离度量方法、调整树的进化模型、考虑种间或种内的系统发生信息等。
这些参数的选择和调整可能会影响到进化树的精度和可靠性。
一旦进化树构建完成,我们可以利用一些可视化的工具进行观察和解读。
例如,我们可以使用专门的绘图软件(如TREE-PUZZLE或ITOL)将进化树绘制成漂亮的图形,或者使用一些专门的软件来分析树中的分支和节点,以了解蛋白质家族的进化关系和进化历程。
总之,保守结构域序列构建进化树是一个非常有用的生物信息学分析步骤。
通过比较和分析同源蛋白中的保守序列区域,我们可以了解蛋白质家族的进化关系和进化历程,这对于理解生物多样性和物种进化的机制具有重要意义。
1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
利⽤MEGA-X选择模型及构建美化进化树今天主要介绍的是在MEGA-X图形界⾯下构建系统发育树并且对发育树进⾏美化。
下载安装好MEGA-X后,⾸先打开软件。
此处我们以⼀株细菌的16S rRNA序列为⽬标序列,⾸先在NCBI中进⾏Blast⽐对,下载将要⼀起⽐对建树的菌株序列。
在NCBI中输⼊序列或者上传⽂件,选择数据库时可以选择「Nucleotide collection(nr/nt)」或者「16S ribosomal RNA sequences」数据库,⼀般来说nr/nt库信息⽐较全⾯。
我们选择了10个不同种的16S rRNA序列进⾏下载。
另外,此处还可以⽐对下载2-3条⼤肠杆菌(Escherichia coli)和沙门⽒杆菌(Salmonella)的16S rRNA序列作为外类群(在Organism选项中进⾏物种限定),后⾯推断进化时间的时候可以⽤到。
将所有下载的序列整理在⼀个⽂件中,为了⽅便后⾯的建树可以将菌株名称后⾯多余的信息在这⾥替换删除掉(只是名称上的信息,不要改动碱基序列),然后将⽂件的扩展名改为.fasta。
在MEGA-X⾸页选择DATA,点击Open a File/Session,选择刚才的⽂件。
打开⽂件时询问「Analyze or Align File?」,此处点击Align。
序列中可能会出现混合碱基符号,混合碱基符号指两种或多种碱基(核苷)混合物的表⽰符号,或未完全确定可能属于某两种或多种碱基(核苷)的符号:R表⽰A+G;Y表⽰C+T;M表⽰A+C;K表⽰G+T;S表⽰C+G;W 表⽰A+T;H表⽰A+C+T;B表⽰C+G+T;V表⽰A+C+G;D表⽰A+G+T;N表⽰A+C+G+T。
接下来选择序列⽐对的⽅法:Muscle或者ClustalW。
ClustalW的基本原理是⾸先做序列的两两⽐对,根据该两两⽐对计算两两距离矩阵,是⼀种经典的⽐对⽅法,使⽤范围也⽐较⼴泛。
Muscle的功能仅限于多序列⽐对,它的最⼤优势是速度,⽐ClustalW的速度快⼏个数量级,⽽且序列数越多速度的差别越⼤。
生物学利用MEGA5.0和Clustalx1.83软件构建进化树MEGA是一个关于序列分析以及比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。
功能比以前多有改进。
现主要介绍使用Mega 5.0构建系统进化树的方法。
供大家参考。
用MEGA构建进化树有以下步骤:1、测序:将克隆扩增测序得到的16S rDNA序列进行测序。
2、NCBI上做Blast找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSATA 格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如>XXXXAGGCTTAACACA TGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCG GACGGGTGAGTAA TGCTTAGGAA TCTGCCTA TTAGTGGGGGACAACATTCCGAAAGGA ATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAA TAGATGAGCCTAAGTCGGA TTAGCTAGTTGGTGGG>gi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequence ACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACA TTCCGAAAGGGATGCTAATACCGCA TACGCCCTACGGGGGAAAGCAGGGGATCTTCGG ACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTAC CAAGGCGACGA TCTGTAGCGGGTCTGAGAGGATGA………………………….参考序列选择注意事项:1、不选非培养(unclutured)微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
1株海洋乳酸菌的鉴定及生物学特性的初步研究赵鸭美;刘林;安静莹;钟敏;胡雪琼;刘颖【摘要】对从南海海域沙虫(Sipunculus nudus)肠道分离到的1株海洋乳酸菌ZH-101,通过形态学及生理生化特性实验,并结合16S rRNA序列同源性分析,将其鉴定为棒状乳杆菌扭曲亚种(Lactobacillus coryniformis subsp,torquens).采用双层牛津杯琼脂扩散法测定其发酵上清液对金黄色葡萄球菌、大肠杆菌、枯草芽孢杆菌、单核增生李斯特菌、副溶血性弧菌、黑曲霉6种指示菌的抗菌活性并对该菌做了部分生长特性研究.结果表明,其发酵液对食品中常见的腐败菌、致病菌有良好的抑制作用,该菌株最适生长温度为30℃,最适pH为6.0,培养6h后进入对数期,18h后生长进入稳定期.【期刊名称】《北京联合大学学报(自然科学版)》【年(卷),期】2013(027)002【总页数】5页(P59-63)【关键词】乳杆菌;分离鉴定;抑菌活性;生物学特性【作者】赵鸭美;刘林;安静莹;钟敏;胡雪琼;刘颖【作者单位】广东海洋大学食品科技学院,广东省水产品加工与安全重点实验室,广东普通高等学校水产品深加工重点实验室,广东湛江524088【正文语种】中文【中图分类】Q93-3310 引言乳酸菌作为一种益生菌广泛应用于食品行业中,它能抑制或杀死一些食品腐败菌和致病菌,改善食品风味,调节人体肠道菌群的生态平衡,有利于身体健康[1]。
近几年不断报道,一些乳酸菌在代谢过程中产生一种或多种具有抑菌活性的多肽或前体多肽即细菌素,具有抗菌性强、抑菌谱广、安全无毒等特点,是开发天然食品防腐剂的重点研究方向[2]。
我国南海海域广阔,海洋生物资源丰富、种类繁多,特殊的海洋生存环境使海洋生物具有与陆生生物不同的生理性状,并产生许多结构新颖、作用特殊的生物活性物质,是寻找乳酸菌新种和具有特殊功能的生理活性物质的重大来源[3-5]。
本研究对从南海海滩沙泥中挖出的沙虫(Sipunculus nudus)肠道中分离得到的一株细菌进行多相鉴定,对其发酵液进行了抑菌活性实验,并对它的生物学特性进行了初步研究。
如何用MEGA和Clustalx构建进化树MEGA是一个关于序列分析以及比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。
功能比以前多有改进。
现主要介绍使用Mega 5.0构建系统进化树的方法。
供大家参考。
用MEGA构建进化树有以下步骤:1、测序:将克隆扩增测序得到的16S rDNA序列进行测序。
2、NCBI上做Blast找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSATA 格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如>XXXXAGGCTTAACACA TGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCG GACGGGTGAGTAA TGCTTAGGAA TCTGCCTA TTAGTGGGGGACAACATTCCGAAAGGA ATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAA TAGATGAGCCTAAGTCGGA TTAGCTAGTTGGTGGG>gi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequence ACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACA TTCCGAAAGGGATGCTAATACCGCA TACGCCCTACGGGGGAAAGCAGGGGATCTTCGG ACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTAC CAAGGCGACGA TCTGTAGCGGGTCTGAGAGGATGA………………………….参考序列选择注意事项:1、不选非培养(unclutured)微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
用CLUSTALX和PHYLIP软件从DNA序列推导进化树一、用CLUSTALX软件对已知DNA序列(如下)做多序列比对。
M._mulattaM._fascicularisM._sylvanusHomo_sapiensGorillaPongoSaimiri_sciureusLemur_catta操作步骤:1、双击进入CLUSTALX程序,点FILE进入LOADSEQUENCE,打开dna.seq文件。
2、点ALIGNMENT,在默认alignment parameters下,点击Do complete Alignment 。
在新出现的窗口中点击ALIGN进行比对。
3、点FILE进入Save sequence as,在format 框中选PHYLIP,文件在PHYLIP软件目录下以DNA.phy存在,点击OK,。
4、将PHYLIP软件目录下的DNA.phy文件拷贝到EXE文件夹中。
用计事本方式打开的DNA.phy文件的部分序列如下:8 898M._mulatta AAGCTTTTCT GGCGCAACCA TCCTCATGAT TGCTCACGGA CTCACCTCTTM._fascicu AAGCTTCTCC GGCGCAACCA CCCTTATAAT CGCCCACGGG CTCACCTCTTM._sylvanu AAGCTTCTCC GGTGCAACTA TCCTTATAGT TGCCCATGGA CTCACCTCTTHomo_sapie AAGCTTCACC GGCGCAGTCA TTCTCATAAT CGCCCACGGG CTTACATCCTGorilla AAGCTTCACC GGCGCAGTTG TTCTTATAAT TGCCCACGGA CTTACATCATPongo AAGCTTCACC GGCGCAACCA CCCTCATGAT TGCCCATGGA CTCACATCCTSaimiri_sc AAGCTTCACC GGCGCAATGA TCCTAATAAT CGCTCACGGG TTTACTTCGTLemur_catt AAGCTTCATA GGAGCAACCA TTCTAATAAT CGCACATGGC CTTACATCAT二、用PHYLIP软件推导进化树。
如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP 建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA 和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1 GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGATTAGTGGCGAACGGGTGAGTAACA CGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCGGATA GGACCTCGGGATGCATGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene,partial sequence CGATTAGAGTTTGATCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAAG TCGAACGATGAAGCCCAGCTTGCTGGGTGGATTAGTGGCGAACGGGTGAGTAACACGTG GGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCGGAT>TS2 TGCAAGTCGAGCGAATGGATTAAGAGCTTGCTCTTATGAAGTTAGCGGCGGACGGGTGA GTAACACGTGGGTAACCTGCCCATAAGACTGGGATAACTCCGGGAAACCGGGGCTAATA CCGGATAACATTTTGAACTGCATGGTTCGAAATTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383 GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAATGGATTAAGAGCTTGC TCTTATGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGACTG GGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
利用mega构建树原理
Mega构建树的原理主要基于系统发育树(又称分子进化树)的概念。
这是一种描述一群有机体发生或进化顺序的拓扑结构,用于在生物信息学中描述不同生物之间的相关关系。
拓扑结构将讨论范围内的事物之间的相互关系表示出来,将这些事物之间的关系通过图表示出来。
Mega软件可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。
在构建系统发育树时,它采用了一系列的算法和模型,如邻接法(NJ)、最大似然法(ML)、最大简约法(MP)和贝叶斯法(Bayes)等。
这些方法和模型的选择取决于具体的数据和研究目标。
构建系统发育树的一般过程包括以下几个步骤:
1. 数据准备:收集需要研究的物种的基因或蛋白序列,并进行比对,以确保它们的同源性。
比对的结果可以保存为特定的格式,如FASTA。
2. 模型选择:根据数据的特性,选择一个合适的进化模型。
例如,对于DNA序列,可以选择GTR、TN93、HKY等模型;对于蛋白序列,可以选择JTT、WAG、LG等模型。
3. 树的构建:使用选择的模型和方法,构建系统发育树。
这个过程可能包括搜索最优的树结构、计算分支长度等。
4. 树的评估和优化:通过一些统计方法,如自展值(Bootstrap)等,对构建的树进行评估和优化,以提高其可靠性。
需要注意的是,构建系统发育树是一个复杂的过程,需要一定的专业知识和经验。
同时,由于生物进化的复杂性,构建的树可能并不完全准确,需要结合其他证据进行解释和验证。
生物学利用MEGA5.0和Clustalx1.83软件构建进化
树
MEGA是一个关于序列分析以及比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。
功能比以前多有改进。
现主要介绍使用Mega 5.0构建系统进化树的方法。
供大家参考。
用MEGA构建进化树有以下步骤:
1、测序:
将克隆扩增测序得到的16S rDNA序列进行测序。
2、NCBI上做Blast
找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSATA 格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如
>XXXX
AGGCTTAACACA TGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCG GACGGGTGAGTAA TGCTTAGGAA TCTGCCTA TTAGTGGGGGACAACATTCCGAAAGGA ATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAA TAGATGAGCCTAAGTCGGA TTAGCTAGTTGGTGGG
>gi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequence ACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACA TTCCGAAAGGGATGCTAATACCGCA TACGCCCTACGGGGGAAAGCAGGGGATCTTCGG ACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTAC CAAGGCGACGA TCTGTAGCGGGTCTGAGAGGATGA……
…………………….
参考序列选择注意事项:
1、不选非培养(unclutured)微生物为参比;
2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
3、使用clustalx1.83进行序列比对
打开压缩文件clustalx1.83,运行其中的clustalx.exe文件,如图:
点击sequences,将整理好的*.txt序列文件导入clustalx1.83,如图
接着点击Alignment/Do Complete Aligment
程序自动运行,得出结果,自动输出*.aln和* .dnd 为后缀的两个文件,并自动存入你*.txt 文件所在的文件夹内。
序列比对也可以直接用MEGA来做。
4、运行程序MEGA 5.0,如下图所示:
点击:File导入Clustal程序得到的*.aln文件。
再点to MEGA Format,打开转换文件对话框,从目的文件夹中选中Clustal 对比分析后所产生的*.aln文件,转换为*.meg文件。
转换时一路确认相关界面。
最后查看meg序列文件最后是否正常,命名新文件存盘保存*.meg 文件,*.meg文件会和aln文件保存在上述*.txt同一个文件夹中。
5、关闭转换窗口,回到主窗口,现在点面板上的“Click me to activate a data file”打开刚才的*.meg文件。
如果为核酸序列,选择“Nucleotide sequence”,点击“OK”,得到以下图示。
选择默认的Standard,点击OK后,如图所示。
点击程序中的,可以得到下图
在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标,可对所选择的序列进行编辑,完成后点击close即可。
序列编辑完成后,可进行保存,点击保存后出现以下界面,点击ok即可。
构建进化树的算法两类主要方法简要说明:
独立元素法(discrete character methods)是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。
距离依靠法(distance methods)是指进化树的拓扑形状由两两序列的进化距离决定的。
进化树枝条的长度代表着进化距离。
独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。
(1)phylogeny→UPGMA
(2)用Bootstrap构建进化树,MEGA的主要功能就是做Bootstrap验证的进化树分析,Bootstrap验证是对进化树进行统计验证的一种方法,可以作为进化树可靠性的一个度量。
各种算法虽然不同,但是操作方法基本一致。
进化树的构建是一个统计学问题。
我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。
如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。
模拟的进化树需要一种数学方法来对其进行评估。
不同的算法有不同的适用目标。
一般来说,最大简约性法适用于符合以下条件的多序列:i 所要比较的序列的碱基差别小,ii 对于序列上的每一个碱基有近似相等的变异率,iii 没有过多的颠换/转换的倾向,iv 所检验的序列的碱基数目较多(大于几千个碱基);用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。
如果分析的序列较多,有可能要花上几天的时间才能计算完毕。
具体构建过程如下
①参数的设置:点击,选择该菜单中的Construct/test Neighbor-Joining tree,
选择前面转换得到的*meg文件,得到下图
点击OK
对下图的参数进行设置:
说明:
系统进化树的测试方法Test of Phylogeny,通常要选择Bootstrap method,也可以选择不进行测试;
重复次数No. of bootstrap Replications——通常设定至少要大于100比较好,随机数种子可以自己随意设定,不会影响计算结果。
一般选择500或1000。
Model/Method——通常选择Kimura 2-paramete r。
设定完成,点compute,开始计算得到进化树构建的结果。
如下图所示;
该窗口中有两个属性页,一个是原始树Original tree,一个是bootstrap验证过的一致树Bootstrap concensus tree。
树枝上的数字表示bootstrap验证中该树枝可信度的百分比。
得到构建的进化树后可以对该进化树进行优化。
(本文参考网友的文章,同Mega的其它版本使用基本相同,在此表示感谢。
以下进化树的优化部分直接引用)
(1)利用该软件可得到不同树型,如下图所示:
除此之外,还可以有多种树型,根据需要来选择。
2)显示建树的相关信息:点击图标i。
3)点击优化图标,可进行各项优化:
Tree栏中,可以进行树型选择:rectangular tree/circle tree/radiation tree。
每种树都可以进行长度,宽度或角度等的设定
Branch:可对树枝上的信息进行修改。
Lable:可对树枝的名字进行修改。
Scale:标尺设置
Cutoff:cut off for consensus tree。
一般为50%。
9、进化树的分类优化
Place root on branch:可以来回转换。
Flip subtree:180度翻转分枝,名字翻转180度。
Swab subtree:交换分枝,名字不翻转。
Compress/expand subtree与Set divergent time:可以把同一分枝的基因压缩或扩展。
点击Compress/expand subtree后,在要压缩的分枝处点击,出现以下界面,在name/caption 中输入文件名(例如wwww),其他还有很多的选项,设置好了,点击OK。
所得到的结果,可以在压缩和扩展之间转换。
10. 调整进化树
根据所的进化树的效果,要进行调整,包括多余序列删除、不足序列添加、种属名称标注等等,还要根据投稿杂志要求在PHOTOSHOP中修改等。
完成后的进化树应包含充足的信息。
参考网友的进化树完成图如下:
(再次对贡献《如何使用Mega3.1构建进化树》原文的网友表示致谢,本文是在学习该文的基础上,分享给大家的,仅供参考)。