MEGA6使用教程——进化树的构建
- 格式:docx
- 大小:1.32 MB
- 文档页数:8
利用MEGA 来构建进化树(molecular evolutionary genetics analysis 分子进化遗传分析)打开mega5,选择Align----edit/built alignment----create a new alignment—OK选择DNA/protein出现新的对话框Open------选择已经保存好的用clustalx 经过比对保存的以.aln格式的文件打开之后,出现下面的页面双击文件名可以进行修改的。
我的就是从这里开始修改把A,B,C 都去掉,只留号码就好右键菜单点击delete 删除带※的那一行。
得到下面的图示,点击保存,重新起名字。
之后点击此图内的Alignment 选择Align by clustalW即可。
默认设置即可,点击OK就进行比对了,此后会出现一个过渡对话框,显示的是两两比对和多序列比对的过程之后回到初始页面,就是这个页面之后点File---点开,把刚才保留的文件点开然后出现下面的页面多了几个内容,点击TA的那个框框。
之后出现这样的框框图片然后在主程序中选择phylogeny---construct/test neighbor-joining tree,然后出现下面的页面黄色框框处的的参数是可以改变的,该图为我已经改变好的,把Bootstrap 的值改为1000 Methods根据文献上的参考改为了Kimura2-parameter model.之后点击compute,就出现了,而且还带有必需的支持率即自展值,是用来检验你所计算的进化树分支可信度的。
简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如果没出现就给0分,这样经过你给定的repetitions 次(至少1000次)重排构树打分后,每个分枝就都得出分值,计算机会给你换算成bootstrap值。
重排的序列有很多组合,值越小说明分枝的可信度越低,最好根据数据的情况选用不同的构树方法和模型。
MEGA:系统进化树绘制1.从测序公司获取可以用TXT格式打开的菌株16SrDNA序列文本信息;2.打开NCBI网站(https:///),依次点击BlAST—>Microbes,进入最下图所示界面。
3.将序列信息粘贴到黄色文本框内,点击BLAST按钮,进入比对结果页面,根据所需选择20条(参考)相似序列信息,点击Download,下载FASTA(aligned sequences)格式序列信息到电脑;4.将测序所得序列信息与Blast所得序列信息合并到同一个Text文件中;5.打开MEGA软件(以MEGA6.06为例),点击Align—>Edit/Build Alignment,选择Creat a new alignment并点击OK,点击DNA,进入最下图界面,最大化子界面;6.点击下图红线圈出的图标或通过Edit—>Insert Sequence From File Ctrl+I,进入第二个图所示界面,将文件格式由ABI改为Text,选择所选序列信息文件,点击打开;7.按住Shift,鼠标点击首条和最后一条多余的序列信息,即可选择某一需要删除的序列信息区域,点击Delete删除多余序列信息,并编辑各序列名称,点击保存编辑好的序列信息;8.点击Data—>Phylogenetic Analysis(系统进化分析),点击“Yes”完成系统进化分析;9.回到MEGA主页面,依次点击Analysis—>Phylogeny—>Construct/Test Neighbor-Joining Tree...,在跳出的界面中点击“Yes”,接着将跳出页面中的Test of Phylogeny项的None改为Bootstrap method,点击Compute,系统完成运算,生成系统进化树;10.依次点击Image—>Save as PDF file,保存成PDF格式系统发育树图谱。
1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA 序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1 GCAGTCGAACGATGAAGCCCAGCTTGCTGGGT GGATTAGTGGCGAACGGGTGAGTAACACGTGG GTGATCTGCCCTGCACTTCGGGATAAGCCTGGG AAACTGGGTCTAATACCGGATAGGACCTCGGGA TGCATGTTCCGGGGTGGAAAGGTTTTCCGGTG CAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGATCCTGGCTCAGGACGAACG CTGGCGGCGTGCTTAACACATGCAAGTCGAACG ATGAAGCCCAGCTTGCTGGGTGGATTAGTGGC GAACGGGTGAGTAACACGTGGGTGATCTGCCC TGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCGGAT>TS2 TGCAAGTCGAGCGAATGGATTAAGAGCTTGCTC TTATGAAGTTAGCGGCGGACGGGTGAGTAACA CGTGGGTAACCTGCCCATAAGACTGGGATAACT CCGGGAAACCGGGGCTAATACCGGATAACATTT TGAACTGCATGGTTCGAAATTGAAAGGCGGCTT CGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383 GATGAACGCTGGCGGCGTGCCTAATACATGCAA GTCGAGCGAATGGATTAAGAGCTTGCTCTTATG AAGTTAGCGGCGGACGGGTGAGTAACACGTGG GTAACCTGCCCATAAGACTGGGATAACTCCGGG AAACCGGGGCTAATACCGGATAACATTTTGAAC YGCATGGTTC………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
第一步:打开软件下面介绍菜单的使用:Data菜单:Creat a new :创建一个新的数据比对文件,也就是说当我们比对完一组后,想接着比对另一组,那么使用它就可以不用退出直接把数据文件导入;Open :打开先前已经比对并保存好的文件,它包含两个子菜单:retive sequence from file 和saved aligment session ;Close: 关闭当前的比对数据文件;Save session :保存当前比对结果,可以给比对的结果一个文件名;Export alignment :将当前的序列比对结果输出到指定文件,有两种输入格式可供选择:MGTA 和FASTA.DNA sequence :使用它来选择输入的数据DNA 序列,这里需要说明的是如果你输入的数据是氨基酸序列的话,比对窗口只显示一个标签,若是DNA 序列的话则显示两个标签,一个是DNA 序列的,另一个是氨基酸序列的。
Protein sequences :选择输入的氨基酸序列,选择后,所以的位点就被当作氨基酸残基位点来对待。
Translate/untranslate :只有比对的序列是编码蛋白的DNA序列的时候才可用。
它可以根据指定的遗传密码表将DNA 序列翻译成特定的氨基酸序列。
Select genetic code table :使用它将编码蛋白的DNA 翻译成特定的蛋白序列。
R everse complement :将选择的一整行的DNA 序列变为与之互补配对碱基序列。
Exit alignment explorer :退出序列比对的资源管理窗口Edit 菜单:使用这个菜单可以对我们的比对序列进行想要的一些编辑工作具体为Undo:撤销上一步操作;Copy:复制;Cut:剪切;Paste:粘贴;这三个操作都可以只针对一个碱基或氨基酸残基也可以是一段甚至是整个序列;Delete:从比对表格中删除一段序列;Delete gaps:去掉序列中的空缺;Insert blank sequence:重新插入一空行;标签和序列都是空的;Insert sequence from file :从已保存的文件中插入新的序列;Select sites :选择一列序列,与点击比对表上方的灰白空格作用类似;Select sequence:选择一行序列,与点击比对表格左侧的标签名作用类似;Select all:全选;Allow base editing :只读保护,只有选择后才能对序列进行编辑操作,否则所以的序列为只读格式,不能进行任何编辑操作。
MEGA软件——系统发育树构建方法1)序列文本构树之前先将每个样品的序列都分别保存为txt文本文件中,序列只包含序列字母(ATCG或氨基酸简写字母)。
文件名名称可以已经您的想法随意编辑。
2)序列导入MEGA 5首先打开MEGA 5软件,界面如下:然后,导入需要构建系统进化树的序列:点击OK出现新的对话框,创建新的数据文件导入成功3)序列比对分析点击W,开始比对。
比对完成后删除序列两端不能完全对其的碱基。
系统分析然后,关闭该窗口,在弹出的对话框中选择保存文件,文件名随便去,比如保存为1。
4)系统发育树构建以NJ为例Bootstrap选择1000,点Computer,开始计算计算完毕后,生成系统发育树。
以下“系统发育树树的修饰”方法沿用斑竹brightfuture01的方法5)树的修饰建好树之后,往往需要对树做一些美化。
这个工作完全可以在word中完成,达到发表文章的要求。
点击image,copy to clipboard。
新建一个word文档,选择粘贴。
见下图:在图上点击右键-编辑图片,就可以对文字的字体大小,倾斜等做出修饰。
见下图:这个时候可以通过Adobe professional 对其进行图像导出:先将此word文档打印成PDF,见下图:将打印出来的PDF保存在桌面上,打开,如下图:此时,点击工具,高级编辑工具,裁剪工具,如下图所示:选择需要的区域以删除周围的空白区,双击发育树,会出现下图:点击确定,出现下图(把空边切掉了):点击文件,另存为,在保存类型一栏中选择TIFF格式,点击确定后会生成下面这个图片,所生成图片绝对可以满足文章的发表:OK,结束了,自己玩一把吧。
如何用MEGA构建进化树是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web 数据库检索;下载后可直接使用,主要包括几个方面的功能软件:iDNA和蛋白质序列数据的分析软件;ii序列数据转变成距离数据后,对距离数据分析的软件; iii对基因频率和连续的元素分析的软件;iv把序列的每个碱基/氨基酸独立看待碱基/氨基酸只有0和1的状态时,对序列进行分析的软件;v绘制和修改进化树的软件,进行网上blast搜索;用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|6|gb|| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi||emb|| Bacillus cereus partial 16S rRNA gene, strain TMWGA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTA TGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则:a,不选非培养unclutured微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列;2. 序列比对将整理好的序列导入,如图接着程序自动运行,得出结果,自动输出.aln和.dnd 为后缀的两个文件; 序列比对也可以直接用MEGA来做;3. 打开程序MEGA,如下图所示:4. 只能打开meg格式的文件,但是它可以把其他格式的多序列比对文件转换过来,用.aln格式Clustal的输出文件转换.meg文件;点File:Convert to MEGA Format,打开转换文件对话框,从目的文件夹中选中Clustal 对比分析后所产生的.aln文件,点击打开;5. 转换好的meg文件,会弹出一个提示信息,点击ok;查看meg序列文件最后是否正常,若存在clustal. 行,即可删除;点存盘保存meg文件,meg文件会和aln文件保存在同一个目录;6. 关闭转换窗口,回到主窗口,现在点面板上的“Click me to activate a data file”打开刚才的meg文件;如果为蛋白质序列,选择“protein sequence”,电击“OK”,得到以下图示,数据输入之后的样子,窗口下面有序列文件名和类型;而在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标, 可对所选择的序列进行编辑,完成后点击close即可;序列编辑完成后,可进行保存,点击保存后出现以下界面,点击ok即可;7. 构建进化树的算法主要分为两类:独立元素法discrete character methods和距离依靠法distance methods;所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了;而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的;进化树枝条的长度代表着进化距离;独立元素法包括最大简约性法Maximum Parsimony methods和最大可能性法Maximum Likelihood methods;距离依靠法包括除权配对法UPGMAM和邻位相连法Neighbor-joining;1 phylogeny→UPGMA2用Bootstrap构建进化树,MEGA的主要功能就是做Bootstrap验证的进化树分析,Bootstrap 验证是对进化树进行统计验证的一种方法,可以作为进化树可靠性的一个度量;各种算法虽然不同,但是操作方法基本一致;进化树的构建是一个统计学问题;我们所构建出来的进化树只是对真实的进化关系的评估或者模拟;如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”;模拟的进化树需要一种数学方法来对其进行评估;不同的算法有不同的适用目标;一般来说,最大简约性法适用于符合以下条件的多序列:i 所要比较的序列的碱基差别小,ii 对于序列上的每一个碱基有近似相等的变异率,iii 没有过多的颠换/转换的倾向,iv 所检验的序列的碱基数目较多大于几千个碱基;用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时;如果分析的序列较多,有可能要花上几天的时间才能计算完毕;过程如下①参数的设置:phylogeny→bootstrap test of phylogeny→NJ②系统进化树的测试方法,可以选择用Bootstrap,也可以选择不进行测试;重复次数Replications通常设定至少要大于100比较好,随机数种子可以自己随意设定,不会影响计算结果;一般选择500或1000;有许多Model供选择,默认为Kimura 2-paramete r,不同的Model有不同的算法,具体请参考专业的生物信息学书籍;设定完成,点compute,开始计算;②结果输出:这个过程所耗时间和序列的数量和长短成正比,程序就会产生这么一个树,该窗口中有两个属性页,一个是原始树,一个是bootstrap验证过的一致树;树枝上的数字表示bootstrap验证中该树枝可信度的百分比; 结果如下:8. 进化树的优化:1利用该软件可得到不同树型,如下图所示:除此之外,还可以有多种树型,根据需要来选择; 2显示建树的相关信息:点击图标i;3点击优化图标,可进行各项优化:Tree栏中,可以进行树型选择:rectangular tree/circle tree/radiation tree;每种树都可以进行长度,宽度或角度等的设定Branch:可对树枝上的信息进行修改;Lable:可对树枝的名字进行修改;Scale:标尺设置Cutoff:cut off for consensus tree;一般为50%;9、进化树的分类优化Place root on branch:可以来回转换;Flip subtree:180度翻转分枝,名字翻转180度;Swab subtree:交换分枝,名字不翻转;Compress/expand subtree与Set divergent time:可以把同一分枝的基因压缩或扩展;点击Compress/expand subtree后,在要压缩的分枝处点击,出现以下界面,在name/caption 中输入文件名例如w,其他还有很多的选项,设置好了,点击OK;所得到的结果,可以在压缩和扩展之间转换;10. 调整进化树根据所的进化树的效果,要进行调整,包括多余序列删除、不足序列添加、种属名称标注等等,还要根据投稿杂志要求在PHOTOSHOP 中修改等;完成后的进化树应包含充足的信息;本人所做进化树完成图如下:。
利用MEGA6建立进化树一.NCBI中选择Protein数据库,搜索PD-1相关蛋白
二.选择兴趣蛋白,在Send to选项中选择File-FASTA格式
三.下载安装MEGA6,刚刚下载的FASTA文件变为可读,双击用MEGA6打开
四.展开上图得到下图,至此蛋白序列成功输入MEGA
五.选择菜单栏上Alignment-Align by Clustalw进行蛋白序列比对
六.得到比对后结果,菜单栏-Data-Export Alignment输出比对结果, 得到MEGA6源文件,接下来就可以进行进化树绘制
八.返回主程序界面,菜单栏选择Phylogeny-第二个选项Neighbor,选择刚刚输出的数据,在个性化界面按需要自己的做调整,最后得到所需进化树.。