ClustalX使用方法
- 格式:ppt
- 大小:679.00 KB
- 文档页数:28
实习二:序列比对-Dotplot和Clustalx一、实习目的:(1)掌握利用点阵法进行两条序列比对(2)学会使用Clustalx软件进行多条序列比对二、实习内容:(一)Dotplot点阵法是非常简单、直观的一种两条序列比对的方法,它能展示出两条序列所有可能配对的区域,由研究者决定最有意义或自己感兴趣的区域。
通过点阵法还可以对序列自身进行比对,寻找序列内部的正向或反向重复区域或互补区域。
正向重复为与主对角线平行的折线区域,而反向重复为与主对角线垂直的折线区域。
/molkit/dnadot/主要设置:窗口大小(Window Size):即在两条序列中同时比较的字符串的长度。
此软件要求窗口大小必须为奇数。
错配限制(Mismatch Limit):在给定窗口里,允许错配的数目。
如果错配数量小于等于此数目,则在图上标记点,否则,不做标记。
窗口大小越小,图上出现的点的数目越多,反之越小。
错配限制越小,图上出现的点越少,反之越小。
尝试改变这两个参数,体会其对比对结果的影响。
主要作用:1.通过序列自身比对,寻找其重复和反向重复区域。
2.查找同源序列,在entrez或srs系统,查寻不同物种中的同源序列再进行Dotplot分析。
(二)ClustalXClustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。
即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果。
Clustalx比对结果是构建系统发育树的前提。
运用流程:载入序列―>编辑序列―>设置参数―>完全比对―>比对结果三、作业1、简要说明你如何搜索不同物种的同源序列,并解释这些序列进行dotplot分析得到的结果。
答:主要有以下几个步骤:1)、首先进入entrez或srs系统,我选择的是entrez系统。
2)、点击,进入界面。
Clustalx的中文使用说明书
生物
用ClustalX做多序列比对分析图示
1、打开程序如下图所示:
2、Load Sequnce, 载入序列如下图所示:
3、选择序列文件,FASTA格式的如下图所示:
4、用文本编辑器察看FASTA序列文件内容,这里用的是记事本,推荐用EditPlus或者Ultraedit 如下图所示:
5、序列Load进去之后如下图所示:
6、Do Complete Alignment, 通常情况下直接选这个即可,无须修改比对参数如下图所示:
7、点Do Complete Alignment之后弹出的文件对话框,.dnd的是输出的指导树文件,.aln 的是序列比对结果,它们都是纯文本文件如下图所示:
点“ALIGN”之后开始等待,如果序列不多,很快就可以算完,如果数据很多,可能要等一段时间,这时候可以用眼睛盯着ClustalX的状态栏,那里会有程序运行状态和现在正在比对那两条序列的提示信息,看看可以消磨时间。
8、比对结束之后,我们可以看到这个结果如下图所示:
9、这时候我们可以发现ClustalX已经生成了.dnd和.aln两个文件,仍然用文本编辑器打开来看,这时.aln文件,这个文件可以用Mega2做进一步的bootstrap进化树分析如下图所示:
10、这是.dnd文件(指导树) 如下图所示:
11、可以用Treeview打开dnd文件,看上去就像这样子如下图所示
图3-15 ClustalX所识别的文件输入格式。
实验三、多序列比对一、软件平台clustalX、bioedit、DnaMan二、过程Clustal:○1Load Sequence(数据文件必须在ClustalX目录里)○2菜单Alignment->Alignment Parameters->Multiple Alignment Parameters 进入参数设置页面○3alignment -> do complete alignment,进行完全比对(生成.dnd和.aln 文件)○4比对完成,选择保存结果文件的格式phy:File->Save Sequence as-> 结果处理:Bioedit: ○1导入.aln文件○2“掐头去尾”editDnaMan: ○1打开DnaMan,依次打开“文件/打开指定的/多重比对”,载入Clustal X比对后的.aln文件○2点击options,参数设置,在这里,你可以设置每行显示的序列,是否显示一致序列,彩色或黑白等○3点击Output,输出为图形文件实验五、分子进化与系统发育分析一、软件平台clustalX ,MEGA,Phylip(注:phylip使用方法可搜“phylip软件的说明”)TreeView二、实验过程ClustalX:(1)使用CLUSTALX多序列比对,输出格式为*.PHY(具体见上文)(2)下载phylip,双击打开SEQBOOT ,按路径输入刚才生成的*.PHY文件;设定适当参数(4n+1);输出outfile1文件。
(3)打开PROTPARS(最大简约性法)【可选,具体情况具体分析】,输入outfile1文件后,得到outfile2和outtree1;(4)打开CONSENSE程序,输入outtree2,运行输出outfile3和outtree3文件;(5)树文件outtree3用TREEVIEW软件打开显示MEGA软件:(1)File->open a file/session->打开fasta文件,选择相应的data type (2)Align->edit/build aligns->Retrieve sequences from a file,打开文件;进行多序列比对,并另存为.meg文件(3)点击Phylogeny 选项,选择建树方法,建树保存。
工具:JModeltest下载地址:http://darwin.uvigo.es/补充工具:Clustalx下载地址:/1.使用Clustalx 工具进行多序列比对,将结果存储为FASTA 格式2.Clustalx 工具是一种多序列比对工具。
本次实验我使用的是2.0.12 版本,和以前的输出格式相比,又多了一种新的输出格式——FASTA 格式,这个格式是将比对结果中的gap 用“- ”替换,然后存储成一般的序列格式,这个格式对接下去JModeltest 的使用十分重要。
一般情况下FASTA 格式并不是默认的输出格式,需要在设置中添加。
首先,打开Clustalx, 再选择Alignment -> Output Format Options ,在弹出的对话框中将FASTA format 打上勾即可。
另外,Jmodeltest 也可以使用NEXUS 格式。
下面是一个例子,假设有两条序列(虽然是个多序列比对工具,还是举个两条序列的简单例子比较容易理解):>P1ATGGGGTTTAGA TAA>P2ATGTTTAGTTAA比对之后存储的FASTA 结果应该是:>P1ATGGGGTTTAGA TAA>P2- - - ATGTTTAGTTAA注意事项:A. 输出时记得要对输出的文件名进行修改,否则会把原来的文件替换掉;B. 进行比对时,比对文件必须放在纯英文的路径下,否则软件无法读取;2. JModeltest 的使用:JModeltest 下载下来后不需要再安装,直接运行即可。
使用起来也简单易懂。
首先,点击File -> Load DNA alignment ,读取比对结果的FASTA 格式文件文件,之后选择需要进行测试的模型,点击Analysis -> Compute likelihood scores ,弹出对话框:对话框提供了4 种不同模式进行计算,每种模式包含的模型具体如下:3 schemes: JC, HKY and GTR.5 schemes: JC, HKY, TN, TPM1, and GTR.7 schemes: JC, HKY, TN, TPM1, TIM1, TVM and GTR.11 schemes: JC, HKY, TN, TPM1, TPM2, TPM3, TIM1, TIM2, TIM3, TVM and GTR.选择好这后就可以点击开始计算。
【软件使⽤】clustalX2使⽤以及相关的问题Clustalx的操作第⼀步:输⼊序列⽂件。
第⼆步:设定⽐对的⼀些参数。
参数设定窗⼝。
第三步:开始序列⽐对。
第四步:⽐对完成,选择保存结果⽂件的格式相关问题CLUSTALX-是CLUSTAL多重序列⽐对程序的Windows版本。
Clustal X为进⾏多重序列和轮廓⽐对和分析结果提供⼀个整体的环境。
这⾥总结⼀下在使⽤做序列⽐对过程中⼀些常见的问题~1,从⽹上看来说CLUSTALX软件使⽤的时候,开始要输⼊FASTA格式准备的DNA序列test.seq⽂件。
请问这种⽂件怎么⽣成啊?记事本?其实没有规定的⽂件名,不⼀定是叫test.seq,任何你想要的都可以,除了中⽂名(下⾯会说明)。
主要⾥⾯的内容是正确的格式就⾏了~。
Clustal⽀持的格式有多种,如NBRF/PIR, EMBL/SWISSPROT, Pearson (Fasta), Clustal (*.aln), GCG/MSF (Pileup), GCG9/RSF and GDE 等2,什么使⽤时,总是导⼊不了序列,出现 ERROR:Can not open output file??这个问题挺多⼈碰到过的~这是因为你导⼊的⽂件的路径包含有中⽂名。
把⽂件放在其它地⽅看看。
最好路径也不要有空格了。
当然前提是你的格式要正确了。
这个问题同样适⽤于ClustalW或其它dos类的软件3,ClustalX⽐对后的结果中.aln⽂件是什么?这个是序列⽐对结果的⽂件。
关于这部分,你可以看4,ClustalX⽐对后的结果中.dnd⽂件是什么?。
如何用MEGA5.0和Clustalx1.83构建进化树MEGA是一个关于序列分析以及比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。
功能比以前多有改进。
现主要介绍使用Mega 5.0构建系统进化树的方法。
供大家参考。
用MEGA构建进化树有以下步骤:1、测序:将克隆扩增测序得到的16S rDNA序列进行测序。
2、NCBI上做Blast/blast/Blast.cgi找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSA TA 格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如>XXXXAGGCTTAACACA TGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCG GACGGGTGAGTAA TGCTTAGGAA TCTGCCTA TTAGTGGGGGACAACA TTCCGAAAGGA A TGCTAA TACCGCA TACGCCCTACGGGGGAAAGCAGGGGA TCTTCGGACCTTGCGCTAA TAGA TGAGCCTAAGTCGGA TTAGCTAGTTGGTGGG>gi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequenceACTTAGCGGCGGACGGGTGAGTAA TGCTTAGGAA TCTGCCTA TTAGTGGGGGACAACA TTCCGAAAGGGA TGCTAA TACCGCA TACGCCCTACGGGGGAAAGCAGGGGA TCTTCGG ACCTTGCGCTAA TAGA TGAGCCTAAGTCGGA TTAGCTAGTTGGTGGGGTAAAGGCCTAC CAAGGCGACGA TCTGTAGCGGGTCTGAGAGGA TGA………………………….参考序列选择注意事项:1、不选非培养(unclutured)微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
C l u s t a l x多重序列比对图解教程(B y R a i n d y) 本帖首发于Raindy'blog软件简介:CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。
ClustalX为进行多重序列和轮廓比对和分析结果提供一个整体的环境。
序列将显示屏幕的窗口中。
采用多色彩的模式可以在比对中加亮保守区的特征。
窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项。
主要功能:你可以剪切、粘贴序列以更改比对的顺序;你可以选择序列子集进行比对;你可以选择比对的子排列(Sub-range)进行重新比对并可插入到原始比对中;可执行比对质量分析,低分值片段或异常残基将以高亮显示。
当前版本:1.83PS:如果你是新手或喜欢中文界面,推荐使用本人汉化的Clustalx1.81版链接地址:ist&ID=7435(请完整复制)应用:Clustalx比对结果是构建系统发育树的前提实例:植物呼肠孤病毒属外层衣壳蛋白P8(AA序列)为例流程:载入序列―>编辑序列―>设置参数―>完全比对―>比对结果1.载入序列:运行ClustalX,主界面窗口如下所图(图1),依次在程序上方的菜单栏选择“File”-“LoadSequence”载入待比对的序列,如图2所示,如果当前已载入序列,此时会提示是否替换现有序列(Replaceexistingsequences),根据具体情形选择操作。
图1图22.编辑序列:对标尺(Ruler)上方的序列进行编辑操作,主要有Cutsequences(剪切序列)、Pastesequences(粘贴)、SelectAllsequences(选定所有序列),ClearsequenceSelection(清除序列选定)、Searchforstring(搜索字串)、RemoveAllgaps(移除序列空位)、RemoveGap-OnlyColumns(仅移除选定序列的空位)图33.参数设置:可以根据分析要求设置相对的比对参数。
几个进化树相关软件的使用方法我在此介绍几个进化树分析及其相关软件的使用和应用范围。
这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN (LINUX)。
在介绍软件之前,我先简要地叙述一下有关进化树分析的一些方法学问题。
进化树也称种系树,英文名叫“Phyligenetic tree”。
对于一个完整的进化树分析需要以下几个步骤:⑴要对所分析的多序列目标进行排列(To align sequences)。
做ALIGNMENT的软件很多,最经常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而后者是在DOS下的。
⑵要构建一个进化树(To reconstrut phyligenetic tree)。
构建进化树的算法主要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。
所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。
而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。
进化树枝条的长度代表着进化距离。
独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。
⑶对进化树进行评估。
主要采用Bootstraping法。
进化树的构建是一个统计学问题。
我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。
如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。
进化树分析及相关软件使用说明我在此介绍几个进化树分析及其相关软件的使用和应用范围。
这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN 〔LINUX〕。
在介绍软件之前,我先简要地表达一下有关进化树分析的一些方法学问题。
进化树也称种系树,英文名叫“Phyligenetic tree〞。
对于一个完整的进化树分析需要以下几个步骤:⑴要对所分析的多序列目标进行排列〔To align sequences〕。
做ALIGNMENT的软件很多,最经常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而后者是在DOS下的。
⑵要构建一个进化树〔To reconstrut phyligenetic tree〕。
构建进化树的算法主要分为两类:独立元素法〔discrete character methods〕和距离依靠法〔distance methods〕。
所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的〔例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了〕。
而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。
进化树枝条的长度代表着进化距离。
独立元素法包括最大简约性法〔Maximum Parsimony methods〕和最大可能性法〔Maximum Likelihood methods〕;距离依靠法包括除权配对法〔UPGMAM〕和邻位相连法〔Neighbor-joining〕。
⑶对进化树进行评估。
主要采用Bootstraping法。
进化树的构建是一个统计学问题。
我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。
如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树〞。
CLUSTALX进行序列比对1.将下载的序列放入一个Text文本文档中,序列按一定的格式,>pig AGAGACGGCCGCATCTTCTTGTGCAGTGCCAGCCTCGTCCCGTA GACAAAATGGTGAAGGTCGGTGTGAACGGATTTGGCCGTATTG GGCGCCTGGTCACCAGGGCTGCCATTTGCAGTGGCAAAGTGGA GATTGTTGCCATCAA的格式复制过来,放在一个文本文档里。
新建文本文档.txt注意:CLustal 1.83分析出了全序列比对,彩色比对区上门的*越多,表示这段序列越保守2.在File--load sequence载入序列,如图所示3.Alignment进行全序列比对--4.点击align5.在桌面上即可生成aln格式的文本文档(用于下面Mega5.02进行进化树构建)Mega5.02序列比对及建进化树序列比对1.用文本格式的序列数据进行比对2.Align---edit alignment即新建一个数据---0k---DNA3.Edit--insert sequence from file ---选择文本文档4.Alignent---Align by ciust W--ok---关闭序列比对--并保存在桌面上---Phylogeny--MAX5.两种不同的方法最大释然和邻近法邻近法更准确建进化树1.File--convert file format to mega2.3.点击文件夹从桌面载入aln格式的文本文档4.5.点击OK,再命名6.7.8.关闭窗口9.点击OK10.phylogen--text neighbor -joining tree -或者Maximum的方式进行构建--从桌面上选择刚命名的文件11.点击打开12.13.14.点击Yes15.16.17.将Test phylogery中的None改成如图18.19.20.进化树就构建成功--点击横线进行细节修改21.22.点击左边第五个蓝色的图标进行细节修改23.可以双击分类后的名称,进行名称修改,如Primer 5设计引物1.File---New--DNA sequence2.将序列复制过来(序列的格式必须是文本格式)--as is --OK3.点击Primer4.点击S--File-perferences5.一般将长度设置为20,然后根据需要可以适当提到21或者降到19 Length设置为20点击OK6.Search7.type--both-PCR size 100-1000--primer length 25-5--OK、点击OK8.选择打分高的,且退火温度在55℃左右的温度。