实验六 蛋白质家族序列模式及多序列比对
- 格式:doc
- 大小:60.50 KB
- 文档页数:4
蛋白质多序列比对蛋白质是生物体内很重要的分子之一,具有生命活动所需的功能性和结构性特征。
多个蛋白质之间存在着相似性和差异性,因此需要对它们进行多序列比对以了解其在进化过程中的变化和功能上的差异性。
下面是关于蛋白质多序列比对的一些知识点和相关工具:1. 多序列比对的意义多序列比对可以帮助我们寻找蛋白质序列中的保守区域和变异区域,揭示它们在进化过程中的演化轨迹,并进一步推断它们在生命活动中的功能和相互关系。
此外,多序列比对还可以为新蛋白质的发现和功能预测提供重要的线索。
2. 多序列比对的挑战由于蛋白质序列的长度和复杂性,进行多序列比对有许多技术上的挑战。
比如,如何解决序列长度不同的问题、如何选取合适的序列比对算法、如何处理多重比对结果等等。
3. 常用的序列比对工具常用的蛋白质序列比对工具包括 ClustalW、MUSCLE、T-Coffee、MAFFT 等。
其中,ClustalW 是最早和最常用的序列比对工具之一,适用于大多数简单的序列比对问题。
而 MUSCLE 和 T-Coffee 则比ClustalW 更适用于复杂的序列比对问题,可以处理包括 RNA、DNA 和蛋白质等在内的多种生物序列。
4. 序列比对结果的解析序列比对结果可以通过一些可视化工具进行解析,如Jalview、BioEdit、GeneDoc 等。
这些工具可以帮助我们更好地理解序列比对结果,发现保守区域和变异区域,了解序列间的相似性和差异性。
总之,蛋白质多序列比对是揭示生命机理和蛋白质结构功能的重要手段之一。
通过适当选择比对工具和解析工具,我们可以更好地理解蛋白质序列的演化和功能,为生命科学和医学领域的研究提供有力支持。
实验四.多序列比对一.实验目的:在多序列分析中,多序列比对具有广泛的应用,是许多其他分析的基础和前提,比如进化发生分析、构建位置特异性打分矩阵、找到一致序列等,本实验的目的是熟悉多序列比对相关的操作和编辑方法。
二.实验基本要求:了解和熟悉多序列比对的原理和基本方法。
三.实验内容提要:1.使用CLUSTALW 算法,比对一组蛋白质序列,该序列属于RAD51‐RECA,在DNA 的复制阶段起重要作用,这些序列可以从NCBI genbank、Uniprot 等序列服务器获取,序列的索引号码为:P25454,P25453,P0A7G6,P48295。
将这些序列保存在一个文本文件。
如果查询到的序列不止一个的话,选择第一个。
a.练习使用EBI CLUSTALW(/Tools/msa/clustalw2/);b. 将序列数据拷贝复制到窗口中;c. 采用默认参数进行比对;回答:clustalw 算法的基本原理?2. 在BAliBASE 网站查找一组蛋白质:1csy。
这些蛋白质的一致性为20‐40%,属于BAliBASE 参考序列1。
正确的比对结果网址如下:http://bips.u‐strasbg.fr/en/Products/Databases/BAliBASE/ref1/test1/1csy_ref1.html这一序列名称分别为p43405, p62994, p23727, p27986.获取这4条序列的fasta 格式,放在一个文本文件中,选择ebi网站上(/Tools/msa/)的至少四个多序列比对工具(如MAFFT、MUSCLE、CLUSTALW、Clustal Omega、T‐Coffee、DbClustal)进行分析。
三.实验结果:1.使用CLUSTALW 算法进行比对2A.获取4条序列信息:B.打开/Tools/msa/建立引导树,在引导树的指导下运用CLUSTALW 算法进行比对:五.回答问题:CLUSTALW 算法基本原理:首先进行所有序列之间的两两比较,计算出他们之间的分化距离矩阵;然后从分化距离矩阵中计算出作为指导多序列比较顺序的树状分枝图;最后根据树状图的分支关系,按照分化顺序逐个地把序列加入多序列比较过程。
实验六:多序列比对- Clustal、MUSCLE西北农林科技大学生物信息学中心实验目的:学会使用Clustal 和MUSCLE 进行多序列比对分析。
实验内容:多序列比对是将多条序列同时比对,使尽可能多的相同(或相似)字符出现在同一列中。
多序列比对的目标是发现多条序列的共性。
如果说序列两两比对主要用于建立两条序列的同源关系,从而推测它们的结构和功能,那么,同时比对多条序列对于研究分子结构、功能及进化关系更为有用。
例如,某些在生物学上有重要意义的相似区域只能通过将多个序列同时比对才能识别。
只有在多序列比对之后,才能发现与结构域或功能相关的保守序列片段,而两两序列比对是无法满足这样的要求的。
多序列比对对于系统发育分析、蛋白质家族成员鉴定、蛋白质结构预测、保守motif 的搜寻等具有非常重要的作用。
我们这节课主要学习两个广泛使用的多序列比对软件-Clustal、MUSCLE。
一、Clustal/Clustal 是一种利用渐近法(progressive alignment)进行多条序列比对的软件。
即先将多个序列两两比较构建距离矩阵,反应序列之间的两两关系;随后根据距离矩阵利用邻接法构建引导树(guide tree);然后从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在引导树上的位置,由近及远的逐步引入其它序列重新构建比对,直到所有序列都被加入形成最终的比对结果为止(Figure 6.1)。
Clustal 软件有多个版本。
其中Clustalw 采用命令行的形式在DOS 下运行;Clustalx 是可视化界面的程序,方便在windows 环境下运行;Clustal omega 是最新的版本,优点是比对速度很快,可以在短短数小时内比对成百上千的序列,同时由于采用了新的HMM 比对引擎,它的比对准确性也有了极大的提高,有DOS 命令行和网页服务器版。
我们今天主要学习clustalx 的使用。
范例1. 采用clustalx 进行多序列比对。
多序列比对简书【原创版】目录1.多序列比对的定义和意义2.多序列比对的基本方法和原理3.多序列比对的应用领域4.多序列比对在生物信息学中的重要性5.多序列比对的发展趋势与前景正文一、多序列比对的定义和意义多序列比对是一种生物信息学技术,用于比较两个或多个序列之间的相似性和差异性。
在生物学领域,多序列比对技术在基因组学、蛋白质组学等研究中具有重要的意义。
通过多序列比对,研究人员可以了解基因序列的进化关系、蛋白质序列的功能和结构特征,从而为生物学研究提供有力支持。
二、多序列比对的基本方法和原理多序列比对的基本方法可以分为两类:基于距离的比对方法和基于相似性的比对方法。
1.基于距离的比对方法:通过计算序列之间的距离来衡量它们的相似性。
常见的距离计算方法有欧氏距离、汉明距离等。
2.基于相似性的比对方法:通过比较序列之间的相似性来评估它们的相似性。
常见的相似性计算方法有 Pearson 相关系数、Jaccard 相似系数等。
三、多序列比对的应用领域多序列比对技术在多个领域具有广泛的应用,如基因组学、蛋白质组学、转录组学等。
1.在基因组学领域,多序列比对可用于基因组组装、基因注释、基因预测等任务。
2.在蛋白质组学领域,多序列比对可用于蛋白质序列比对、结构预测、功能注释等任务。
3.在转录组学领域,多序列比对可用于转录本鉴定、表达量分析等任务。
四、多序列比对在生物信息学中的重要性多序列比对在生物信息学领域具有重要意义,它可以帮助研究人员了解生物序列之间的进化关系、结构特征和功能属性。
此外,多序列比对还可以为基因组学、蛋白质组学等领域的研究提供有力支持,推动生物信息学的发展。
五、多序列比对的发展趋势与前景随着生物信息学技术的不断发展,多序列比对技术也在不断完善和优化。
未来的发展趋势包括提高比对速度、提高比对准确性和拓展应用领域等。
此外,随着人工智能技术的发展,深度学习等方法也将应用于多序列比对领域,为生物信息学研究提供更加高效和准确的比对结果。
一、实验目的1. 掌握多序列比对的基本原理和方法。
2. 熟悉使用BLAST、CLUSTAL W等工具进行多序列比对。
3. 分析比对结果,了解序列间的进化关系。
二、实验原理多序列比对是指将两个或多个生物序列进行排列,以揭示序列间的相似性和进化关系。
通过比对,可以识别保守区域、功能域和结构域,为生物信息学研究和进化生物学研究提供重要依据。
多序列比对的方法主要包括以下几种:1. 动态规划法:通过构建一个动态规划表,计算最优比对路径,实现序列的比对。
2. 人工比对法:通过分析序列结构、功能域等信息,人工进行比对。
3. 基于启发式算法的比对:通过寻找序列间的相似性,快速进行比对。
三、实验材料1. 仿刺参EGFR基因氨基酸序列(Fasta格式)。
2. 同源序列数据库(如NCBI)。
3. 多序列比对软件(如BLAST、CLUSTAL W)。
四、实验步骤1. 使用BLAST工具进行同源序列搜索。
(1)在NCBI网站上,选择“BLAST”功能。
(2)将仿刺参EGFR基因氨基酸序列粘贴到“Query Sequence”框中。
(3)选择合适的比对参数,如“MegaBLAST”。
(4)点击“BLAST”按钮,等待结果。
(5)在结果页面,找到相似度最高的几个序列,下载下来。
2. 使用CLUSTAL W进行多序列比对。
(1)将下载的同源序列整合到一个Fasta格式的文本文件中。
(2)在CLUSTAL W软件中,选择“Multiple Sequence Alignment”功能。
(3)上传Fasta格式的文本文件。
(4)选择合适的比对参数,如“Gap Penalty”和“Gap Reward”。
(5)点击“Align”按钮,等待结果。
3. 分析比对结果。
(1)观察比对结果,分析序列间的相似性和进化关系。
(2)绘制系统进化树,展示序列的进化历程。
五、实验结果与分析1. 使用BLAST工具,找到与仿刺参EGFR基因氨基酸序列相似度最高的几个序列,如Anopheles gambiae、Nasonia vitripennis等。
ncbi蛋白质序列比对结果题目:NCBI蛋白质序列比对结果及其在生物研究中的意义摘要:本文将围绕NCBI蛋白质序列比对结果展开讨论,从什么是蛋白质序列比对开始,解释NCBI数据库的重要性,并介绍蛋白质序列比对的方法和工具。
然后,详细探讨NCBI蛋白质序列比对结果的分析和解读,包括相似性、保守性、功能域和结构域。
最后,本文将总结NCBI蛋白质序列比对结果的应用领域及其在生物研究中的重要意义。
第一部分:介绍蛋白质序列比对和NCBI数据库1. 什么是蛋白质序列比对2. NCBI数据库的重要性及其功能第二部分:蛋白质序列比对方法和工具1. 结构比对方法介绍2. 序列比对方法介绍3. 常用的蛋白质序列比对工具第三部分:NCBI蛋白质序列比对结果的分析与解读1. 相似性分析2. 保守性分析3. 功能域和结构域分析第四部分:NCBI蛋白质序列比对结果的应用领域1. 进化研究2. 蛋白质结构预测3. 功能注释4. 药物研发第五部分:NCBI蛋白质序列比对结果在生物研究中的意义1. 提供生物信息学的基础2. 促进生物学领域的研究进展3. 辅助解决生物学问题第一部分:介绍蛋白质序列比对和NCBI数据库1. 什么是蛋白质序列比对蛋白质序列比对是通过比较不同蛋白质序列的相似性和差异性,从而研究它们的进化、功能和结构等特征的一种方法。
蛋白质序列比对有助于揭示蛋白质的进化关系、相同或相似功能的蛋白质家族以及蛋白质的结构域。
2. NCBI数据库的重要性及其功能NCBI(National Center for Biotechnology Information)是全球最大的生物信息学数据库之一。
它收集和维护了大量生物学序列数据、文献、基因组数据和其他生物信息资源。
NCBI数据库是进行蛋白质序列比对不可或缺的重要资源,具有协助科学研究和解决生物学问题的重要功能。
第二部分:蛋白质序列比对方法和工具1. 结构比对方法介绍结构比对方法利用蛋白质的三维结构信息,通过比较蛋白质之间的空间构象和残基相互作用来判断其相似性。
实习四:多序列⽐对(Multiplealignment)实习四:多序列⽐对(Multiple alignment)学号姓名专业年级实验时间提交报告时间实验⽬的:1. 学会利⽤MegAlign进⾏多条序列⽐对2. 学会使⽤ClustalX、MUSCLE 和T-COFFEE进⾏多条序列⽐对分析3. 学会使⽤HMMER进⾏HMM模型构建,数据库搜索和序列⽐对实验内容:多序列⽐对是将多条序列同时⽐对,使尽可能多的相同(或相似)字符出现在同⼀列中。
多序列⽐对的⽬标是发现多条序列的共性。
如果说序列两两⽐对主要⽤于建⽴两条序列的同源关系,从⽽推测它们的结构和功能,那么,同时⽐对多条序列对于研究分⼦结构、功能及进化关系更为有⽤。
例如,某些在⽣物学上有重要意义的相似区域只能通过将多个序列同时⽐对才能识别。
只有在多序列⽐之后,才能发现与结构域或功能相关的保守序列⽚段,⽽两两序列⽐对是⽆法满⾜这样的要求的。
多序列⽐对对于系统发育分析、蛋⽩质家族成员鉴定、蛋⽩质结构预测、保守模块的搜寻以及PCR引物设计等具有⾮常重要的作⽤。
作业:1.Align the orthologous nucleotide and protein sequences from 5 organisms you found from first practice with MegAlign. Describe the sequences you used (the title of each sequence), explain whether the phylogenetic tree is consistent with the species tree from NCBI taxonomy database. Set the alignment report to show consensus strength and decorate the residues different from consensus with green shade.(Hint: use the taxonomy common tree from NCBI to get the evolutionary relationship among the organisms. Save your organism name in a text file with each organism name in a line, and upload the file, choose Add from file, and you will see the relationship among the specified organisms) /doc/ea500ac1c1c708a1284a4449.html /Taxonomy/CommonTree/wwwcmt.cgi Hint 2:Change the accession number in your fasta or genPept format sequence file to organism name, so that the phylogenetic tree can be easily understood.⽅法与结果:打开Megalign,选择FILE下的Enter sequence ,打开之前保存的来⾃于五个物种的蛋⽩(或核酸)序列;⾸先选择打分矩阵,点击“Align”,选择Set residue Weight Table 选择矩阵:PAM100(核酸则设为weighted),通过“method parameters”查看参数,使⽤Clustal V的默认值;其次进⾏序列的⽐对,选择Align下的“by Clustal V Method”开始⽐对,再次待其结束后,进⾏⽐对结果的显⽰,选择view下的“Phylogenetic Tree”,显⽰出树形图;(图)与NCBI上找到的树形图进⾏对⽐(图);接下来点击View 下的“Alignment reports ”,选择OPTIONS下的“Alignment report contents”勾中“show consensus strength”,即在序列中显⽰出相似性条块;在OPTIONS下选择“New decorations”对decoration parameters 下选“shade—residues differing from—the consensus”把字符选择现实的颜⾊为绿⾊,结果显⽰如下:(图)同法可以得到核酸的树形图:(图)分析:系统发育树与NCBI上的物种树有很⼤的差异,因为可能这些物种间含有很多同源序列,我们不能单凭⼏条相似序列的同源关系来判断物种的亲缘关系,⽽应该考虑到物种更多相似序列的同源关系。
第1篇一、实验背景随着生物信息学、基因组学等领域的快速发展,序列对比分析在生物学研究中扮演着越来越重要的角色。
序列对比实验旨在通过比较两个或多个序列之间的相似性,揭示序列之间的关系,为生物学研究提供重要的理论依据。
本实验旨在通过比较不同物种的基因组序列,探讨物种之间的进化关系。
二、实验目的1. 学习序列对比的基本原理和方法。
2. 掌握序列对比软件的使用。
3. 分析不同物种的基因组序列,探讨物种之间的进化关系。
三、实验材料1. 不同物种的基因组序列数据:如人类、小鼠、大鼠、果蝇等。
2. 序列对比软件:如BLAST、Clustal Omega等。
3. 生物信息学分析工具:如R、Python等。
四、实验方法1. 数据准备:收集不同物种的基因组序列数据,并整理成FASTA格式。
2. 序列比对:使用BLAST软件对两个或多个物种的基因组序列进行比对,查找相似序列。
3. 序列进化分析:使用Clustal Omega软件对比对结果进行多重序列比对,构建进化树。
4. 结果分析:分析进化树,探讨物种之间的进化关系。
五、实验步骤1. 数据准备(1)下载不同物种的基因组序列数据,如人类(GRCh38)、小鼠(mm10)、大鼠(rn6)、果蝇(dm6)等。
(2)使用在线工具或编程语言将序列数据整理成FASTA格式。
2. 序列比对(1)使用BLAST软件对两个或多个物种的基因组序列进行比对。
(2)设置参数:选择合适的数据库、比对方式、相似性阈值等。
(3)分析比对结果,找出相似序列。
3. 序列进化分析(1)使用Clustal Omega软件对比对结果进行多重序列比对。
(2)设置参数:选择合适的比对模型、进化树构建方法等。
(3)构建进化树,分析物种之间的进化关系。
4. 结果分析(1)观察进化树,分析物种之间的亲缘关系。
(2)结合生物学知识,解释物种之间的进化关系。
六、实验结果与分析1. 序列比对结果通过BLAST比对,发现人类、小鼠、大鼠和果蝇之间存在一定的序列相似性。
蛋白质序列对比
蛋白质序列对比是一种比较蛋白质序列之间差异的技术。
蛋白质序列是由若干个氨基酸组成的,对于不同的蛋白质,它们的序列会有所不同。
因此,通过蛋白质序列对比,可以揭示不同蛋白质之间的相似性和差异性,推断它们的起源和功能。
蛋白质序列对比可以通过比对两个或多个蛋白质序列的相似性,找出它们之间的同源性。
这些相似性可以用多种方法测定,例如使用BLAST进行局部序列比对、ClustalW进行全局序列比对等。
在生物学和医学领域,蛋白质序列对比是非常重要的。
它们被用于研究蛋白质功能、疾病的发生机制及新型药物的研发。
通过对比蛋白质序列,可以挖掘出新的功能区域、诊断标记和药物靶点,有利于生物医药研究的发展。
实验六、多序列比对及进化树的构建(3学时)
目的:
1、了解蛋白质序列模式二级数据库的结构、内容及基本使用方法。
2、了解多序列比对工具ClustalW/X的使用方法并学习对比对结果进行编辑与分析。
3、学习如何构建系统进化树。
内容:
一、蛋白质功能位点数据库PROSITE、蛋白质序列指纹图谱数据库Prints的内容、结构及
使用。
1、熟悉PROSITE数据库的数据结构。
从生物学院-国家生物学理科基地-课件下载处下载最新的课程相关内容.rar,解包后打开实验数据-实验二中的CBI EMBL format_P02753,找到Database cross-references项中的PROSITE,点击PS00213的链接。
则显示PROSITE数据库中Lipocalin 模式(AC号为PS00213)的记录信息。
利用网上的PROSITE user manual
(/prosite/prosuser.html#convent36)理解每一个字段及内容的含义。
回答问题:
A、L ipocalin pattern的长度是多少?
B、请解释/TAXO-RANGE=??EP?的含义。
C、分别解释NR字段中三行数据的含义。
D、Q28133蛋白(ALL2_BOVIN)是否符合此pattern?
E、Is this a good pattern? Why?
2、PROSITE数据库的检索。
ExPaSy(/prosite/) 及SRS(,)都提供了对PROSITE数据库的检索服务。
可以通过AC、ID、description、author等信息进行数据库检索,你还可以通过各序列数据库中的交叉引用链接(cross-references or xref等)找到相应的PROSITE pattern, profile or rules 信息。
ScanProsite工具(/tools/scanprosite/)则可以分析查询序列中可能包含的序列模式或序列谱,以作为进一步鉴定的基础。
同时,ScanProsite还可以利用特定的序列模式进行对SWISS-PROT、TrEMBL及PDB数据库的搜索以获得相应数据库中所有具有此模式的序列。
利用ScanProsite的help页面了解有关的使用方法。
回答问题:
F、如果查找PLEK_HUMAN序列中所包含的序列模式或序列谱?
G、如何利用ScanProsite在SWISSPROT中查找有多少个人类(homo sapiens)
序列包含有与PLEK_HUMAN相同的序列谱?请写明过程。
此查询执行的过程很慢,预先作过的结果可从实验六-prosite-ScanProsite Results Viewer of PLEK_HUMAN PROFILE.html文件中查看。
3、蛋白质序列指纹图谱数据库Prints的数据内容及查询工具。
利用课程相关内容-实验数据-实验二中的CBI EMBL format_P02753,找到Database cross-references项中的PRINTS,点击PR00179的链接,即显示PRINTS数据库中Lipocalin 蛋白序列指纹信息。
利用PRINTS数据库的用户指南(/dbbrowser/PRINTS/printsman.html)熟悉其中的内容与含义。
利用FingerPrintScan
(/fingerPRINTScan/)进行查询序列中的序列指纹鉴别(以实验五中的蛋白质查询序列为例):
MSTA VLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEEN DVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTV PWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPR VEYMEEEKKTWGTVFKTLKSL YKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQF LQTCTGFRLRPV AGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVP LFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFG ELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPL YYV AESFNDAKEKVRNFAA TIPRPFS VRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK
回答问题:
H、此序列包含了哪种序列指纹?
I、此序列指纹包含了几个motif?
二、利用网上或下载的ClustalX/W进行多序列比对,并对结果进行编辑与分析。
1、多序列比对。
1)利用BLAST进行比对序列的收集。
(当然,你也可以利用SRS系统进行某家族序列的收集,并通过SRS整合的clustalW进行多序列比对。
)在你的多序列比对中,可能希望包含两种类型的序列:已经过鉴定的具有良好注释及实验信息的序列,以及你感兴趣的未鉴定的序列(但必须属于此序列家族)。
将后者加入多序列比对的主要目的是确定序列中不会发生突变的保守位点,同时确定重要性相对小一些的那些区域。
进入ExPASy的BLAST server (/tools/blast/),在检索框内输入P20472(如果在检索框内输入的是蛋白质序列,使用blastp程序,如果输入的是CDS序列,则选择tblastn程序), 从options选项中的Number of best scoring sequences to sho w以及Number of best alignments to show的下拉菜单中选择1000。
点击RUN BLAST。
2)从结果中选择少于10条序列进行第一次的多序列比对。
注意选择的序列要在具有
良好的E值(10-40)与不太好的E值(10-5)之间平均分配,同时查看具体的alignment 以确定选择的目标序列与查询序列(P20472)之间具有全序列范围内的相似性。
在选择的序列前打勾,如P20472,P80079,P02626,P02619,P43305,P32930,P91482,P02620,P02622。
在Send selected sequences to项目的下拉菜单中选择合适的序列输出选项,如clustalW是将序列发送到EMBnet的ClustalW服务器上,点击提交查询内容,则将所选序列装填入ClustalW服务器的检索框内,利用默认参数,点击RUN ClustalW,则可以得到以不同格式保存的多序列比对结果以及.dnd格式的向导树(guide tree)或称dendogram,它并不是真正的系统进化树。
T-coffee也是一个多序列比对工具,采用的是与ClustalW相类似的渐进式比对算法,它产生的比对结果准确度要比ClustalW高,但运行速度要比ClustalW慢。
利用默认参数,我们可以看到T-coffee产生的结果不仅包含了各种格式的多序列比对情况以及向导树,还有用颜色标记比对质量的html文件及相应的PDF文件。
在这些文件中,红色表示高质量的片段,而兰色则表明比对的区域不可信。
3)将上步所选的序列以FASTA格式进行保存,并将多序列比对结果中的aln格式结果及.dnd文件进行保存。
4)接入EBI的clustalW服务器(/clustalw/index.html),将另一个蛋白质P19132的FASTA格式加入到刚才下载的FASTA格式序列文件中。
如果查看刚才利用P20472序列进行对库搜索的结果中,这个蛋白的E值为4.4!而且其与查询序列的同一性仅为在33个连续残基中的39%,因此进化关系上与P20472很远。
将这些序列进行多序列比对分析,必要时进行相关参数的设置。
在Phylogenetic tree 选项中的tree type选择phylip或dist,使用帮助参见课程相关内容-实验数据-实验六中的EBI Help-clustalW.html,将比对结果进行保存,并与前一步骤得到的结果进。