蛋白质结构预测在线软件
- 格式:docx
- 大小:14.06 KB
- 文档页数:9
SWISS-MODEL 蛋白质结构预测SWISS-MODEL是一项预测蛋白质三级结构的服务,它利用同源建模的方法实现对一段未知序列的三级结构的预测。
该服务创建于1993年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。
同源建模法预测蛋白质三级结构一般由四步完成:1.从待测蛋白质序列出发,搜索蛋白质结构数据库(如PDB,SWISS-PROT等),得到许多相似序列(同源序列),选定其中一个(或几个)作为待测蛋白质序列的模板;2.待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守位置尽量对齐;3.建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间结构——待测蛋白质空间结构模型;4.利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。
最后提供给用户的是经过如上四步(或重复其中某几步)后得到的蛋白质三级结构。
SWISS-MODEL工作模式SWISS-MODEL服务器是以用户输入信息的最小化为目的设计的,即在最简单的情况下,用户仅提供一条目标蛋白的氨基酸序列。
由于比较建模程序可以具有不同的复杂性,用户输入一些额外信息对建模程序的运行有时是有必要的,比如,选择不同的模板或者调整目标模板序列比对。
该服务主要有以下三种方式:∙First Approach mode(简捷模式):这种模式提供一个简捷的用户介面:用户只需要输入一条氨基酸序列,服务器就会自动选择合适的模板。
或者,用户也可以自己指定模板(最多5条),这些模板可以来自ExPDB模板数据库(也可以是用户选择的含坐标参数的模板文件)。
如果一条模板与提交的目标序列相似度大于25%,建模程序就会自动开始运行。
但是,模板的可靠性会随着模板与目标序列之间的相似度的降低而降低,如果相似度不到50%往往就需要用手工来调整序列比对。
这种模式只能进行大于25个残基的单链蛋白三维结构预测。
∙Alignment Interface(比对界面):这种模式要求用户提供两条已经比对好的序列,并指定哪一条是目标序列,哪一条是模板序列(模板序列应该对应于ExPDB模板数据库中一条已经知道其空间结构的蛋白序列)。
pep-fold3用法
PEP-Fold3是一款在线蛋白质二级结构预测服务器,它可以根据给定的氨基酸序列预测蛋白质的二级结构。
以下是使用PEP-Fold3进行蛋白质二级结构预测的一般步骤:
1.打开浏览器,访问PEP-Fold3的官方网站。
2.在网站首页上,找到并点击“Start”按钮,开始一个新的预测任务。
3.在打开的页面中,输入待预测的蛋白质氨基酸序列。
可以手动输入序列,也可以上传FASTA格式的序列文件。
4.选择预测参数。
在PEP-Fold3中,可以选择不同的预测参数和算法进行蛋白质二级结构预测。
选择适当的参数可以提高预测的准确性和可靠性。
5.提交预测任务。
完成输入和参数选择后,点击“Submit”按钮提交预测任务。
6.等待预测结果。
PEP-Fold3会自动进行蛋白质二级结构预测,并在完成后将结果发送到用户的邮箱中。
7.分析预测结果。
用户可以下载预测结果文件,并使用文本编辑器或生物信息学软件分析预测结果。
需要注意的是,PEP-Fold3是一种基于机器学习的蛋白质二级结构预测方法,其预测结果的准确性受到多种因素的影响,如序列长度、序列相似性、序列复杂度等。
因此,在进
行蛋白质二级结构预测时,需要综合考虑多种因素,并采用多种方法进行预测和验证。
蛋白质结构预测在线软件随着计算机技术的发展,越来越多的蛋白质结构预测在线软件被开发出来,并且被广泛应用于生物学研究。
本文将介绍几个常用的蛋白质结构预测在线软件,并对它们的原理和优缺点进行分析。
首先,我要介绍的是PHYRE2、PHYRE2是一款基于比较模型的蛋白质结构预测软件,它通过将待预测的蛋白质序列与已知结构库中的蛋白质序列进行比对,从而预测目标蛋白质的结构。
PHYRE2具有高度自动化的特点,可以在较短的时间内进行大量的结构预测。
但是,PHYRE2的准确性和可靠性相对较低,因为它只依赖于已知结构的信息。
其次,我要介绍的是I-TASSER。
I-TASSER是一种基于碎片装配的蛋白质结构预测软件,它通过将目标蛋白质的序列分解为小的片段,然后通过模板和螺旋转角预测来重新组装这些片段,从而得到目标蛋白质的结构。
I-TASSER具有较高的准确性和可靠性,并且在多个蛋白质结构预测比赛中表现出色。
然而,I-TASSER的计算速度较慢,需要较长的时间来进行结构预测。
另外,我要介绍的是Rosetta。
Rosetta是一种基于物理学的蛋白质结构预测软件,它通过对蛋白质的能量进行优化来确定最稳定的结构。
Rosetta具有较高的准确性和可靠性,并且可以进行全原子级别的结构预测。
然而,由于Rosetta的计算复杂性较高,需要大量的计算资源来进行结构预测。
除了以上介绍的几种蛋白质结构预测在线软件,还有许多其他的软件可供选择,如PSIPRED、HHPred等。
这些软件在原理和性能上有所差异,但都能够对蛋白质的结构进行预测,并为生物学研究提供重要的参考信息。
总结起来,蛋白质结构预测是生物信息学领域的重要课题,需要借助计算机算法来进行预测。
目前有许多蛋白质结构预测在线软件可供选择,它们在原理、准确性、可靠性和计算速度等方面有所差异。
选择合适的软件进行蛋白质结构预测,将对生物学研究产生重要的影响。
蛋白质组学蛋白质是生物体的重要组成部分,参与几乎所有生理和细胞代谢过程。
此外,与基因组学和转录组学比较,对一个细胞或组织中表达的所有蛋白质,及其修饰和相互作用的大规模研究称为蛋白质组学。
蛋白质组学通常被认为是在基因组学和转录组学之后,生物系统研究的下一步。
然而,蛋白质组的研究远比基因组学复杂,这是由于蛋白质内在的复杂特点,如蛋白质各种各样的翻译后修饰所决定的。
并且,研究基因组学的技术要比研究蛋白质组学的技术强得多,虽然在蛋白质组学研究中,质谱技术的研究已取得了一些进展。
尽管存在方法上的挑战,蛋白质组学正在迅速发展,并且对癌症的临床诊断和疾病治疗做出了重要贡献。
几项研究鉴定出了一些蛋白质在乳腺癌、卵巢癌、前列腺癌和食道癌中表达变化。
例如,通过蛋白质组学技术,人们可以在患者血液中明确鉴定出肿瘤标志物。
表1列出了更多的蛋白质组学技术用于研究癌症的例子。
另外,高尔基体功能复杂。
最新研究表明,它除了参与蛋白加工外,还能参与细胞分化及细胞间信号传导的过程,并在凋亡中扮演重要角色,其功能障碍也许和肿瘤的发生、发展有某种联系。
根据人类基因组研究,约1000多种人类高尔基体蛋白质中仅有500~600种得到了鉴定,建立一条关于高尔基体蛋白质组成的技术路线将有助于其功能的深入研究。
蛋白质组学是一种有效的研究方法,特别是随着亚细胞器蛋白质组学技术的迅猛发展,使高尔基体的全面研究变为可能。
因此研究人员希望能以胃癌细胞中的高尔基体为研究对象,通过亚细胞器蛋白质组学方法,建立胃癌细胞中高尔基体的蛋白质组方法学。
研究人员采用蔗糖密度梯度的超速离心方法分离纯化高尔基体,双向凝胶电泳(2-DE)分离高尔基体蛋白质,用ImageMaster 2D软件分析所得图谱,基质辅助激光解吸离子化飞行时间质谱(MALDI-TOF MS)鉴定蛋白质点等一系列亚细胞器蛋白质组学方法建立了胃癌细胞内高尔基体的蛋白图谱。
最后,人们根据分离出的纯度较高的高尔基体建立了分辨率和重复性均较好的双向电泳图谱,运用质谱技术鉴定出12个蛋白质,包括蛋白合成相关蛋白、膜融合蛋白、调节蛋白、凋亡相关蛋白、运输蛋白和细胞增殖分化相关蛋白。
蛋白质结构预测技术的使用教程蛋白质是生物体内构成细胞的基本组成部分之一,其结构决定了蛋白质的功能和相互作用。
蛋白质结构预测是一项重要的生物信息学研究领域,它的发展为科学家们提供了洞察蛋白质功能和疾病发生机制的重要工具。
本文将介绍蛋白质结构预测技术的使用教程,帮助读者了解并使用这一技术。
1. 背景知识在开始使用蛋白质结构预测技术之前,我们首先需要了解一些基本的背景知识。
蛋白质的结构可以分为四个层次:一级结构是指氨基酸序列;二级结构是指α-螺旋和β-折叠等部分;三级结构是指蛋白质立体构型的整体形态;四级结构是指多个蛋白质相互作用形成的功能性蛋白质复合体。
蛋白质结构的理解对于揭示蛋白质的功能和相互作用关系至关重要。
2. 蛋白质结构预测的方法目前,蛋白质结构预测的方法可以分为两大类:实验方法和计算方法。
实验方法包括晶体学、核磁共振、电子显微镜等技术,但由于其昂贵和耗时的特点,计算方法逐渐成为蛋白质结构预测的主要手段。
计算方法可以进一步分为基于比对的方法和基于物理模拟的方法。
基于比对的方法使用已知结构的蛋白质作为模板,通过比对计算目标蛋白质的结构。
基于物理模拟的方法则通过模拟生物物理过程,推测蛋白质的结构。
3. 常用的蛋白质结构预测软件在选择蛋白质结构预测软件之前,我们需要考虑软件的准确性、计算速度和易于使用等因素。
以下是几个常用的蛋白质结构预测软件:- I-TASSER:I-TASSER 是一种基于比对的蛋白质结构预测软件,它使用蛋白质序列与数据库中已知结构的蛋白质进行比对,并通过模型构建和优化来预测蛋白质的结构。
- ROSETTA:ROSETTA 是一种基于物理模拟的蛋白质结构预测软件,它使用分子力学和能量函数来模拟蛋白质的结构。
ROSETTA 在模拟过程中考虑了蛋白质的氨基酸序列、二级结构和溶液环境等因素。
- PHYRE2:PHYRE2 是一种基于比对的蛋白质结构预测软件,它通过比对目标蛋白质序列与数据库中已知结构的蛋白质,然后通过从比对到的结构中挑选最佳模板来预测目标蛋白质的结构。
蛋白质预测分析网址集锦?物理性质预测:?Compute PI/MW????SAPS??基于组成的蛋白质识别预测?AACompIdent???PROPSEARCH??二级结构和折叠类预测?nnpredict??Predictprotein???SSPRED??特殊结构或结构预测?COILS??MacStripe??与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。
?由NCBI检索蛋白质序列?可联网到:“”进行检索。
?利用SRS系统从EMBL检索蛋白质序列?联网到:”,可利用EMBL的SRS系统进行蛋白质序列的检索。
?通过EMAIL进行序列检索?当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。
?蛋白质基本性质分析?蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。
蛋白质的很多功能特征可直接由分析其序列而获得。
例如,疏水性图谱可通知来预测跨膜螺旋。
同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。
WEB中有很多此类资源用于帮助预测蛋白质的功能。
?疏水性分析?位于ExPASy的ProtScale程序(?)可被用来计算蛋白质的疏水性图谱。
该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。
输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。
需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。
?进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等。
?跨膜区分析?有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。
这些技术主要是基于对已知跨膜螺旋的研究而得到的。
自然存在的跨膜螺旋Tmbase 数据库,可通过匿名FTP获得(,参见表一?资源名称网址说明?TMPRED?基于对tmpred数据库的统计分析PHDhtm??...tprotein.htmlMEMSAT?微机版本?,蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。
“或“”?前导肽与蛋白质定位?在生物内,蛋白质的合成场所与功能场所常被一层或多层细胞膜所隔开,这样就涉及到蛋白质的转运。
合成的蛋白质只有准确地定向运行才能保证生命活动的正常进行。
一般来说,蛋白质的定位的信息存在于该蛋白质自身结构中,并通过与膜上特殊的受体相互作用而得以表达。
在起始密码子之后,有一段编码疏水性氨基酸序列的RNA片段,这个氨基酸序列就这个氨基酸序列就是信号肽序列。
含有信号肽的蛋白质一般都是分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。
??卷曲螺旋分析?另一个能够直接从序列中预测的功能motif是α-螺旋的卷曲排列方式。
在这种结构中,两种螺旋通过其疏水性界面相互缠在一起形成一个十分稳定的结构。
?蛋白质卷曲的相关资源?资源网址?coiled-coil????蛋白质功能预测?基于序列同源性分析的蛋白质功能预测?到少有80个氨基酸长度范围内具有25%以上序列一致性才提示可能的显着性意义。
最快的工具如BlastP能很容易地发现显着性片段,而无需使用十分耗时的BLITZ软件。
?基于NCBI/BLAST软件的蛋白序列同源性分析?类似于核酸序列同源性分析,用户直接将待分析的蛋白质序列输入NCBI/BLAST(,选择程序BLASTP就可网上分析。
?基于WU/BLAST2软件进行分析?华盛顿大学的BLAST软件(dove.embl-heidelberg.dl/blast2)也可进行蛋白质序列的同源性分析。
?基于motif、结构位点、结构功能域数据库的蛋白质功能预测?蛋白质的磷酸化与糖基化对蛋白质的功能影响很大,所以对其的分析也是生物信息学的一个部分。
?同时,分子进化方面的研究表明,蛋白质的不同区域具有不同的进化速率,一些氨基酸必须在进化过程中足够保守以实现蛋白质的功能。
在序列模式的鉴定方面有两类技术,第一类是依赖于和一致性序列(consensus sequence)或基序各残基的匹配模式,该技术可用于十分容易并快速搜索motif数据库。
?Motif数据库-PROSITE??蛋白质序列的(profile)分析??InterProScan综合分析网站???蛋白质的结构功能域分析?简单模块构架搜索工具(simple modular architecture research tool,SMART)一个较好的蛋白质结构功能域的数据,可用于蛋白质结构功能域的分析,所得到的结构域同时提供相关的资源的链接?蛋白质结构预测?PDB数据库?蛋白质基本立体结构数据库(PDB,?其中有大量工具用于查看PDB数据库中的结构,如rasmol,可用于显于出蛋白质的空间结构,下载地址:)? PDBFinder 数据库?是在PDB、DSSP、HSSP基础上建立的二级库,它包含PDB序列,作者,R因子,分辨率、二级结构等,这些些信息随着PDB库每次发布新版,PDBFinder在EBI自动生成,网址为“??NRL-3D数据库?是所有已知结构蛋白质的数据库,可用于查询蛋白序列时行相似性分析以确定其结构?ISSD数据库?蛋白质序列数据库,其每个条目包含一个基因的编码序列,同相应的氨基酸序列对比,并给出相应的多肽链结构数据。
?HSSP数据库?是根据同源性导出的蛋白质二级结构数据库,每一条PDB项目都有一个对应的HSSP文件,?蛋白质结构分类数据库?对已知蛋白质三维结构进行手工分类得到的数据库,位于剑桥的站点也提供BLAST检索服务??MMDB蛋白质分子模型数据库?是ENTREZ检索工具所使用的三维结构数据库,以ASN格式反蚋的PDB 中的结构和序列数据。
NCBI同时提供一个配套的三维结构显示程序的Cn3D,?Dali/FSSP数据库?基于PDB数据库中现有的蛋白质三维结构,用自动结构对比程序Dali比较而形成的折叠单元和家庭分类库。
?蛋白质二级结构预测?基于序列进行蛋白质二级结构方面已有了大量文献描述,本质上,这些研究可被分为两大类:基于单一序列的分析和基于多重序列对齐的分析。
?文献报道PHD程序是目前此方面的最好程序,提供了从二级结构到折叠方面分析的多种资源。
其网址为www.embl-heidel-berg.d ... tprotein.html? 蛋白质三级结构预测?蛋白质同源家庭的分析对于确立物种之间的亲缘关系和预测新蛋白质序列的功能有重要意义,同源蛋白质(homolog)进一步划分为直系同源(ortholog)和旁系同源(paralog),前者指不同物种中具有相同功能和共同起源的基因,后者则指在同一物种内具有不同功能,但也有共同起源的基因,例如同是起源于珠蛋白的α珠蛋白、β珠蛋白和肌红蛋白。
?蛋白质分类数据库(ProtoMap)?是对SWISS-PROT数据库中的全部蛋白质由计算机自动时行层次分类,把相关者聚集分极所得到的数据库。
?蛋白质序列多重对齐分析及进化分析?如果发现一个未知蛋白质序列和较多不同和种属或同一种属的蛋白质序列具有较高的同源性(大于30%)那么提示待分析的蛋白质序列可能是相应家族的成员,从而可从分子时化的角度对蛋白质序列进行综合分析。
?常用在线蛋白工具?BCM Search Launcher??蛋白序列二级结构预测综合站点,从此出发,输入蛋白序列,可以根据需要,使用各种在线预测工具,包括Coils、nnPredict、PSSP/SSP、PSSP/NNSSP、SAPS、TMpred、SOUSI、Paircoil、Protein Hydrophilicity/Hydrophobicity Search、SOPM,使用十分方便。
? DAS??蛋白跨膜预测服务器、输入蛋白序列,预测跨膜区域。
?TopPred 2??斯德哥尔摩大学理论化学蛋白预测服务器提供的膜蛋白拓扑学预测Topology prediction of membrane proteins在线工具?SOSUI??东京农业科技大学(Tokyo University of Agriculture and Technology)提供的膜蛋白分类和二级结构预测在线工具。
?PSIpred - MEMSAT2??本蛋白结构预测服务器允许你提交一个蛋白序列,进行二级结构预测与跨膜拓朴结构预测,并将结果用EMAIL提供给您。
?HMMTOP??预测蛋白序列的跨膜螺旋与拓扑结构服务器?TMpred??预测蛋白序列跨膜区?TMHMM??预测蛋白的跨膜螺旋?The PredictProtein server??提供蛋白数据库查询,预测蛋白各种结构的服务?SMART??提供蛋白序列,在结构域数据库中查询,显示出其结构域及跨膜区等? SPLIT??膜蛋白二级结构预测服务器?PRED-TMR??提供基于SwissProt数据库统计分析的预测蛋白跨膜片段的服务?CoPreThi??基于INTERNET的JAVA程序,预测蛋白的跨膜区?TMAP??提供预测蛋白跨膜片段的服务?multalin??蛋白序列对照服务器,比较几条蛋白序列的结构。
?Protein Sequence Analysis?巴斯德研究所提供的常用蛋白序列分析在线工具,绝对精选。
? PSA??Protein Sequence Analysis 服务器为美国波士顿大学生物分子工程研究中心(the BioMolecular Engineering Research Center )开发,提交氨基酸序列,预测二级结构及折叠区域。
?PRS??EMBL提供的以未知蛋白序列的氨基酸组成而非氨基酸序列顺序进行蛋白家族及各种特性预测的服务器,并将结果通过EMAIL发给您。
? AAA??EMBL氨基酸分析服务器,与上一个服务类似,以氨基酸残基组成为蛋白分析基础数据,结合蛋白数据库进行分析。