蛋白质结构预测

格式：ppt
大小：3.45 MB
文档页数：38

下载文档原格式

/ 38

蛋白质结构预测方法与意义

蛋白质结构预测方法与意义蛋白质是生物体中重要的大分子有机化合物，扮演着多种关键的生物功能角色。

然而，蛋白质的功能往往与其特定的三维结构密切相关。

因此，了解和预测蛋白质的三维结构对于理解其功能以及开发新药物等方面具有重要意义。

然而，实验方法通常是耗时且成本高昂的。

在此情况下，蛋白质结构预测方法的研究和应用变得至关重要。

本文将探讨几种常用的蛋白质结构预测方法，并讨论其意义和局限性。

1. 基于序列相似性的结构预测方法基于序列相似性的结构预测方法是最常见和最简单的方法之一。

这种方法的基本思想是假设具有相似氨基酸序列的蛋白质可能具有相似的结构。

通过在已知结构中找到与待预测蛋白质序列相似的蛋白质，可以借用已知结构来预测待测蛋白质的结构。

然而，这种方法的局限性在于它依赖于已知结构的蛋白质，并且无法预测新颖或没有相似结构的蛋白质。

2. 基于模板的结构预测方法基于模板的结构预测方法是一种更高级的预测方法。

它利用已知结构的蛋白质作为模板，通过比对待测蛋白质序列与已知结构的蛋白质序列的相似性，将预测蛋白质的结构与模板进行比对。

这种方法通常适用于具有相似序列的蛋白质，但对于无相似序列的蛋白质仍存在一定的局限性。

此外，模板的选择也是一个关键的环节，对于不同的蛋白质可能需要不同的模板选择策略。

3. 基于物理原理的结构预测方法基于物理原理的结构预测方法是相对较新的方法之一，它试图通过物理原理来理解蛋白质的折叠过程。

这些方法通常基于蛋白质的物理性质，如氨基酸的相互作用力场以及蛋白质内部的能量最优化原理。

此类方法通常将蛋白质折叠问题建模成一个优化问题，通过搜索最优解来预测蛋白质的结构。

然而，由于蛋白质折叠是一个复杂的过程，目前基于物理原理的结构预测方法还存在一定的局限性。

蛋白质结构预测方法的意义在于提供了一种高效和经济的方法来预测蛋白质的结构。

相比于实验方法，结构预测方法具有更快的速度和更低的成本。

这些方法可以在很短的时间内为科学家和医药研发人员提供关键信息，从而加速研究进展和新药物开发。

蛋白质结构预测的算法及其评价

蛋白质结构预测的算法及其评价蛋白质是生命体最基本的构成因素之一，通过研究蛋白质结构，可以深入了解生命的本质。

然而，在实验室中对蛋白质的研究成本十分昂贵，不仅需要大量的时间和人力，同时还可能因样本数量和质量的不足而导致结果不准确。

在此背景下，蛋白质结构预测的算法应运而生。

一、蛋白质结构的预测蛋白质结构预测是指通过计算机模拟、统计预测等方法，对蛋白质的结构进行推测。

在蛋白质研究中，结构预测是非常重要的一研究方向。

它可以在一定程度上帮助预测一个蛋白质的功能、化学性质等，并深入了解生命体系的本质。

根据计算方法的不同，目前可用的蛋白质结构预测算法主要有以下几种。

1.模板比对法模板比对法是目前最为常用的蛋白质结构预测方法之一，其核心理念是参照已知的蛋白质结构，利用比对的方法来预测目标蛋白的结构。

该方法较为准确，且时间上相对较短，最为重要的是其通用性较高，几乎适用于所有不同的蛋白质。

2.物理模型法物理模型法是另一种蛋白质结构预测的算法，它基于蛋白质分子的物理特性，通过数学模拟来预测目标蛋白的结构。

与模板比对法不同，物理模型法不依赖于已知的结构数据。

但该方法因其复杂度极高，对计算机硬件的资源要求也非常高，目前还需要进一步的改进。

3.二级结构预测法二级结构预测法是另一种目前被广泛应用的蛋白质结构预测方法。

它是一种基于蛋白质中氨基酸序列的预测方法，通过对氨基酸的特性进行分析，预测蛋白质的二级结构，再根据二级结构推算出三维空间的结构。

该方法在研究中被广泛应用，尤其是在药物研发上，但是存在准确性较低的问题。

二、评价蛋白质结构预测算法的标准对于蛋白质结构预测算法的评价标准，世界卫生组织以及美国生物技术学会提出了较为严格的标准，以下为其详解。

1. 准确性准确性是评价蛋白质结构预测算法的最基本和最重要的标准，它包括了预测结构与实验测量结构的相似程度、对各种蛋白质的适用性等指标。

一般来说，准确性越高，预测的结果越可靠。

2. 规模评价蛋白质结构预测算法的规模，包括其适用范围、预测样本的数量以及计算机处理的时间等指标。

蛋白质结构预测与分析方法

蛋白质结构预测与分析方法蛋白质作为生命体中最基本的分子之一，不仅在生物体中发挥着重要的催化、运输、调节、防御、信号传递等功能，同时也受到了科学家们的广泛关注。

因为在蛋白质的分子结构中蕴藏着其生物学功能的秘密。

为了深入理解蛋白质在生物体中的作用，结构预测与分析方法成为了不可或缺的重要手段。

一、蛋白质结构预测方法蛋白质结构预测是指根据蛋白质的氨基酸序列信息，利用计算机模拟和数学建模预测出蛋白质的三维立体结构的技术。

蛋白质结构预测技术的发展历程大致可以分为以下四个阶段。

1.基于序列保守性推断的序列比对方法序列比对法是一种最早传统的结构预测方法之一，主要基于了分子生物学的序列保守性假设，即同族蛋白质序列之间的关系比异族蛋白质序列要更为接近，同时也利用了同源因子结构的技术。

该方法的缺点在于较为依赖生物物种数据库中已知的同源蛋白质序列，并且无法解决折叠状态中序列变异路径不同的问题。

2.基于从头构建法的物理模拟方法从头构建法是指利用高中生物化学、数学及计算机科学相关知识，对蛋白质分子的构成及其相互作用力的原理进行理解，以及从分子结构相空间机构的角度进行蛋白质结构模拟的技术。

该方法可以绕过序列比对路径不同的缺点，但准确率较低、计算时间较长，并且需要较高的数学和物理素养。

3.基于同源建模法的结构对比和补全方法同源建模法是一种结构对比与预测的重要手段，通过利用已知蛋白质结构作为种子结构的替代物，比较它们所共有的氨基酸序列和结构，以此预测蛋白质分子之间的空间排列。

同源建模法适用于那当前有完整的同源确定模板结构的情况，但需要较强的生物学知识支持。

4.基于机器学习的预测方法机器学习是数据挖掘、人工智能和统计学应用领域中的一种技术，并被广泛用于蛋白质的结构预测和设计。

与其他方法相比，机器学习方法具有更好的处理大量数据的能力，准确度更高，并且可以较快的体现出不同环境的影响。

二、蛋白质结构分析方法蛋白质结构分析是指对已有蛋白质结构的进一步分析研究，从而深入探讨蛋白质在生物学功能中所起的角色和机理，目前主要涉及到以下几种方法。

蛋白质结构预测

蛋白质结构预测
蛋白质结构预测的基本原理是根据已知序列(或称为模式),通过计算机进行模拟,并与实验值比较来确定蛋白质分子中氨基酸残基排列顺序和空间构象等信息,从而对蛋白质的结构做出预测.
蛋白质的一级结构是指肽链内氨基酸残基之间的空间排布,即肽链骨架在三维空间上的几何形状.这种结构可以用蛋白质二级结构来描述.当给予一个结合有氨基酸残基的基团后,则会引起氨基酸残基的侧链和疏水基团暴露于相应的环境中,因此,其构象将发生变化,从而使得二级结构也随之改变,这就是蛋白质的二级结构.蛋白质的二级结构又被称作蛋白质的三级结构,即蛋白质的一级结构与二级结构的叠加,它包括了蛋白质的高级结构域及特殊的空间构象. 蛋白质的三级结构主要由疏水性氨基酸残基的位置、数目、排列方式所决定.一般认为蛋白质三级结构具有如下规律:①一条多肽链内各氨基酸残基之间不存在任何形式的氢键;②蛋白质分子中某些区域内的氨基酸残基,如α-螺旋、β-折叠片段,以及α-螺旋、β-折叠片段周围的疏水区域,它们之间都可能形成氢键;③蛋白质分子中某些区域的疏水区域与另外一些区域的亲水区域,在电荷作用下可以发生重叠.蛋白质的二级结构虽然十分稳定,但在三级结构的基础上还可以发生翻译后修饰,例如加入某些化学试剂或金属离子,便可使其产生不同的空间构象,从而影响蛋白质的功能.。

蛋白质结构预测的方法与工具

蛋白质结构预测的方法与工具蛋白质结构是生物学研究中一个非常重要的领域，因为它对于蛋白质的功能和相互作用有着非常大的影响。

蛋白质结构预测是研究蛋白质学中的一个重要分支，其目的是通过计算机模拟和其他实验手段，预测蛋白质的三维结构。

本文将介绍一些常见的蛋白质结构预测方法和工具。

1. 能量函数蛋白质的三维结构由其氨基酸序列决定。

由于在氨基酸之间的相互作用非常复杂，将其精确地预测出来非常困难。

因此，实际上我们常常用一系列能量函数，来猜测最有可能的三维结构。

能量函数的基本思想是，通过计算预测结构与实验结果的对比来选择最有可能的结构。

能量函数可以预测统计力学方程、物理模型和知识库，用于描述蛋白质的相互作用。

能量函数的选择应当根据具体任务的不同于权衡，其准确度、完备性、计算量和鲁棒性各有不同。

2. 基于机器学习的方法机器学习是指从大量的数据中自动提取出模型，从而能够准确地预测未知数据的特点。

在蛋白质结构预测上，机器学习最成功的是基于神经网络的方法。

基于神经网络的方法，可以学习到从蛋白质的氨基酸序列到三维结构的直接映射，而不需要在蛋白质产生结构时太多的假设。

这种方法有非常高的准确度，并且需要的计算量很少。

3. 蛋白质结构预测工具现在有很多好用的蛋白质结构预测工具可以使用，其中一些工具是公共的，可以在互联网上免费使用。

这些工具使用多种预测方法，如用于序列对齐、模拟、统计建模等，来预测蛋白质的三维结构。

一些常用的工具包括I-TASSER、ROSETTA和PHYRE等。

不同的工具有不同的优缺点，应根据需要进行选择。

其中I-TASSER 最为广泛使用，而ROSETTA则更受科学家们喜爱。

总结：蛋白质结构预测是研究蛋白质学中的一个重要分支，它为我们提供了非常重要的信息，有助于我们更深入地理解生命中的分子结构和功能。

这里我们介绍了一些蛋白质结构预测的方法和工具。

通过不断学习和掌握这些方法和工具，我们将能够更好地运用它们来对现实中的生物学问题进行解决。

第五章蛋白质结构预测和分子设计

• TMpred (/software/TMPRED_form.html)
预测蛋白质的跨膜区段和在膜上的取向，它根据来自SWISS-PROT的跨膜蛋白数据库Tmbase，利用跨膜结构区段的数量、位置以及侧翼信息，通
过加权打分进行预测。
•SignalP (http://www.cbs.dtu.dk/services/SignalP/) 信号肽（signal peptide）是未成熟蛋白质中，可被细胞转运系统识别的特征氨基酸序列。预测蛋白质序列中信号肽的剪切位点。
级结构则效果很差。
二级结构预测的基本策略：（1）相似序列→相似结构
QLMGERIRARRKKLK
QLMGAERIRARRKKLK
结构？
（2）分类分析
α 螺旋
提取样本
预测….-Gly-Ala-Glu-Phe-….
聚类分析
学习分类规则
二级结构预测的方法：
(1)
经验参数法又称Chou-Fasman方法，是一种基于单个氨基酸残基统计的经验预测方法。通过统计分析，获得的每个残基出现于特定二级结构构象的倾向性因子，进而利用这些倾向性因子预测蛋白质的二级结构。
蛋白质结构预测主要有两大类方法：
（1）理论分析方法
通过理论计算（如分子力学、分子动力学计算）进行结构预测。
这种方法由于折叠前后的能量差太小、蛋白质可能的构象空间庞大和质折叠的计算量太大等原因不大可行。（2）统计的方法对已知结构的蛋白质进行统计分析，建立序列到结构的映射模型，进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。
预测每个氨基酸的二级结构类型。它将蛋白质结构类型分为全α蛋白、
全β蛋白和α/β蛋白，输出结果包括“H”(螺旋)、“E”(折叠)和“-”(转角)。这个方法对全α蛋白能达到79%的准确率。

蛋白质结构的预测及其意义

蛋白质结构的预测及其意义蛋白质是构成生命体的基本单位，它们扮演着重要的功能和调节作用。

因此，对蛋白质的结构预测具有重要的科学意义和实际应用，并且已经为医疗保健、新药研发、生命科学等领域做出了贡献。

一、蛋白质的结构种类蛋白质的结构通常分为四种类型，即原始结构、二级结构、三级结构和四级结构。

原始结构是蛋白质的基础形状，由氨基酸的线性序列决定，分为多肽链和蛋白质子单位两种类型。

二级结构是指蛋白质的α螺旋和β折叠形态，由氢键和其他相互作用力引导。

三级结构是指蛋白质的三维折叠，由氨基酸之间的相互作用力、离子键、疏水互作用和范德华力等决定。

四级结构是指由多个多肽链组成的复合体。

二、解决蛋白质结构难题的方法蛋白质的结构预测是基于计算机模拟和实验分析的综合方法来完成的。

在计算机模拟方面，使用的方法包括基于力场的分子动力学模拟、Monte Carlo方法和几何随机游走法等；在实验分析方面，则包括X射线衍射、核磁共振、质谱和电子显微镜等技术。

然而，由于蛋白质结构预测问题的困难性以及计算资源限制，尽管各种方法都在不断改进，但尚没有一种方法是完美可靠的。

三、蛋白质结构预测的意义蛋白质结构的预测对生命科学以及医学保健等领域中的研究起到了关键的作用。

由于蛋白质的结构可以直接决定它们的功能和调控作用，因此对蛋白质的结构预测有助于设计新的分子拮抗剂、药物和功能材料。

此外，结构预测也为人类外源性蛋白质和蛋白质质量谱的解释提供了基础，它们和寿命、健康以及生育绩效等生理学现象有关。

四、蛋白质结构预测的应用基于蛋白质结构预测的技术已经成为生命科学的前沿研究。

例如，世界各地的科学家正在利用蛋白质结构预测来研究HIV、肿瘤细胞、器官移植、遗传性疾病以及神经退行性疾病等方面。

在医疗保健领域中，一些药物的研发和疾病的诊断和治疗依赖于蛋白质结构预测技术。

许多生物医药企业和药品研发机构也在采用这种技术，以提高新药开发的准确性和速度。

总之，蛋白质结构预测技术越来越成为生命科学和药物研发等领域的重要研究方向。

蛋白质结构预测方法和应用

蛋白质结构预测方法和应用蛋白质是生物体内的重要功能分子之一，其结构对其功能起着至关重要的作用。

准确预测蛋白质的结构对于深入理解其功能和研究相关疾病的发病机制具有重要意义。

本文将介绍蛋白质结构预测的方法和应用。

蛋白质结构预测是通过一系列计算方法来推测蛋白质的三维空间结构。

目前，主要有三种预测方法：序列比对法、基于物理性质的方法和基于机器学习的方法。

序列比对法是最常用的蛋白质结构预测方法之一。

它通过将待预测蛋白质的氨基酸序列与已知结构的蛋白质进行比对，从而预测出待预测蛋白质的结构。

这种方法基于生物学的观察，即具有相似序列的蛋白质通常会有相似的结构。

尽管序列比对法可以得到大致的结构信息，但由于蛋白质结构的多样性，其准确度有限。

基于物理性质的方法则从蛋白质的化学和物理性质出发，通过模拟蛋白质的构象空间来预测其结构。

这种方法通常基于几何学和力场理论，模拟蛋白质的原子间相互作用力，进而寻找最稳定的结构。

然而，由于蛋白质的结构空间极其庞大，这种方法的计算复杂度很高，限制了其在大规模结构预测中的应用。

基于机器学习的方法是目前蛋白质结构预测的热门方向。

这种方法通过以往蛋白质结构和性质的数据作为训练集，使用各种机器学习算法来建立模型，从而预测未知蛋白质的结构。

这种方法的优势在于：可以通过大数据的学习提高预测准确度；计算速度相对较快，适用于大规模结构预测。

常见的机器学习算法包括神经网络、支持向量机和随机森林等。

蛋白质结构预测的应用非常广泛。

首先，它对于揭示蛋白质的功能和机制至关重要。

蛋白质的结构与其功能密切相关，通过预测蛋白质结构，可以更好地理解其功能。

其次，蛋白质结构预测在药物设计和疾病治疗方面具有巨大潜力。

许多药物的设计和优化需要了解蛋白质的结构，预测蛋白质结构可以为药物发现和设计提供重要参考。

此外，蛋白质结构预测还可以预测蛋白质的变异和突变对结构和功能的影响，对疾病的发病机制研究和治疗策略的制定都有重要意义。

当前，随着计算能力的不断提高和大规模结构数据的积累，蛋白质结构预测已经取得了长足的进展。

蛋白质结构预测与设计的思路及方法

蛋白质结构预测与设计的思路及方法随着现代科研技术的不断发展，人类对生命科学的认知也越来越深入。

其中，蛋白质是生命物质中不可或缺的部分，它们具有良好的稳定性、可重复性和各种生物学功能，被广泛应用于医学、纳米科技和食品等领域。

然而，蛋白质通常是非常复杂的分子结构，需要耗费大量时间和资源才能得到完整的结构信息。

因此，蛋白质结构预测与设计的思路及方法就成为了现代科研的重要课题之一。

一、蛋白质结构预测蛋白质结构预测即是从氨基酸序列信息的角度出发，预测蛋白质的三级结构及其可能的构象。

包括了以下的几种方法：1. 尺度化（scaling）方法这种方法是将蛋白质序列信息转换成一个尺度化的模板空间，比如常见的将闵可夫斯基距离数列尺度化为一个欧几里得距离。

最常见的例子是生物可自组装的蛋白质黄素簇衷（FMN）。

2. 模型空间（model space）搜索方法这种方法就是将可能的蛋白质结构放入一个巨大的搜索空间中，用某些搜索算法在其中寻找到蛋白质最佳的三级结构。

例如，著名的全原子力学计算方法——兰纳克-施罗丹加估算。

3. 比对方法这种方法是将已知结构的蛋白质序列作为模板，与目标蛋白质进行比对，得到相对结构信息和功能性结构信息。

比对方法通常还包含了进化学计算法和进化学的生物学性质的分析法。

比如用进化算法进行亿万年的模拟。

二、蛋白质结构设计蛋白质结构设计的目的是设计出新型蛋白质，使之具有更好的性能和功能性。

其方法有以下几种：1. 重组蛋白质设计法这种方法是将不同蛋白质的部分组合成新的蛋白质结构，可以获得新型的蛋白质分子。

比如捏裂的麻醉药物中，有发现可以组成新型的麻醉药物。

2. 原子内交互描述法该方法是基于原子之间的不断碰撞，形成逐渐稳定的过程，利用外部环境和化学信息对蛋白质成形与折叠的调节，最终形成稳定的蛋白质结构。

标志性的蛋白质重排——鲁米诺森。

3. 质子交换反应法该方法是从质子水平上出发，预测蛋白质结构，同时可以根据蛋白质的酸碱特性，设计出特定的质子交换条件，实现精细的蛋白质结构设计。

蛋白质结构预测的方法与实践

蛋白质结构预测的方法与实践随着生物学的发展，越来越多的研究涉及到蛋白质的结构和功能。

蛋白质是生命体中最为基本的分子，也是最为复杂的分子之一。

它的功能与结构密不可分，而预测蛋白质结构是蛋白质学领域中非常重要的课题。

一、什么是蛋白质结构预测在蛋白质学领域中，预测蛋白质结构是指在不通过实验的情况下预测蛋白质的构象。

具体来说，就是通过对蛋白质序列的分析和计算，推断出蛋白质可能具有的折叠状态和空间结构。

这个过程有时也被称作“蛋白质折叠预测”。

蛋白质的结构可以分为四个层次：一级结构、二级结构、三级结构和四级结构。

一级结构是指蛋白质由什么样的氨基酸组成，二级结构是指氨基酸之间的相互作用，三级结构是指三维空间中蛋白质的形状，四级结构则是指由多个蛋白质组成的超级大分子。

预测蛋白质的结构，通常是指预测蛋白质的三级结构。

二、蛋白质结构预测的意义和应用预测蛋白质结构的意义十分重大。

首先，知道蛋白质的结构可以帮助人们理解蛋白质的功能。

蛋白质的功能与其结构密切相关，一旦知道了蛋白质的结构，就可以理解它的生理作用和机制。

其次，预测蛋白质结构可以为药物研发提供帮助。

许多药物都是通过与特定的蛋白质相互作用，来发挥其治疗作用的。

如果知道了药物与蛋白质相互作用的具体方式，就可以更好地设计合适的药物分子。

此外，预测蛋白质的结构还可以为生物信息学的研究提供有力支持。

三、常见的蛋白质结构预测方法目前预测蛋白质结构的方法主要分为两类：实验方法和计算方法。

实验方法是指通过实验手段，如X射线晶体学、核磁共振等，得到蛋白质的结构信息。

这种方法的优点在于能够得到非常准确的结构信息，但成本非常高，并且需要大量时间和劳力。

相比之下，计算方法不需进行实验，只需要利用计算机程序，对蛋白质的序列进行计算，推测其可能的结构。

下面就来介绍一些常见的计算方法。

1. 模板比对法模板比对法是目前最为流行的蛋白质结构预测方法之一。

这种方法的核心思想是，在已知的蛋白质结构中，找到与待预测蛋白质序列相似的结构，并将其作为模板，预测待预测蛋白质的结构。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

序列基序识别二硫键识别折叠子识别残基接触预测结构域预测
结构表面识别
预测蛋白质表面结构功能关键区域
5
PredictProtein Secondary Structure
PredictProtein Secondary Structure
H:螺旋 E:折叠 L:环 e:暴露表面﹥16%残基 b:其它残基
3
PredictProtein提交界面
序列提交窗口
分析方法程序详解
PROFsec（默认） PROFacc（默认）序列预测
基于轮廓（profile）的神经网络算法预测蛋白质二级结构基于轮廓（profile）的神经网络算法预测残基溶剂可及性
PHDhtm（默认）
ASP（默认） COILS（默认） PROFtmb ProSite（默认） SEG（默认） PredictNLS（默认） DISULFIND（默认） AGAPE PROFcon ProDom（默认） CHOP ConSeq
22
SWISS-MODEL
• SWISS-MODEL是一个蛋白质3D结构数据库，库中收录的蛋白质结
构都是使用SWISS-MODEL同源建模方法得来的。
– /
• 基于同源建模法与PDB数据库已知结构的蛋白质序列比对进行预测
23
SWISS-MODEL
蛋白质三维结构预测
方法特点工具
同源建模法基于序列同源比对，对于序列相似度>30％ SWISS-MODEL， CPHmodels ( Homology/Comparativ 的序列模拟比较有效，最常用的方法 e modelling ) 线串法/折叠识别法 (Threading/Fold recognition) 从头预测法 ( Ab initio/De novo methods ) “串”入已知的各种蛋白质折叠骨架内，适于对蛋白质核心结构进行预测，计算量大基于分子动力学，寻找能量最低的构象，计算量大，只能做小分子预测
基于多序列比对预测跨膜区位置和拓扑结构
识别二级结构中构型变化的氨基酸识别卷曲螺旋
识别革兰氏阴性菌膜Beta桶蛋白结构
搜索序列中保守基序过滤序列中低复杂区域基于实验数据预测序列核定位区域识别序列中二硫键位置基于折叠结构识别远源蛋白序列预测单链中原子残基接触性基于序列同源性来预测蛋白质结构域预测蛋白质结构域
InterProScan工具
InterProScan/InterProScan/
选择需要的分析工具
结果返回形式
序列提交框
17
InterProScan工具
提交序列
选择需要的分析工具
运行
InterProScan工具
五、蛋白质三维结构
• 蛋白质的生物学功能在很大程度上取决于蛋白质的空间结构，三级结构是蛋白质预测的最终目的。在一些较小的蛋白质分子中一般只具有单结构域，这时，其三级结构就是它的结构域。在较大的蛋白质分子中，则由两个或多个相对独立的结构域组合并折叠成在空间上可明显区分的三维结构。通常采用X射线晶体衍射及核磁共振等实验技术加以验证，但对设备及技术要求很高。基于计算机的生物信息学预测一般有三种方法：同源建模法、线串法和从头算法，对蛋白质数据进行初步结构模拟。
蛋白定位预测
ProSite模体搜索结果
简单描述 Motif模式
PROSITE中的ID号
提交序列中出现该 Motif的位置
PredictProtein分析结果
SEG低复杂区域过滤
二硫键识别程序
PredictProtein分析结果
跨膜区预测
跨膜区
Loop
Helix
Sheet 非跨膜区
二级结构
11
数据库
InterPro数据库网站
备注
整合 Swiss-Prot 、 TrEMBL 和 PIR 数据库中有关的蛋白序列和功能信息有关蛋白质家族和结构域的数据库有关微生物蛋白质组自动、人工注释的高质量数据库
UniProt
PROSITE HAMAP Pfam PRINTS ProDom SMART TIGRFAMS PIRSF Superfamily Gene3D PANTER
1
蛋白质二级结构分析工具
工具 PredictProtein Prof Jpred 网站 / 备注提供多项蛋白质性质分析，并有较好准确性 /~phiwww/prof/ 基于多重序列比对预测工具 /~ww 基于Jnet神经网络的分析程 w-jpred/submit.html 序，并采用 PSI-BLAST 来构建序列Profile进行预测，对于序列较短、结构单一的蛋白预测较好 http://npsa-pbil.ibcp.fr/cgi可以比较各种分析方法得 bin/npsa_automat.pl?page=npsa_sopm 到的结果，也可输出 “一 a.html 致性结果” http://coot.embl.de/~fmilpetz/SSPRED/ 基于数据库搜索相似蛋白 sspred.html 并构建多重序列比对
30
SWISS-PdbViewer主要功能
（1）查看使用同源建模法预测的蛋白质结构；（2）计算电荷分布，估算易受影响的表面；（3）计算并显示不合理的原子接触、氢键、角度；（4）人工编辑序列，如氨基酸突变、loop区域重建、旋转指定的化学键，并通过能量最小化（ energy minimization）调整修饰后蛋白质的结构；（5）测量原子之间距离和角度；（6）利用Ramachandran plot观察蛋白质结构的合理性。
HAMAP InterPro
Pfam
ProDom
SMART
InterPro数据库
• InterPro：/interpro/ • InterPro数据库由EBI开发，整合蛋白质家族、结构域和功能位点等资源。 • 整合UniProt、PROSITE、Pfam等12个成员数据库，检索结果准确。 • 目前最新的 InterPro 26.0 版本包含 20329 个条目，涵盖5542个结构域、12370个蛋白质家族。
二、蛋白质二级结构预测
• 蛋白质二级结构预测不仅是联系其一级结构和三级结构的桥梁和纽带，而且也是从一级结构预测其三级空间结构的关键步骤。基本的二级结构：α螺旋，β折叠， β转角，无规则卷曲（coils）以及模序（motif）等蛋白质局部结构组件。 • 蛋白质二级结构的预测程序采用以下3种方法:(1)结合人工神经网络、遗传算法等机器学习方法，统计氨基酸出现频度; (2) 以二级结构为模板，建立序列谱矩阵或未知特异性记分矩阵; (3)利用同源蛋白多重比对。
输入用户E-mail（选填）自动模式
粘贴蛋白质序列 fasta
可以指定PDB数据库收蛋白质作为参照模板
SWISS-MODEL结果分析
目标序列与靶序列比对图形
模型蛋白预测信息
SWISS-MODEL结果分析
模型全局质量评估
模型局部质量评估比对报告
建模报告点击可展开或收缩报告
模板报告四级结构建模报告报告配体建模报告
Phyre2，3DPSSM
HMMSTR/ ROBETTA
21
同源建模
同源建模是目前最为成功且实用的蛋白质结构预测方法同源建模的前提是已知一个或多个同源蛋白质的结构。当两个蛋白质的序列同源性高于30%，认为它们的三维结构基本相同；序列同源性低于30%的蛋白质难以得到理想的结构模型。同源建模的大体过程分为4个步骤：1鉴定结构模板；2目标序列和模板结构比对；3建立模型；4模型质量评估。
/uniprot/
http://www.expasy.ch/prosite/ http://www.expasy.ch/sprot/hamap/
收集了大量的覆盖众多蛋白质 / 结构域的多序列比对数据和隐马尔科夫模型 /dbbrowser/PRINT 蛋白质指纹图谱数据库，提供 S/ 识别蛋白质家族的保守模序 http://prodes.toulouse.inra.fr/prodom/current/ht 基于 PSI-BLAST 的同源蛋白结 ml/home.php 构域数据库用于鉴定和注释可移动结构域 http://smart.embl-heidelberg.de/ 并分析其结构 /TIGRFAMs/index.sht 基于隐马尔科夫模型搜索蛋白质家族的工具 ml 提供从超家族到亚家族多层次 /iproclass/ 蛋白质分类系统网 /SUPERFAMIL 对所有完成基因组测序的蛋白质，基于 SCOP 数据库的结构 Y/ 和功能注释 /Gene3D 描述全基因组蛋白质家族和结构域 / 根据家族功能特异性区分蛋白 / 家族和亚家族，基于规范的术语和代谢途径确定更精确功能
SOPMA
SSPRED
2
PredictProtein:蛋白质二级结构预测
• PredictProtein(/)是欧洲分子生物学实验室提供的蛋白质序列和结构预测服务网站。访问PredictProtein网站应先注册ID，进入序列提交界面。程序默认分析方法包括：用PROFsec分析序列二级结构及残基溶剂可及性；用PHDhtm分析序列潜在的跨膜拓扑结构；用COILS预测卷曲结构；通过PROSITE搜索模体(motif)，预测序列潜在的功能，借助ProDom预测结构功能域等。 • PredictProtein可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息。该方法的平均准确率超过72%，最佳残基预测准确率达90%以上。
文献
SWISS-MODEL模型评估
A
B
C
SWISS-MODEL结果分析
与模板序列比对结果，并显示二级结构区域螺旋

蛋白质结构预测

合集下载

蛋白质结构预测方法与意义

蛋白质结构预测的算法及其评价

蛋白质结构预测与分析方法

蛋白质结构预测

蛋白质结构预测的方法与工具

第五章蛋白质结构预测和分子设计

蛋白质结构的预测及其意义

蛋白质结构预测方法和应用

蛋白质结构预测与设计的思路及方法

蛋白质结构预测的方法与实践

文档推荐

最新文档

蛋白质结构预测

合集下载

蛋白质结构预测方法与意义

蛋白质结构预测的算法及其评价

蛋白质结构预测与分析方法

蛋白质结构预测

蛋白质结构预测的方法与工具

第五章 蛋白质结构预测和分子设计

蛋白质结构的预测及其意义

蛋白质结构预测方法和应用

蛋白质结构预测与设计的思路及方法

蛋白质结构预测的方法与实践

文档推荐

最新文档

第五章蛋白质结构预测和分子设计