当前位置：文档之家› 蛋白质结构研究现状与展望

蛋白质结构研究现状与展望

新乡学院毕业论文

论文题目: 蛋白质结构研究现状与展望

学生姓名孙雪

院(系)名称化学与化工学院

专业名称生物制药技术

年级班级2009级2班

指导教师姓名陈磊山

指导教师职称副教授

内容摘要 (1)

关键词 (1)

Abstract (1)

Key words (1)

前言 (2)

1.蛋白质简介 (2)

1.1蛋白质的作用 (2)

1.2蛋白质的元素组成及分子组成 (2)

2.蛋白质的研究 (3)

2.1研究方法简介 (3)

2.2蛋白质结构研究的方法 (4)

3.蛋白质结构预测 (5)

3.1蛋白质几何的表示方法 (6)

3.2势能函数与势能搜索方法 (6)

4.蛋白质结构 (6)

4.1.蛋白质结构分类与比较 (7)

4.2蛋白质结构确定 (7)

5.蛋白质相互作用 (8)

5.1酵母双杂交技术 (8)

5.2串联亲和纯化技术 (8)

5.3荧光共振能量转移技术 (9)

6.蛋白质折叠机理的研究 (9)

6.1分子生物学的中心法则与蛋白质折叠的研究概况 (9)

6.2蛋白质折叠的热力学和动力学 (10)

6.3蛋白质折叠与分子伴侣 (11)

前景展望 (11)

参考文献 (13)

致谢 (14)

内容摘要：蛋白质是一种生物大分子，多是由20种氨基酸以肽键连接成肽链。肽链再进一步空间卷曲折叠成为特定的空间结构，包括二级结构和三级结构。有的蛋白质由多条肽链组成，每条肽链称为亚基，亚基之间又有特定的空间关系，称为蛋白质的四级结构。因此蛋白质分子往往具有特定的复杂的空间结构。对蛋白质结构的解析可以从根本上阐明蛋白质功能的分子机制和基础，同时也是研究蛋白质功能的一个重途径。本文将对蛋白质结构的研究概况以及意义进行综述，并在此基础之上对今后蛋白质结构的研究提出了一些自己的看法。

关键词：蛋白质结构研究相互作用折叠

Abstract:Proteins are biological macromolecules, mostly from 20 kinds of amino acids connected by peptide bonds into the peptide chain. Further space in the peptide chain folds into a specific space curled structure, including secondary and tertiary structure. Some of the protein by the number of peptide chains, called subunits of each peptide chain, subunits have specific spatial relationships between the known quaternary structure of proteins. So often with a specific protein complex spatial structure. For protein structure analysis can clarify the fundamental mechanism of protein function and molecular basis of protein function is also an important way. This paper will overview the study of protein structure and meaning are reviewed, and on this basis for future studies of protein structure presented some of his views.

Key words:Protein structure interaction fold

前言

人类进入21世纪之际，生命科学也迎来了一个崭新的时代。2001年2月12日参与人类基因组计划的六国科学家共同向世人正式公布了人类基因组图谱及初步分析结果，这是生命科学史，也是人类科学史上的又一次飞跃，同时标志着后基因组时代的来临，但是随着大量生物体全基因组序列的获得，人们发现仅从基因组序列的角度根本无法完整、系统地阐明生物体的功能。蛋白质作为生命体的主要组成成分和生命活动的主要执行者，正在成为新的研究热点；而蛋白质结构则是蛋白质研究领域中的一个重要环节。以蛋白质为主体的生物大分子的功能主要取决于它们的三维结构、运动及相互作用。只有全面了解相关蛋白质及其复合物、组装体的精细三维结构、运动和相互作用网络，及其在亚细胞、细胞层次上表现出来的生命活动的功能关系，才能最终阐释人类个体发育、生长、衰老和凋亡机理，才能在分子和原子水平上理解神经活动、认知等脑功能表现机理，细胞增殖、分化和凋亡机理，信息传递和作用机理，疾病发生、发展机理等一切生命科学问题。

1.蛋白质简介

1.1蛋白质的作用

蛋白质（Protein）是细胞组分中含量最为丰富、功能最多的高分子物质，在生命活动过程中起着各种生命功能执行者的作用，几乎没有一种生命活动能离开蛋白质，所以没有蛋白质就没有生命。在人体中，蛋白质的主要生理作用表现在六个方面：(1)构成和修复身体各种组织细胞的材料；(2)构成酶、激素和抗体；(3)维持正常的血浆渗透压，使血浆和组织之间的物质交换保持平衡；(4)供给肌体能量；(5)维持肌体的酸碱平衡；(6)运输氧气及营养物质。

1.2蛋白质的元素组成及分子组成

蛋白质是化学结构复杂的一类有机化合物，是人体的必须营养素。其主要是由碳、氢、氧、氮、硫、磷、碘、铁、锌等元素组成。

蛋白质分子的基本单位是氨基酸，它是由多种不同的氨基酸通过肽键相互连接而成。蛋白质在受到酸、碱或酶的作用下最终水解成氨基酸。组成自然界蛋白质的氨基酸主要有20种，其化学结构具有共同的特点，即在连接羧基的α-碳原子上，还有一个氨基，故称α-氨基酸。可用下式表示：

不同的氨基酸其侧链(R)各异。除甘氨酸外，其余氨基酸的α-碳原子均为不对称碳原子，故有L型或D型之分。组成天然蛋白质的氨基酸，除甘氨酸外，都是L-α-氨基酸。

2.蛋白质的研究

2.1研究方法简介

目前蛋白质结构预测方法按照其对模板的依赖与否主要分为两类:模板依赖模型以及从头预测方法（自由模型）。模板依赖模型又可以分为两种模型:同源模型(比较模型) 和折叠识别模型(穿线法) 。两种方法的差别在于模板的同源度。同源模型所使用的模板拥有较高的同源度,序列相似度一般大于30 %；折叠识别模型所使用的模板为远程同源关系。两种方法所采用的预测步骤基本一致: (1) 搜索结构模型的模板:即为待预测的蛋白质序列寻找具有同源性的已知结构蛋白质作为模板。(2) 序列比对:将目标蛋白质的序列与模板蛋白质序列进行比对,使目标序列的氨基酸残基与模板蛋白质的残基匹配。(3) 建立骨架:将模板结构的坐标拷贝到目标序列,仅拷贝匹配残基的坐标。通过这一步建立目标蛋白质的骨架。(4) 构建目标蛋白质的侧链及环区:可将模板相同残基的坐标直接作为目标蛋白质的残基坐标,对于不完全匹配的残基,其侧链构象是不同的,需要进一步预测。其中前两步是预测方法的关键。

当目标序列没有同源结构时,进行蛋白质三维结构预测就必须使用从头预测方法。从头预测方法预测蛋白质三级结构一般由下列3个部分组成: (1) 一种蛋白质几何的表示方法:由于表示和处理所有原子和溶剂环境的计算开销非常大,因此需要对蛋白质和溶剂的表示形式作近似处理,例如,使用一个或少数几个原子代表一个氨基酸残基; (2) 一种势能函数及其参数:或者一个合理的构象得分函数,以便计算各种构象的能量; (3)一种构象空间搜索技术:必须选择一个优化方法,以便对构象空间进行快速搜索,迅速找到与某一全局最小能量相对应的构象。其中,构象空间搜索和能量函数的建立是从头预测方法的关键。

2.2蛋白质结构研究的方法

蛋白质结构测定方法主要包括X射线晶体学、核磁共振波谱学技术和三维电镜重构。这三种方法都可以完整独立地在原子分辨水平上测定出蛋白质的三维空间结构。

2.2.1X-射线晶体学

X-射线晶体学是最早也是最主要的测定蛋白质结构的方法，第一个蛋白质的三维结构——血红蛋白的结构就是通过X-射线晶体学方法解析的。目前PDB中收录的蛋白质的结构85％左右是利用X射线晶体学方法解析的。蛋白质晶体结构的X射线衍射分析包含样品制备、蛋白质结晶、衍射数据收集和处理、相位求解、模型建立和修正等五个主要步骤。五个步骤彼此密切相关，每一个部分取得进展可以加快下一步的研究，同样任何一个部分的瓶颈也可以成为下一步的限速步骤。其中样品制备和蛋白质结晶阶段是要获得足够量的蛋白样品以及可以用于衍射数据收集的高质量单晶，前者可以通过针对所选目的基因的特性构建和改造高效表达质粒，而后利用多种表达系统，高质量单晶的获得是蛋白质晶体结构研究的主要瓶颈之一，由于不同蛋白质的物理化学性质差别以及各种修饰和相互作用更增加了蛋白质的复杂性，所以不是所有的蛋白质都可以获得单晶的。

1990 年以后，利用X-射线晶体学解析蛋白质结构取得了突飞猛进的发展，目前平均每天有15个蛋白质通过该方法获得结构。X-射线晶体学的缺点是分子在晶体中往往是被锁定于某一状态，所得到的晶体往往是分子处于基态或不同构象的平均，而分子行使功能时多发生在激发态、过渡态、X-射线晶体技术很难捕捉到分子的动态信息[1]。但是无论怎样，X-射线晶体学方法无论过去、现在或将来都会是蛋白质结构研究的主要方法。

2.2.2核磁共振波谱学

核磁共振波谱学是对X-射线晶体学的有力补充。目前，该技术已经成为确定生物大分子溶液三维空间结构的主要手段[2]。核磁共振波谱学技术在蛋白质- 蛋白质、蛋白质-DNA等分子间的相互作用方面，具有高分辨率的特点，仅次于X-射线晶体学技术，可以在溶液中操作，在近似蛋白质生理环境下测定其结构，甚至可以对活细胞中的蛋白质进行分析，获得“活”的蛋白质结构。核磁共振波谱学技术在分析蛋白质折叠稳定性、运动性和蛋白质复合体中各亚基的相互作用方面具有优势。核磁共振波谱学

技术的缺点是只能测定小蛋白和中等大小的蛋白质分子(相对分子质量一般在30000

以下)，并且图谱分析工作极为费时，往往需要数月到一年的时间，导致实验周期延长，速度缓慢；另外核磁共振衍射技术的反应是在溶液中进行的，研究对象必须是可溶的蛋白，对不溶蛋白的研究就比较困难；而且样品需要同位素标记等，这些在一定程度上制约了核磁共振波谱学技术的应用。

随着一些新技术的发现，如G矩阵傅立叶变换式核磁共振波谱学技术等，使得核磁共振波谱学的发展速度也很快，目前PDB中收录的蛋白质的结构15％左右是利用核磁共振波谱学方法解析的，其快速发展主要归功于以下几个方面：仪器技术的不断发展，计算速度的飞速提升和实验方法上的不断创新和发展[3]。1990 年以前平均每年只能解10个结构，现在平均每天可以解2个结构，相信随着核磁共振波谱学技术不断的改进和发展，核磁共振波谱学技术在未来结构生物学上的贡献将会越来越大。

2.2.3三维电镜重构

电子显微镜在结构生物学中的应用近年来变得越来越重要，成为解析大型蛋白质复合体、病毒乃至细胞器的三维纳米分辨率结构的有力手段，同时电子显微镜二维晶体学在膜蛋白的三维精细结构解析上也有特殊的优势。冷冻电镜三维重构的基本技术路线为：利用快速冷冻技术对样品进行冷冻固定，然后利用冷冻电镜和低剂量成像技术对样品进行电子成像，利用高灵敏底片进行成像记录，利用高分辨率扫描仪对底片进行数字化，对数字化的图像进行二维图像分析——选点、分类、校正和平均，最后完成样品的三维重构计算。自从1968年DeRosier和Klug第一次用电子显微镜对T4噬菌体的尾部进行了结构解析至今，已有140余种蛋白质通过该方法获得了结构，尤其是最近5年随着计算机图像处理技术和显微镜设备的不断发展，使得三维电镜重构技术成为继X-射线晶体学和核磁共振波谱学技术后，蛋白质结构研究的另一种重要方法。三维重构技术的优势在于：(1)可以直接获得分子的形貌信息，即使在较低分辨率下，电子显微学也可给出有意义的结构信息；(2)适于解析那些不适合应用X-射线晶体学和核磁共振技术进行分析的样品，如难以结晶的膜蛋白、大分子复合体等；

(3)适于捕捉动态结构变信息；(4)易同其他技术相结合得到分子复合体的高分辨率的结构信息；(5)电镜图像中包含相位信息，所以在相位确定上要比X-射线晶体学直接和方便[4]。

3.蛋白质结构预测

3. 1蛋白质几何的表示方法

限制蛋白骨架构象中可采取的自由度是在模拟过程中简化蛋白质的一种方法，其中一种限制是Cα只允许位于二维或三维格子(网格) 的位置上。这种简化方法大大减少了一个蛋白质可以采取的构象数目。于是，对于一个中等大小的多肽链，我们可以对它的构象空间进行穷举搜索，直到找到能量全局最小的构象。而对于比较长的多肽链，简化的格点模型可以使非穷尽的搜索方法对所有可能的构象进行较大比例的取样，因此可以比较准确地估计出能量全局最小的构象虽然使用格点模型，本身所能达到的精确度比较低，但是其计算上的优点使其在低精度预测上依然有很大的发展。3. 2势能函数与势能搜索方法

势能函数的构建从本质上来讲可以分两类：分子力学方法和统计学方法。分子力学方法假设正确的蛋白质折叠对应于最低能量的构象。分子力学势能是原子坐标的函数，其极小值对应于原子体系的局部能量最小点。分子力学中的势能参数有各种来源，包括从头计算和半经验量子化学计算结果、氨基酸和小分子的实验观察结果等。分子力学应用经验势函数，即力场方法模拟分子的结构，计算分子的性质。尽管计算量很大,基于分子力学的势能函数在计算高分辨率结构方面依然有很大的应用。另外一种方法就是根据一些已知结构的蛋白质构象为一个未知结构的蛋白设计一个经验性的伪能量函数。通常，为得到这种经验性的能量函数表达式，我们首先要选择一系列已知结构的蛋白质，然后对于每一个氨基酸，采用统计学方法分析在三维空间上与其相邻的氨基酸。可以根据不同氨基酸的相对位置得到一个得分矩阵。依据这种方法在计算上非常高效，同样也可以被用于全原子模型。

对于势能的搜索有多种方法。常用的方法是梯度下降法，其中最陡下降法是一种最基本的优化算法。用这种方法可以迅速向极小点靠近，但接近极小点时，会产生振荡，收敛速度慢。共轭梯度法也是一种基于梯度的方法，其收敛的速度快，但是更容易陷入能量局部极小点。牛顿-拉普森方法是另一类能量优化方法。梯度方法在计算时使用的是一阶微分，而牛顿-拉普森方法除使用一阶微分外还计算二阶微分。应用该方法能够迅速收敛，但是计算量非常大。蒙特卡罗算法是一种随机采样的方法，通过该方法可以期望找到非常接近于全局能量最优的构象。

4.蛋白质结构

4.1蛋白质结构分类

人类关于进化的知识及蛋白质结构相似性比较方法的研究使蛋白质结构分类成为可能，而且近年来取得的研究进展表明大部分蛋白质可以成功地分入到适当数目的家族中。目前国际上流行的蛋白质结构分类数据库基本上采取两种不同的思路。一种是数据库中储存所有结构两两比较的结果。第二种思路是致力于构建非常正式的分类体系。由于所有分类方法反映了各研究小组在探究这个重要领域的不同角度，所以这些方法是同等有效的。目前, 被广泛应用的四种分类标准是：手工构造的层次分类数据库SCOP[5]，全自动分类的MMDB和FSSP[6]，和半手工半自动的CATH[7]。

蛋白质结构自动分类问题可以被纳入机器学习的范畴，通过提取分析蛋白质结构的关键特征，构造算法来学习蕴含于大量已知结构和分类的数据中的专家经验知识，来实现对未知蛋白质结构的分类预测。目前，对蛋白质结构的不同层次分类，结果比较好的机器学习方法是：神经网络多层感知器、支持向量机和隐马尔可夫模型。支持向量机应用于分类问题最终归结于求解一个最优化问题。上世纪90 年代中期，隐马尔可夫模型与其他机器学习技术结合, 高效地用于多重比对、数据挖掘和分类、结构分析和模式发现。多层感知器即误差反向传播神经网络，它是在各种人工神经网络模型中，在机器学习中应用最多且最成功的采用BP学习算法的分类器[8]。

4.2蛋白质结构的确定

蛋白质三维空间结构确定的主要手段是：X-射线晶体衍分析和核磁共振。蛋白质数据库PDB中80%的蛋白质结构是由X-射线衍射分析得到的，约15%的蛋白质结构是由核磁共振这种新的结构测定方法得到。X-射线衍射法的分辨率可达到原子的水平，使它可以测定亚基的空间结构、各亚基间的相对拓扑布局，还可清楚的描述配体存在与否对蛋白质的影响。多维核磁共振波谱技术已成为确定蛋白质和核酸等生物分子溶液三维结构的唯一有效手段[9]。核磁共振波谱学技术最大的优点是在于它能对溶液中和非晶态的蛋白质进行测量。

在晶体结构分析中给定大量结构因子，确定电子密度分布函数的位相的问题其实就是从图像分析得到结构坐标数据过程中出现的数学问题。当给定蛋白质结构中部分原子的距离时，求解原子坐标的方法是将距离空间的约束矩阵转化为坐标空间的矩阵，由坐标空间矩阵构建蛋白质分子的初始矩阵，运用模拟退火等算法对初始结构进

行优化，经分子动力学进行能量最小化，由此得到一组收敛的蛋白质三维结构的坐标。关于蛋白质的氨基酸序列分析，到目前为止，最经典的蛋白质的氨基酸序列分析方法是，Sanger等人基于Edman 降解原理研制的液相蛋白质序列仪，及后来发展的固相和气相的蛋白质序列分析仪。人们通过串联质谱技术和源后衰减基质辅助的激光解析离子化，就可以从质谱分析中获得肽及蛋白质的结构信息。

5.蛋白质相互作用

机体细胞内每个蛋白质并不是独立发挥作用,通常与其他蛋白质相互作用形成较大复合体,在特定的时间和空间内行使特定的功能,构成各项生命活动的基础，因此解决蛋白质相互作用问题具有举足轻重的意义。目前,用于研究蛋白质间相互作用的方法非常多,包括酵母双杂交技术、串联亲和纯化技术、荧光共振能量转移技术、蛋白质芯片技术、噬菌体表面展示技术、表面胞质团共振技术、免疫共沉淀等等。

5.1酵母双杂交技术

酵母双杂交系统是由Field和Song在1989年研究真核基因转录调控时首次发明,是一种在酵母中利用转录激活物的重组来鉴定蛋白质之间相互作用的方法,在蛋白质相互作用方面扮演着重要角色。真核生长转录因子具有两个不同的结构域：DNA结合结构域和转录激活结构域,分别与诱饵蛋白及可能与诱饵蛋白相互作用的猎物蛋白相连,并共同转入酵母细胞。如果两个蛋白能够发生相互作用就能使转录因子原来分开的两部分结合,从而激活下游报告基因。通过检测报告基因的表达产物就可判断两种蛋白是否发生相互作用[10]。双杂交系统是研究蛋白分子间两两相互作用的传统技术,其假阳性率和假阴性率比较高,所以必须与其他技术联用加以鉴定。

5.2串联亲和纯化技术

串联亲和纯化是近些年来发展起来的新技术，与酵母双杂交系统不同,此方法可在生理条件下研究多种蛋白质复合物的相互作用，兼具融合蛋白亲和色谱法和免疫共沉淀两种生化方法的优点，通过两步特异性的亲和纯化可获得与目的蛋白结合的高纯度蛋白质复合物。该方法首先对目的蛋白进行TAP标签标记，标签包括3个部分：蛋白A、钙调素结合多肽和中间连接的TEV酶识别的酶切位点。在蛋白复合物的分离纯化中，第一步利用与蛋白标签具有亲和作用的色谱柱，采用TEV蛋白酶断裂TEV蛋白酶切位点的方式洗脱；第二步利用与钙调蛋白结合肽具有亲和作用的钙调蛋白色谱

柱，将蛋白复合物和TEV蛋白酶分开，纯化出的蛋白复合物用凝胶电泳、质谱技术或Edman降解法进行鉴定[11]。TAP技术的优点是利用酶切的方法进行洗脱，条件温和，不破坏复合物的结构，并且经两步洗脱，去除了杂蛋白的干扰，提高了蛋白质相互作用结果的可靠性、特异性，远远超越了酵母双杂交传统技术。

5.3荧光共振能量转移技术

荧光共振能量转移技术的基本原理是处于激活状态的供体能在足够近的距离(小于10nm)将本身的荧光传递到受体上。因此，用荧光标记的蛋白质，可以通过荧光体的能量传递来检测两蛋白质的相互作用。此技术的优点是可以在生理条件下无损伤、动态地研究蛋白质的相互作用，同时还能检测蛋白质在细胞内的定位。但是，该方法受荧光发色基团空间距离的限制，只能用于研究分子量小于200 kD的蛋白[12]。

目前随着计算机技术的发展，很多研究者运用计算分析和构建相互作用模型的方法来预测蛋白质相互作用，从而发现更多未发现有相互作用的蛋白，但这些发现的蛋白需要利用以上提到的方法进行鉴定。总之，用于研究蛋白质相互作用的方法很多，所有方法都各有千秋，但至今尚无十分理想的方法可以大规模获得蛋白质相互作用的数据，故相互作用图谱有赖于各种研究方法的综合分析。

6.蛋白质折叠机理的研究

长期以来关于蛋白质折叠，形成了自组装的主导学说，因此，在研究新生肽段的折叠时，就很自然的把在体外蛋白质折叠研究中得到的规律推广到体内，用变性蛋白的复性作为新生肽段折叠的模型，并认为细胞中新合成的多肽链，不需要别的分子的帮助，不需要额外能量的补充，就应该能够自发的折叠而形成它的功能状态。九十年代一类具有新的生物功能的蛋白，分子伴侣的发现，以及在更广泛意义上说的帮助蛋白质折叠的辅助蛋白的提出，说明细胞内新生肽段的折叠一般意义上说是需要帮助的，而不是自发进行的。

6.1分子生物学的中心法则与蛋白质折叠的研究概况

根据分子生物学中心法则，生物遗传信息的传递是由DNA到RNA、RNA 到蛋白质多肽链、再由多肽链形成具有生物活性的蛋白质进行的。目前对前两者的过程已有相当深入和清晰的了解，但对后者尚不十分清楚。因此可以说蛋白质折叠是生物学中心法则中至今尚未解决的一个重大生物学问题。

通过蛋白质折叠的研究发现一级结构和空间结构之间存在某种确定的关系，那么是否像核苷酸通过“三联密码”决定氨基酸顺序那样有一套密码呢？有人把这设想的一级结构决定空间结构的密码叫作“第二遗传密码”。现已经观察出mRNA 的二级结构单元数与其编码的蛋白质二级结构（α－螺旋与β－折叠）单元数之间存在明显的相关性，二者的总符合率为97.3%，相关系数达0.99；其次，mRNA二级结构中5ˊ端至3ˊ端的每一发夹或复合发夹与PDB数据库所提供的蛋白质N端至C端的每一个α－螺旋或β－折叠之间存在几乎是一一对应的现象。通过上述数据可以看出，mRNA的三维结构和蛋白质的三维结构中确实存在某种相关[13]。

我们知道，多数蛋白质在体外是不稳定的，外界环境的变化，如温度、酸度等，都可以导致空间结构的破坏和生物活性的丧失，但却并不破坏它的一级结构，这称为蛋白质的变性。变性的蛋白质往往成为一条伸展的肽链，由于一级结构仍然完整，根据Anfinsen [14]原理它应该可以在一定的条件下重新折叠成原有的空间结构并恢复原有的活性。这就是长时间来在体外研究蛋白质折叠的基本模型。目前的实验和理论研究多以小分子量、单链蛋白质为模拟体系，这类蛋白质通常采用稀释法折叠、复性，其中研究最多的模型蛋白是溶菌酶[15]。

6.2蛋白质折叠的热力学和动力学

蛋白质折叠根本的科学问题是具有完整一级结构的多肽链又是如何折叠成为它特定的高级结构？这是一个折叠的动力学的问题，长期以来，主要用体外的实验方法研究，虽然已有四五十年，但至今尚未解决。

由Anfinsen[14]等根据对RNase 复性研究的经典实验提出的“热力学假说”认为一级结构决定高级结构。他们认为天然蛋白质多肽链所采取的构象是在一定环境条件下热力学上最稳定的结果，采取天然构象的多肽链和它所处的一定溶液组分、PH、温度、离子强度等环境条件下整个系统的总自由能最低，所以处于变性状态的多肽链在一定的环境条件下能自发折叠成天然构象。“热力学假说”提出后，得到了许多实验证据的证明，因此得到广泛支持。Bakei，D.等认为，对某些蛋白质而言，天然构象也许并非是多肽链自由能最低状态或唯一的低能量状态，多肽链采取的某些非天然构象也很稳定。若某一多肽链具有两种低能量状态：一种是天然构象，一种是非天然构象，而且处于这两种低能量状态的多肽链相互转变由于要克服较高的能垒而难以实现。那么在蛋白质折叠过程中就会有两种途径相互竞争。一种是正确折叠形成天然构

象的途径，另一种是错误折叠成稳定的非天然构象的途径。蛋白质多肽链之所以能正确折叠是由于一些因素在蛋白质折叠的动力学过程中起着控制作用，促进多肽链走入正确折叠途径。蛋白质的折叠是遵循“热力学假说”的，从高能态向低能态转变，但在这个过程中会受到动力学上的控制，热力学控制与动力学控制在蛋白质多肽链的折叠反应中是统一的，不同的蛋白质的折叠过程中所体现出来的二者所起作用大小可能有所不同[16]。

6.3蛋白质折叠与分子伴侣

蛋白质分子的三维结构，除了共价的肽键和二硫键，还靠大量极其复杂的弱次级键共同作用。因此新生肽段在一边合成一边折叠过程中有可能暂时形成在最终成熟蛋白中不存在不该有的结构，他们常常是一些疏水表面，它们之间很可能发生本不应该有的错误的相互作用而形成的非功能的分子，甚至造成分子的聚集和沉淀。按照自组装学说，每一步折叠都是正确的，充分的，必要的。实际上折叠过程是一个正确途径和错误途径相互竞争的过程，为了提高蛋白质生物合成的效率的，应该有帮助正确途径的竞争机制，分子伴侣就是这样通过进化应运而生的。它们的功能是识别新生肽段折叠过程中暂时暴露的错误结构的，与之结合，生成复和物，从而防止这些表面之间过早的相互作用，阻止不正确的非功能的折叠途径，抑制不可逆聚合物产生，这样必然促进折叠向正确方向进行。

分子伴侣的研究有利于蛋白质折叠机理的探索。其研究成果必然会大大加深我们对生命现象的认识，同时也一定会增加我们与自然斗争的能力和自身生存的能力。由于分子伴侣在生命活动的各个层次都具有重要作用，它的突变和损伤也必定会引起疾病，因此可以期望运用分子伴侣的知识来治疗所谓的“分子伴侣病”。另一方面，利用对分子伴侣的研究成果从根本上提高基因工程和蛋白工程的成功率，也必将对大幅度提高人类生活水平起重要作用。

前景展望

根据预测蛋白质结构大概有2000种不同的折叠类型，3000－5000 蛋白质超家族，当前仅发现1000余种不同的折叠类型和1600种蛋白质超家族。人类基因组测序研究揭示，人体大约有3万个编码蛋白质的基因，这就是说，人类生命过程中大约需要3万种不同的基础蛋白质，它们在生命活动中发挥着重要功能，而这些功能的发挥

则依赖于这些蛋白质的三维结构。因此，获得这些蛋白质并阐明它们的精细三维结构及与其生物功能的关系，成为揭示生物体活动本质的关键一步。近年来基因组工程的迅猛发展及生物信息学的新进展，给结构生物学开创了道路，使此目标的实现成为可能。

随着人类基因组计划的执行，找到人类5万到10万个基因的碱基序列是指日可待的事，因而确定人的上千万个原癌基因和几万个与疾病有关基因表达产物的氨基酸顺序也会逐渐实现。然而要了解它们的功能还必须知道它们的三维结构，且药物设计、基因芯片均需要知道三维结构。当前，虽然众多技术为蛋白质空间结构测定提供了有效的实验手段，但蛋白质三维结构的增长速度远远小于蛋白质序列的增长速度，并且这些方法仍然存在局限性。于是要求现代生物信息学工作者运用数学物理思想、方法和计算手段进一步研究分子生物机理，使人类更准确地掌握蛋白质结构知识，从而促进生物学、医学、药学等生命科学领域的发展。

对蛋白质结构的研究是蛋白质研究中的核心内容之一，虽然它还处于一个初级发展阶段，其研究方法和系统还不够完善，但随着其不断深入发展，相信在揭示诸如生长、发育和代谢调控等生命活动规律上将会有所突破。蛋白质结构研究将为从细胞和分子水平上探讨人类重大疾病的机制、诊断、防治和新药开发提供重要的理论基础从而使蛋白质科学研究达到一个新的高度。

参考文献

[1] 李光地，陆长德，金哲元. 蛋白质结构研究方法进展[Z].江南大学图书馆情报部，2006，3 (2)：45~47.

[2] 阎隆飞，孙之荣.蛋白质分子结构[M].清华大学出版社, 1997，25（8）: 131~154.

[3] 余亦华.蛋白质三维空间结构研究的里程碑[J].科学，2003，55(2)：57~58.

[4] 王大能，陈勇，隋森芳.电子显微学在结构生物学研究中的新进展[J].电子显微学报，2003，22(5)：449~456.

[5] T. J. Hubbard, B. Ailey, S. E. Brenner, A. G. Murzin and C. Chothia. SCOP: A structural classification of proteins database[J]. Nucleic Acids Research, 1999, 27(1) : 254~256.

[6] L. Holm and C. Sander. Protein structure comparison by alignment of distance matrices[J] . Journal of Molecular Biology, 1993, 23(3): 123~138.

[7] C. A.Orengo, A. D. Michie, S. Jones, D. T. Jones, M. B.Swindells and J. M. Thornton. CATH-

a hierarchic classification of protein domain structures[J].Structure, 1997, 5(8) : 1093~1108.

[8] 王勇.基于神经网络的蛋白质结构预测与分类[D].中国科学院，2005，37(5)：59~62.

[9] 坎普，T. 乔里- 帕帕多普洛. 蛋白质结构分析、制备、鉴定与微量测序[M].科学出版社，2000，3(15)：197~210.

[10] W. R. Taylor, C. A. Orengo. Protein structure alignment [J].Mol. Biol, 1989, 20(8): 18~22.

[11] 阎隆飞，孙文荣.蛋白质分子结构[ M].清华大学出版社，1997，8(23)：111~130.

[12]倪红，王翼飞，史定华.遗传算法在蛋白质结构预测中的应用[D].上海大学学报(自然科学版)，2001，7（3）：225~228.

[13] 贾孟文，罗辽复，刘次全.蛋白质的二级结构和mRNA的二级结构的相关性研究[D].内蒙古大学学报(自然科学版)，2004，35(1)：94~98.

[14] Anfinsen.C.B. Principles that govern the folding of the protein chains[J]. Science. 1973, 181(4096): 223~227.

[15] 黄星，卢滇楠，闫明等.蛋白质体外折叠技术研究现状与展望[M].化工进展，2002，21（12）：125~127.

[16]曾岚，徐晋麟.大规模蛋白质功能预测方法的进展[ J] .生命的化学，2005，25(1)：4~7.

致谢

时光飞快，转眼间三年已过，马上就要离开了这个美丽的校园，心中的不舍难以言表。生活在这里的日子是我有生以来最难以忘怀的时光，感谢这里的每一寸土地，感谢我敬爱的老师、同学，感谢在学校的点点滴滴的回忆。在完成论文之际，我想向曾经给过我帮助和支持的人们表示衷心的感谢。

首先要感谢我的指导老师和在我毕业设计中给过我帮助的所有老师。他们在学习和设计方面给了我大量的指导，并为我们提供了良好的学习实验环境，让我学到了知识，掌握了科研方法，也获得了实践锻炼的机会。他们严谨治学的态度、对我的严格要求以及为人处事的坦荡将使我终身受益。除此之外，他们对我生活的关心和照顾也使我得以顺利地完成了学业。在此祝愿他们身体健康，全家幸福！

然后要感谢我的宿舍同学，她们是我学习和生活上的伙伴，也是我面对困难和挑战似的战友。从她们身上，我学到很多东西，和她们在一起的日子是我非常快乐的时光。

最后，衷心感谢我的家人，我的家人在20多年来对我的无微不至的照顾和关怀成为我克服困难、不断向前的强大动力，感谢我的父母给我提供了良好的教育环境，我永远爱他们。

蛋白质的二级结构

蛋白质的结构具有多种结构层次，包括一级结构和空间结构，空间结构又称为构象。空间结构包括二级结构、三级结构和四级结构。在二级与三级之间还存在超二级结构和结蛋白质的二级结构构型：指一个不对称的化合物中不对称中心上的几个原子或基团的空间排布方式。如单糖的α-、β-构型，氨基酸的D-、L-构型。当从一种构型转换成另一种构型的时候，会牵涉及共价键的形成或破坏。构象：指一个分子结构中的一切原子绕共价单键旋转时产生的不同空间排列方式。一种构象变成另一种构象不涉及共价键的形成或破坏。蛋白质的二级结构蛋白质的二级(Secondary)结构是指多肽链的主链本身在空间的排列、或规则的几何走向、旋转及折叠。它只涉及肽链主链的构象及链内或链间形成的氢键。氢键是稳定二级结构的主要作用力。主要有α-螺旋、β-折叠、β-转角、自由回转。二面角的概念蛋白质中非键合原子之间的最小接触距离(A) 1.3 蛋白质的结构（1）肽链空间构象的基本结构单位为肽平面或肽单位。肽平面是指肽链中从一个Cα原子到另一个Cα原子之间的结构，共包含6个原子（Cα、C、O、N、H、 Cα），它们在空间共处于同一个平面。（2）肽键上的原子呈反式构型 C=O与N-H p204 （3）肽键C-N键长0.132nm,比一般的C-N单键(0.147nm)短，比C=N双键(0.128nm)要长，具有部分双键的性质，不能旋转。（二）蛋白质的构象蛋白质多肽链空间折叠的限制因素：Pauling和Corey在利用X-射线衍射技术研究多肽链结构时发现： 1.肽键具有部分双键性质： 2.肽键不能自由旋转 3.组成肽键的四个原子和与之相连的两个α碳原子（Cα）都处于同一个平面内，此刚性结构的平面叫肽平面（peptide plane）或酰胺平面（amide plane）。 4.二面角所决定的构象能否存在，主要取决于两个相邻肽单位中，非键合原子之间的接近有无阻碍。 1.α-螺旋及结构特点p207 螺旋的结构通常用“S N”来表示，S表示螺旋每旋转一圈所含的残基数，N表示形成氢键的C=O与H-N原子之间在主链上包含的原子数。又称为3.613螺旋，Φ= -57。，Ψ= -47。结构要点： 1.多肽链中的各个肽平面围绕同一轴旋转，形成螺旋结构，螺旋一周，沿轴上升的距离即螺距为0.54nm,含 3.6个氨基酸残基；两个氨基酸之间的距离为0.15nm; 2.肽链内形成氢键，氢键的取向几乎与轴平行，每个氨基酸残基的C=O氧与其后第四个氨基酸残基的N-H氢形成氢键。 3.蛋白质中的α-螺旋几乎都是右手螺旋。无规卷曲或自由回转（nonregular coil） p212 了解指无一定规律的松散盘曲的肽链结构。酶的功能部位常包含此构象，灵活易变。纤维状蛋白 (了解) 纤维状蛋白质(fibrous protein)广泛地分布于脊椎和无脊椎动物体内，它是动物体的基本支架和外表保护成分，占脊椎动物体内蛋白质总量的一半或一半以上。这类蛋白质外形呈纤维状或细棒状，分子轴比(长轴／短轴)大于10(小于10的为球状蛋白质)。分子是有规则的线型结构，这与其多肽链的有规则二级结构有关，而有规则的线型二级结构是它们的氨基酸顺序的规则性反映。纤维状蛋白质的类型(了解) 纤维状蛋白质可分为不溶性(硬蛋白)和可溶性两类，前者有角蛋白、胶原蛋白和弹性蛋白等；后者有肌球蛋白和纤维蛋白原等，但不包括微管(microtubule)和肌动蛋白细丝(actin filament)，它们是球状蛋白质的长向聚集体(aggregate)。角蛋白 Keratin(了解) 角蛋白广泛存在于动物的皮肤及皮肤的衍生物，如毛发、甲、角、鳞和羽等，属于结构蛋白。角蛋白中主要的是α-角蛋白。 α-角蛋白主要由α-螺旋构象的多肽链组成。一般是由三条右手α-螺旋肽链形成一个原纤维（向左缠绕），原纤维的肽链之间有二硫键交联以维持其稳定性例如毛的纤维是由多个原纤维平行排列，并由氢键和二硫键作为交联键将它们聚集成不溶性的蛋白质。 α-角蛋白的伸缩性能很好，当α-角蛋白被过度拉伸时，则氢键被破坏而不能复原。此时α-角蛋白转变成β-折叠结构，称为β-角蛋白。毛发的结构(了解)

蛋白质结构分析原理及工具-文献综述

蛋白质结构分析原理及工具（南京农业大学生命科学学院生命基地111班）摘要：本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具，系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举，并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。关键词：蛋白质；结构预测；跨膜域；保守结构域 1 蛋白质相似性检测蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源，它们通常具有相似的功能；由基因复制而来的序列称为旁系同源，它们通常有不同的功能[1]。因此，推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。表一常用蛋白质数据库网址可能有更新氨基酸替代模型。进化过程中，一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH，它们使用了Smith-Waterman 算法。全局联配工具有FASTA和GGSEARCH，基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树，这里不阐述。表二列举了常用的成对序列相似性比对搜索工具

以多种蛋白为例阐述蛋白质结构与功能的关系

举例说明蛋白质结构和功能的关系答： 1.蛋白质的一级结构与功能的关系蛋白质的一级机构指：肽链中氨基酸残基（包括二硫键的位置）的排列顺序。一级结构是蛋白质空间机构的基础，包含分子所有的信息，且决定蛋白质高级结构与功能。 ①一级结构的变异与分子病蛋白质一级结构是空间结构的基础，与蛋白质的功能密切相关，一级机构的改变，往往引起蛋白质功能的改变。例如：镰刀形细胞贫血病镰刀形细胞贫血病的血红蛋白（HbS）与正常人的血红蛋白（HbA）相比，发现，两种血红蛋白的差异仅仅来源于一个肽段的位置发生了变化，这个差异肽段是位于β链N端的一个八肽。在这个八肽中，β链N端第6位氨基酸发生了置换，HbA中的带电荷的谷氨酸残基在HbS中被置换成了非极性缬氨酸残基，即蛋白质的一级机构发生了变化。 ②序列的同源性不同生物中执行相同或相似功能的蛋白质称为同源蛋白质，同源蛋白质的一级机构具有相似性，称为序列的同源性。最为典型的例子，例如：细胞色素C（Cyt c） Cyt c是古老的蛋白质，是线粒体电子传递链中的组分，存在于从细菌到人的所有需氧生物中。通过比较Cyt c的序列可以反映不同种属生物的进化关系。亲缘越近的物种，Cyt c中氨基酸残基的差异越小。如人与黑猩猩的Cyt c完全一致，人与绵羊的Cyt c有10个残基不同，与植物之间相差更多。蛋白质的进化反映了生物的进化。 2.蛋白质空间结构与功能的关系天然状态下，蛋白质的多肽链紧密折叠形成蛋白质特定的空间结构，称为蛋白质的天然构象或三维构象。三维构象与蛋白质的功能密切相关。 ①一级结构与高级结构的关系：一级结构决定高级机构，当特定构象存在时，蛋白质表现出生物功能；当特定构象被破坏时，即使一级构象没有发生改变，蛋白质的生物学活性丧失。例如：牛胰核糖核苷酸酶A（RNase A）的变性与复性当RNase A处于天然构象是，具有催化活性；当RNase A处于去折叠状态时，二硫键被还原不具有催化活性；当RNase A恢复天然构象时，二硫键重新形成，活性恢复。 ②变构效应变构效应：是寡聚蛋白质分子中亚基之间存在相互作用，这种相互作用通过亚基构象的改变来实现。蛋白质在执行功能是时，构象发生一定变化。例如：肌红蛋白、血红蛋白与氧的结合两种蛋白质有很多相同之处，结构相似表现出相似功能。这两钟蛋白质都含有血红素辅基，都能与氧进行可逆结合，因此存在着氧合与脱氧的两种结构形式。但是肌红蛋白几乎在任何氧分压情况下都保持对氧分子的高亲和性。血红蛋白则不同，在氧分压较高时，血红蛋白几乎被氧完全饱和；而在氧分压较低时，血红蛋白与氧的亲和力降低，释放出携带的氧并转移给肌红蛋白。

蛋白质中二硫键的定位及其质谱分析解析

第２０卷第６期２００８年６月化学进展ＰＲＯＧＲＥＳＳＩＮＣＨＥＭＩＳＴＲＹＶ０１．２０Ｎｏ．６Ｊｕｎｅ，２００８蛋白质中二硫键的定位及其质谱分析＊仇晓燕１’２崔勐１（１．中国科学院长春应用化学研究所长春质谱中心刘志强１刘淑莹Ｈ‘ 长春１３００２２；２．中国科学院研究生院北京１０００３９）摘要二硫键是一种常见的蛋白质翻译后修饰，对稳定蛋白质的空间结构，保持及调节其生物活性有

着非常重要的作用。因此，确定二硫键在蛋白质中的位置是全面了解含二硫键蛋白化学结构的重要方面。在众多实验方法中，现代质谱技术因其操作简单、快速、灵敏等优点而成为分析二硫键的重要手段。本文介绍了目前主要的定位二硫键的方法以及质谱在二硫键定位分析中的应用与进展。关键词二硫键定位质谱串联质谱三羧乙基膦稳定同位素标记中图分类号：０６５７．６３；Ｑ５１文献标识码：Ａ文章编号：１００５．２８１Ｘ（２００８）０６．０９７５—０９ＰｒｏｔｅｉｎＤｉｓｕｌｆｉｄｅＢｏｎｄＤｅｔｅｒｍｉｎａｔｉｏｎａｎｄＩｔｓＡｎａｌｙｓｉｓｂｙＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙＱｉｕＸｉａｏｙａｎｌ＇２ＣｕｉＭｅｎ９１Ｌｉｕ劢ｉｑｉａｎ９１ＬｉｕＳｈｕ乒ｎ９１‘‘ （１．ＣｈａｎｇｃｈｕｎＣｅｎｔｅｒｏｆＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ，ＣｈａｎｇｃｈｕｎＩｎｓｔｉｔｕｔｅｏｆＡｐｐｌｉｅｄＣｈｅｍｉｓｔｒｙ，ＣｈｉｎｅｓｅＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓ，Ｃｈａｎｇｃｈｕｎ１３００２２，Ｃｈｉｎａ；２．ＧｒａｄｕａｔｅＳｃｈｏｏｌｏｆｔｈｅＣｈｉｎｅｓｅＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓ，Ｂｅｉｊｉｎｇ１０００３９，Ｃｈｉｎａ）ＡｂｓｔｒａｃｔＤｉｓｕｌｆｉｄｅｂｏｎｄｓ

蛋白质结构预测和序列分析软件

蛋白质结构预测和序列分析软件 2010-05-08 20:40 转载自布丁布果最终编辑布丁布果 4月18日蛋白质数据库及蛋白质序列分析第一节、蛋白质数据库介绍一、蛋白质一级数据库 1、 SWISS-PROT 数据库 SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据库，目前这二个数据库在EMBL和GenBank数据库上均建立了镜像 (mirror) 站点。 SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序列，这些序列经过检验和注释。该数据库主要由日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护。SWISS-PROT 的序列数量呈直线增长。2、TrEMBL数据库： SWISS-PROT的数据存在一个滞后问题，即把EMBL的DNA序列准确地翻译成蛋白质序列并进行注释需要时间。一大批含有开放阅读框(ORF) 的DNA序列尚未列入SWISS-PROT。为了解决这一问题，TrEMBL(Translated EMBL) 数据库被建立了起来。TrEMBL也是一个蛋白质数据库，它包括了所有EMBL库中的蛋白质编码区序列，提供了一个非常全面的蛋白质序列数据源，但这势必导致其注释质量的下降。 3、PIR数据库： PIR数据库的数据最初是由美国国家生物医学研究基金会（National Biomedical Research Foundation, NBRF）收集的蛋白质序列，主要翻译自GenBank的DNA序列。 1988年，美国的NBRF、日本的JIPID（the Japanese International Protein Sequence Database 日本国家蛋白质信息数据库）、德国的MIPS（Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息中心）合作，共同收集和维护PIR数据库。PIR根据注释程度(质量)分为4个等级。4、 ExPASy数据库：目前，瑞士生物信息学研究所（Swiss Institute of Bioinformatics, SIB）创建了蛋白质分析专家系统（Expert protein analysis system, ExPASy ）。涵盖了上述所有的数据库。网址：https://www.doczj.com/doc/c71923507.html, 我国的北京大学生物信息中心(https://www.doczj.com/doc/c71923507.html,) 设立了ExPASy的镜像（Mirror）。主要蛋白质序列数据库的网址 SWISS-PROT https://www.doczj.com/doc/c71923507.html,/sprot 或 https://www.doczj.com/doc/c71923507.html,/expasy_urls.html TrEMBL https://www.doczj.com/doc/c71923507.html,/sprot PIR https://www.doczj.com/doc/c71923507.html,/pirwww MIPS——Munich Information Centre for Protein Sequences http://mips.gsf.de/ JIPID——the Japanese International Protein Sequence Database 已经和PIR合并 ExPASy https://www.doczj.com/doc/c71923507.html, 二、蛋白质结构数据库 1、PDB数据库：

蛋白质结构预测在线软件

蛋白质预测在线分析常用软件推荐蛋白质预测分析网址集锦物理性质预测： Compute PI/MW http://expaxy.hcuge.ch/ch2d/pi-tool.html Peptidemasshttp://expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp://https://www.doczj.com/doc/c71923507.html,/pub/fasta/ SAPS http://ulrec3.unil.ch/software/SAPS_form.html 基于组成的蛋白质识别预测 AACompIdent http://expaxy.hcuge.ch ... htmlAACompSim http://expaxy.hcuge.ch/ch2d/aacsim.html PROPSEARCH http://www.e mbl-heidelberg.de/prs.html 二级结构和折叠类预测 nnpredict https://www.doczj.com/doc/c71923507.html,/~nomi/nnpredict Predictprotein http://www.embl-heidel ... protein/SOPMA http://www.ibcp.fr/predict.html SSPRED http://www.embl-heidel ... prd_info.html 特殊结构或结构预测 COILS http://ulrec3.unil.ch/ ... ILS_form.html MacStripe https://www.doczj.com/doc/c71923507.html,/ ... acstripe.html 与核酸序列一样，蛋白质序列的检索往往是进行相关分析的第一步，由于数据库和网络技校术的发展，蛋白序列的检索是十分方便，将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。由NCBI检索蛋白质序列可联网到：“http://www.ncbi.nlm.ni ... gi?db=protein”进行检索。利用SRS系统从EMBL检索蛋白质序列联网到：https://www.doczj.com/doc/c71923507.html,/”，可利用EMBL的SRS系统进行蛋白质序列的检索。通过EMAIL进行序列检索当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时，可采用EMAIL方式进行序列检索。蛋白质基本性质分析蛋白质序列的基本性质分析是蛋白质序列分析的基本方面，一般包括蛋白质的氨基酸组成，分子质量，等电点，亲水性，和疏水性、信号肽，跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如，疏水性图谱可通知来预测跨膜螺旋。同时，也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标（其中最典型的

2-蛋白质结构与功能

蛋白质结构与功能一级要求单选题 1 组成蛋白质的氨基酸基本上有多少种 A 300 B 30 C 20 D 10 E 5 C 2 蛋白质元素组成的特点是含有的16%相对恒定量的是什么元素 A C B N C H D O E S B 3 组成蛋白质的氨基酸之间分子结构的不同在于其 A Cα B Cα-H C Cα-COOH D Cα-R E Cα-NH2 D 4 氨基酸的平均分子量是 A 1000 B 500 C 110 D 100 E 80 C 5 组成蛋白质的酸性氨基酸有几种 A 2 B 3 C 5 D 10 E 20 A 6 组成蛋白质的碱性氨基酸有几种 A 2 B 3 C 5 D 10 E 20 B 7 组成蛋白质中的含巯基氨基酸是 A 酪氨酸 B 缬氨酸 C 谷氨酸 D 胱氨酸 E 半胱氨酸 E 8 蛋白质分子中属于亚氨基酸的是 A 脯氨酸 B 甘氨酸 C 丙氨酸 D 组氨酸 E 天冬氨酸 A 9 组成蛋白质的氨基酸在自然界存在什么差异 A 种族差异 B 个体差异 C 组织差异 D 器官差异 E 无差异 E 10 体内蛋白质分子中的胱氨酸是由什么氨基酸转变生成 A 谷氨酸 B 精氨酸 C 组氨酸 D 半胱氨酸 E 丙氨酸 D 11 精氨酸与赖氨酸属于哪一类氨基酸 A 酸性 B 碱性 C 中性极性 D 中性非极性 E 芳香族 B 12 下列那种氨基酸无遗传密码子编码 A 谷氨酰氨 B 天冬酰胺 C 对羟苯丙氨酸 D 异亮氨酸 E 羟脯氨酸 E 13 氨基酸间脱水的产物首先产生小分子化合物为 A 蛋白质 B 肽 C 核酸 D 多糖 E 脂肪 B 14 人体内的肽大多是 A 开链 B 环状 C 分支 D 多末端 E 单末端链,余为环状 A 15 谷胱甘肽是由几个氨基酸残基组成的小肽 A 2 B 3 C 9 D 10 E 39 B 16 氨基酸排列顺序属于蛋白质的几级结构

蛋白质结构预测和序列分析软件

蛋白质结构预测和序列分析软件蛋白质数据库及蛋白质序列分析第一节、蛋白质数据库介绍一、蛋白质一级数据库 1、 SWISS-PROT 数据库 SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据库，目前这二个数据库在EMBL和GenBank数据库上均建立了镜像 (mirror) 站点。 SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序列，这些序列经过检验和注释。该数据库主要由日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护。SWISS-PROT的序列数量呈直线增长。 2、TrEMBL数据库： SWISS-PROT的数据存在一个滞后问题，即进行注释需要时间。一大批含有开放阅读了解决这一问题，TrEMBL(Translated E 白质数据库，它包括了所有EMBL库中的质序列数据源，但这势必导致其注释质量 3、PIR数据库： PIR数据库的数据最初是由美国国家生物医学研究基金会（National Biomedical Research Foundation, NBRF）收集的蛋白质序列，主要翻译自GenBank的DNA序列。 1988年，美国的NBRF、日本的JIPID（the Japanese International Protein Sequence Database日本国家蛋白质信息数据库）、德国的MIPS（Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息中心）合作，共同收集和维护PIR数据库。PIR根据注释程度(质量)分为4个等级。 4、 ExPASy数据库：目前，瑞士生物信息学研究所（Swiss I 质分析专家系统（Expert protein anal 据库。网址：https://www.doczj.com/doc/c71923507.html, 我国的北京大学生物信息中心(www.cbi.

蛋白质的二级结构主要有哪些类型

1.蛋白质的二级结构主要有哪些类型，其特点如何？答：α-右手螺旋，β-折叠，无规卷曲，U型回折（β-转角） <1>α-右手螺旋 α-螺旋为右手螺旋，每一圈含有3.6个aa残基（或肽平面），每一圈高5.4?，即每一个aa 残基上升1.5?，旋转了100度，直径为5 ?，2个二面角（ф,ψ）＝（-570，-480）。维持α-右手螺旋的力量是螺旋内氢键，它产生于一个肽平面的C=O与相邻一圈的在空间上邻近的另一个肽平面的N-H之间，它的方向平行于螺旋轴，每个氢键串起的长度为3.6个肽平面或3.6个aa残基，被氢键串起来的这个环上含有13个原子，故α-右手螺旋也被称为 3.613螺旋。Pro破坏α-螺旋。 <2>β-折叠肽链在空间的走向为锯齿折叠状，二面角（ф,ψ）＝（-119℃，+113℃）。维持β-折叠的力量是折叠间的氢键，它产生于一个肽平面的C=O与相邻肽链的在空间上邻近的另一个肽平面的N-H之间，两条肽链上的肽平面互相平行，有平行式和反平行式两种， <3>U型回折：也叫β-转角，肽链在某处回折1800所形成的结构。这个结构包括的长度为 4个aa残基，其中的第三个为Gly，稳定该结构的力量是第一和第四个aa残基之间形成的氢键。 <4>无规卷曲：无固定的走向，但也不是任意变动的，它的2个二面角（ф,ψ）有个变化范围。论述 04 蛋白质简述蛋白质一级结构的分析方法。第一步：前期准备，第二步：肽链的端点测定，第三步：每条肽链aa顺序的测定，第四步：二硫键位置的确定。 <1>第一步：前期准备分离纯化蛋白质：纯度要达到97％以上。蛋白质分子量的测定：用于判断分子的大小，估计肽链的数目，有渗透压法、凝胶电泳法（聚丙烯酰胺、SDS）、凝胶过滤法、超离心法等 aa组成的测定：用于最后核对，氨基酸自动分析仪。肽链拆分：非共价键的如氢键、离子键、疏水键、范德华力4种，可用尿素或盐酸胍等有机溶液来拆分。共价键的仅二硫键1种，可用巯基乙醇、碘代乙酸、过甲酸来拆分。 <2>第二步：肽链的端点测定 N端测定：Sanger法，DNFB→DNP-肽→水解→乙醚萃取→层析鉴定。 Edman法，PITC→PTC-肽→PTH-aa→层析鉴定。 C端测定：肼解法。 <3>第三步：每条肽链aa顺序的测定事先要将蛋白质打断成多肽甚至寡肽，再上机分析，而且要2套以上，便于以后拼接。常用的工具酶和特异性试剂有：胰蛋白酶：－（Arg、Lys）↓－。产物为C端Arg、Lys的肽链。糜蛋白酶：表示为－（Trp、Tyr、Phe）↓－。 CNBr：－Met↓－。 <4>第四步：二硫键位置的确定包括链内和链间二硫键的位置，用对角线电泳来测，这项工作在AA序测定完毕后进行。在肽链未拆分的情况下用胃蛋白酶水解之，可以得到被二硫键连着的多肽产物。先进行第一向电泳，将产物分开。再用巯基乙醇处理，将二硫键打断。最后进行第二向电泳，条件与第一向电泳完全相同。选取偏离对角线的样品（多肽或寡肽），它们就是含二硫键的片段，上机测aa顺序，根据已测出的蛋白质的aa顺序，把这些片段进行定位，就能找到二硫键的位置。

第1章蛋白质结构与功能习题

第二章蛋白质的结构与功能复习测试（一）名词解释 1. 肽键 2. 结构域 3. 蛋白质的等电点 4. 蛋白质的沉淀 5. 蛋白质的凝固（二）选择题 A型题： 1. 天然蛋白质中不存在的氨基酸是： A. 胱氨酸 B. 谷氨酸 C. 瓜氨酸 D. 蛋氨酸 E. 丝氨酸 2. 下列哪种氨基酸为非编码氨基酸： A. 半胱氨酸 B. 组氨酸 C. 鸟氨酸 D. 丝氨酸 E. 亮氨酸 3. 下列氨基酸中哪种氨基酸无 L型与D型氨基酸之分： A. 丙氨酸 B. 甘氨酸 C. 亮氨酸 D. 丝氨酸 E. 缬氨酸 4. 天然蛋白质中有遗传密码的氨基酸有： A. 8种 B. 61种 C. 12种 D. 20种 E. 64种 5. 测定100克生物样品中氮含量是2克，该样品中蛋白质含量大约为： A. 6.25% B. 12.5% C. 1% D. 2% E. 20% 6. 蛋白质分子中的肽键： A. 是一个氨基酸的α-氨基和另一个氨基酸的α-羧基形成的 B. 是由谷氨酸的γ-羧基与另一个氨基酸的α-氨基形成的 C. 氨基酸的各种氨基和各种羧基均可形成肽键 D. 是由赖氨酸的ε-氨基与另一分子氨基酸的α-羧基形成的 E. 以上都不是 7. 多肽链中主链骨架的组成是 A. –CNCCNCNCCNCNCCNC- B. –CCHNOCCHNOCCHNOC- C. –CCONHCCONHCCONHC- D. -CCNOHCCNOHCCNOHC- E. -CCHNOCCHNOCCHNOC- 8. 蛋白质的一级结构是指下面的哪一种情况： A. 氨基酸种类的数量 B. 分子中的各种化学键 C. 多肽链的形态和大小 D. 氨基酸残基的排列顺序 E. 分子中的共价键 9. 维持蛋白质分子一级结构的主要化学键是： A. 盐键 B. 氢键 C. 疏水键 D. 二硫键 E. 肽键 10. 蛋白质分子中α-螺旋构象的特点是： A. 肽键平面充分伸展 B. 靠盐键维持稳定 C. 螺旋方向与长轴垂直 D. 多为左手螺旋 E. 以上都不是 11. 下列哪种结构不属于蛋白质二级结构： A. α-螺旋 B. 双螺旋 C. β-片层 D. β-转角 E. 不规则卷曲

蛋白质的二级结构主要有哪些类型

简述蛋白质一级结构的分析方法。第一步：前期准备，第二步：肽链的端点测定，第三步：每条肽链aa顺序的测定，第四步：二硫键位置的确定。 ●<1>第一步：前期准备 ●分离纯化蛋白质：纯度要达到97％以上。 ●蛋白质分子量的测定：用于判断分子的大小，估计肽链的数目，有渗透压法、凝胶电泳法（聚丙烯酰胺、SDS）、凝胶过滤法、超离心法等 ●aa组成的测定：用于最后核对，氨基酸自动分析仪。 ●肽链拆分：非共价键的如氢键、离子键、疏水键、范德华力4种，可用尿素或盐酸胍等有机溶液来拆分。共价键的仅二硫键1种，可用巯基乙醇、碘代乙酸、过甲酸来拆分。 ●<2>第二步：肽链的端点测定 ●N端测定：Sanger法，DNFB→DNP-肽→水解→乙醚萃取→层析鉴定。 ●Edman法，PITC→PTC-肽→PTH-aa→层析鉴定。 ●C端测定：肼解法。 ●<3>第三步：每条肽链aa顺序的测定事先要将蛋白质打断成多肽甚至寡肽，再上机分析，而且要2套以上，便于以后拼接。 ●常用的工具酶和特异性试剂有： ●胰蛋白酶：－（Arg、Lys）↓－。产物为C端Arg、Lys的肽链。 ●糜蛋白酶：表示为－（Trp、Tyr、Phe）↓－。 ●CNBr：－Met↓－。 <4>第四步：二硫键位置的确定包括链内和链间二硫键的位置，用对角线电泳来测，这项工作在AA序测定完毕后进行。在肽链未拆分的情况下用胃蛋白酶水解之，可以得到被二硫键连着的多肽产物。先进行第一向电泳，将产物分开。再用巯基乙醇处理，将二硫键打断。最后进行第二向电泳，条件与第一向电泳完全相同。选取偏离对角线的样品（多肽或寡肽），它们就是含二硫键的片段，上机测aa顺序，根据已测出的蛋白质的aa顺序，把这些片段进行定位，就能找到二硫键的位置。

蛋白质结构预测在线软件

蛋白质预测分析网址集锦? 物理性质预测：? Compute PI/MW?? ?? SAPS?? 基于组成的蛋白质识别预测? AACompIdent???PROPSEARCH?? 二级结构和折叠类预测? nnpredict?? Predictprotein??? SSPRED?? 特殊结构或结构预测? COILS?? MacStripe?? 与核酸序列一样，蛋白质序列的检索往往是进行相关分析的第一步，由于数据库和网络技校术的发展，蛋白序列的检索是十分方便，将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。? 由NCBI检索蛋白质序列? 可联网到：“”进行检索。? 利用SRS系统从EMBL检索蛋白质序列? 联网到：”，可利用EMBL的SRS系统进行蛋白质序列的检索。? 通过EMAIL进行序列检索?

当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时，可采用EMAIL方式进行序列检索。? 蛋白质基本性质分析? 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面，一般包括蛋白质的氨基酸组成，分子质量，等电点，亲水性，和疏水性、信号肽，跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如，疏水性图谱可通知来预测跨膜螺旋。同时，也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标（其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。? 疏水性分析? 位于ExPASy的ProtScale程序（?）可被用来计算蛋白质的疏水性图谱。该网站充许用户计算蛋白质的50余种不同属性，并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。需要调整的只是计算窗口的大小（n）该参数用于估计每种氨基酸残基的平均显示尺度。? 进行蛋白质的亲/疏水性分析时，也可用一些windows下的软件如，bioedit,dnamana等。? 跨膜区分析? 有多种预测跨膜螺旋的方法，最简单的是直接，观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域，但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知

蛋白质结构预测方法综述

蛋白质结构预测方法综述卜东波陈翔王志勇《计算机不能做什么？》是一本好书，其中文版序言也堪称佳构。在这篇十余页的短文中，马希文教授总结了使用计算机解决实际问题的三步曲，即首先进行形式化，将领域相关的实际问题抽象转化成一个数学问题；然后分析问题的可计算性；最后进行算法设计，分析算法的时间和空间复杂度，寻找最优算法。蛋白质空间结构预测是很有生物学意义的问题，迄今亦有很多的工作。有意思的是，其中一些典型工作恰恰是上述三步曲的绝好示例，本文即沿着这一路线作一总结，介绍于后。 1 背景知识生物细胞种有许多蛋白质（由20余种氨基酸所形成的长链），这些大分子对于完成生物功能是至关重要的。蛋白质的空间结构往往决定了其功能，因此，如何揭示蛋白质的结构是非常重要的工作。生物学界常常将蛋白质的结构分为4个层次：一级结构，也就是组成蛋白质的氨基酸序列；二级结构，即骨架原子间的相互作用形成的局部结构，比如alpha螺旋,beta片层和loop区等；三级结构，即二级结构在更大范围内的堆积形成的空间结构；四级结构主要描述不同亚基之间的相互作用。经过多年努力，结构测定的实验方法得到了很好的发展，比较常用的有核磁共振和X光晶体衍射两种。然而由于实验测定比较耗时和昂贵，对于某些不易结晶的蛋白质来说不适用。相比之下，测定蛋白质氨基酸序列则比较容易。因此如果能够从一级序列推断出空间结构则是非常有意义的工作。这也就是下面的蛋白质折叠问题： 1蛋白质折叠问题（Protein Folding Problem）输入: 蛋白质的氨基酸序列

输出: 蛋白质的空间结构蛋白质结构预测的可行性是有坚实依据的。因为一般而言，蛋白质的空间结构是由其一级结构确定的。生化实验表明：如果在体外无任何其他物质存在的条件下，使得蛋白质去折叠，然后复性，蛋白质将立刻重新折叠回原来的空间结构，整个过程在不到1秒种内即可完成。因此有理由认为对于大部分蛋白质而言，其空间结构信息已经完全蕴涵于氨基酸序列中。从物理学的角度讲，系统的稳定状态通常是能量最小的状态，这也是蛋白质预测工作的理论基础。 2 蛋白质结构预测方法蛋白质结构预测的方法可以分为三种：同源性（Homology ）方法：这类方法的理论依据是如果两个蛋白质的序列比较相似，则其结构也有很大可能比较相似。有工作表明，如果序列相似性高于75％，则可以使用这种方法进行粗略的预测。这类方法的优点是准确度高，缺点是只能处理和模板库中蛋白质序列相似性较高的情况。从头计算（Ab initio ）方法：这类方法的依据是热力学理论，即求蛋白质能量最小的状态。生物学家和物理学家等认为从原理上讲这是影响蛋白质结构的本质因素。然而由于巨大的计算量，这种方法并不实用，目前只能计算几个氨基酸形成的结构。IBM 开发的Blue Gene 超级计算机，就是要解决这个问题。穿线法(Threading )方法：由于Ab Initio 方法目前只有理论上的意义，Homology 方法受限于待求蛋白质必需和已知模板库中某个蛋白质有较高的序列相似性，对于其他大部分蛋白质来说，有必要寻求新的方法。Threading 就此应运而生。以上三种方法中，Ab Initio 方法不依赖于已知结构，其余两种则需要已知结构的协助。通常将蛋白质序列和其真实三级结构组织成模板库，待预测三级结构的蛋白质序列，则称之为查询序列(query sequence)。 3 蛋白质结构预测的Threading 方法 Threading 方法有三个代表性的工作：Eisenburg 基于环境串的工作、Xu Ying 的Prospetor 和Xu Jinbo 、Li Ming 的RAPTOR 。 Threading 的方法：首先取出一条模版和查询序列作序列比对(Alignment)，并将模版蛋白质与查询序列匹配上的残基的空间坐标赋给查询序列上相应的残基。比对的过程是在我们设计的一个能量函数指导下进行的。根据比对结果和得到的查询序列的空间坐标，通过我们设计的能量函数，得到一个能量值。将这个操作应用到所有的模版上，取能量值最低的那条模版产生的查询序列的空间坐标为我们的预测结果。需要指出的是，此处的能量函数却不再是热力学意义上的能量函数。它实质上是概率的负对数，即，我们用统计意义上的能量来代替真实的分子能量，这两者有大致相同的形式。 p E log ?=如果沿着马希文教授的观点看上述工作，则更有意思：Eisenburg 指出如果仅仅停留在简单地使用每个原子的空间坐标(x,y,z)来形式化表示蛋白质空间结构，则难以进一步深入研究。Eisenburg 创造性地使用环境串表示结构，从而将结构预测问题转化成序列串和环境串之间的比对问题；其后，Xu Ying 作了进一步发展，将蛋白质序列表示成一系列核（core ）组成的序列，Core 和Core 之间存在相互作用。因此结构就表示成Core 的空间坐标，以及Core 之间的相互作用。在这种表示方法的基础上，Xu Ying 开发了一种求最优匹配的动态规划算法，得到了很好的结果。但是由于其较高的复杂度，在Prospetor2上不得不作了一些简化；Xu Jinbo 和Li Ming 很漂亮地解决了这个问题，将求最优匹配的过程表示成一个整数规划问题，并且证明了一些常用

蛋白质的结构和功能

第二讲蛋白质的结构与功能(第二部份) Lecture 2 Structure and Function of Protein (Part II) (续) 2.5 升降β-筒（Up and Down β-barrel）相邻及平行的β-链间以发卡连接形成升降形式的筒形结构。β-链间连接的β-转角常是底物结合位点（图34~35）。图34 大豆胰蛋白酶抑制剂中的升降β-筒 Fig 34 The Up and Down β-barrel in Soybean Trypsin Inhibitor 图35 视黄醇结合蛋白中的升降β-筒 Fig 35 The Up and Down β-barrel in Retinol Binding Protein 2.6 β-三叶草折叠（β Trefoil Folds） “β-三叶草折叠”是β-折叠链盘绕形成近似的具有三重对称轴的“三叶草”样结构（图36）。图36 刺酮胰蛋白酶抑制剂中的β-三叶草折叠 Fig 36 The β Trefoil Fold in Erythrina Trypsin Inhibitor 2.7 β-螺旋（β Helix）由β-折叠链盘绕形成“螺旋”样结构，比较少见（图37）。

图37 果胶酸脂裂解酶C中的β-螺旋 Fig 37 The β Helix in Pectate Lyase C 3. 全α拓扑结构(All α Topologies) 此类拓扑结构全部由α-螺旋构成。α-螺旋常呈反平行排列或垂直连接。前述“EF手型模体”、“螺旋-转角-螺旋模体”、“同源结构域模体”以及“亮氨酸拉链模体”均属于此类拓扑结构。 3.1 升降螺旋束（Up and Down Helix Bundle）相邻反向排列的αα模体首尾相连，每个螺旋向左倾斜18°，形成左手扭曲的筒形螺旋束。最常见的是4螺旋束，形成两层结合（图38~41）。图38 细胞色素b562中的升降螺旋束 Fig 38 The Up and Down Helix Bundle in Cytochrome b562 图39 铁蛋白中的升降螺旋束 Fig 39 The Up and Down Helix Bundle in Ferritin

蛋白质结构预测

实习 5 ：蛋白质结构预测学号20090***** 姓名****** 专业年级生命生技**** 实验时间2012.6.21 提交报告时间2012.6.21 实验目的： 1.学会使用GOR和HNN方法预测蛋白质二级结构 2.学会使用SWISS-MODEL进行蛋白质高级结构预测实验内容： 1.分别用GOR和HNN方法预测蛋白质序列的二级结构，并对比异同性。 2.利用SWISS-MODEL进行蛋白质的三级结构预测，并对预测结果进行解释。作业： 1. 搜索一条你感兴趣的蛋白质序列，分别用GOR和HNN进行二级结构预测，解释预测结果，分析两个方法结果有何异同。答：所选用蛋白质序列为>>gi|390408302|gb|AFL70986.1| gag protein, partial [Human immunodeficiency virus] （1）GOR预测结果：图1 图1是每个氨基酸在序列中所处的状态，可以看出序列的二级结构预测结果为： 1到9位个氨基酸为无规卷曲，10到33位氨基酸为α螺旋,34到37位为β折叠，38到45位为无规卷曲，46到49位为α螺旋，50到53位为无规卷曲，54到65为α螺旋，66到72位为无规卷曲，73到95位为α螺旋，96到101位为无规卷曲，102到108为β折叠，109到115位为无规卷曲，117位为β折叠。图2 图2为各种结构在序列中所占的比例，其中Alpha helix占53.85%，Extended strand占11.11%，Random coil占35.04%，无他二级结构。

图3 图3为各个氨基酸在序列中的状态以及二级结构在全序列中二级结构分布情况。（2）HNN预测：图4 图4是每个氨基酸在序列中所处的状态，可以看出序列的二级结构预测结果为： 1到6位个氨基酸为无规卷曲，7到34位氨基酸为α螺旋,35到37位为β折叠，38位为α螺旋，39到44位为无规卷曲，45到49位为α螺旋，50到55位为无规卷曲，56到65为α螺旋，66到71位为无规卷曲，72到83位为α螺旋，84到86位为无规卷曲，87到95位为α螺旋，96到102为无规卷曲，103到108位为β折叠，108到117位为无规卷曲。图5 图5为各种结构在序列中所占的比例，其中Alpha helix占55.56%，Extended strand占7.69%，Random coil占36.75%，无他二级结构。

蛋白结构分析和比较

蛋白结构分析和比较姓名学号日期年月日阅读分子月报科普短文，参阅相关文献，从蛋白质结构数据库下载以下蛋白质三维结构原子坐标文件，利用显示观察，说明其结构特点。猪胰岛素(): 由几个亚基组成，每个亚基有几条多肽链，每条多肽链由哪些二级结构单元组成；每条多肽链有几对链内二硫键，多肽链之间由几对二硫键连接；每个亚基如何与锌原子结合。抹香鲸肌红蛋白(): 由几股螺旋组成；与血色素卟啉环中央铁原子以配位健结合的是哪个组氨酸，该组氨酸位于第几股螺旋；与血色素携带的氧分子通过氢键连接的是哪个组氨酸，该组氨酸位于第几股螺旋。小鼠免疫球蛋白(): 由几个亚基组成，每个亚基各有几个结构域；两条重链之间由几对二硫键连接，重链和轻链之间由几对二硫键连接；每个结构域内部的二硫键和色氨酸如何形成疏水内核；多糖链对稳定分子结构的作用。水母（）绿色荧光蛋白(): 选择原始文件中二聚体链，保存为单个亚基; 打开，并用不同颜色显示二级结构折叠; 找出分子内部发光基团并说明其发光机理。核小体(): 用不同颜色显示组蛋白个亚基；观察分子碱基配对特点；显示组蛋白表面与相互作用的碱性氨基酸。斑头雁和灰雁血红蛋白比较实例从数据库中提取斑头雁和灰雁血红蛋白亚基序列，进行序列比对，找出差异位点。用软件中选择并保存灰雁氧合血红蛋白中四个亚基中的链链两个亚基。用结构叠合方法分析比较灰雁氧合血红蛋白链链两个亚基与斑头雁血红蛋白两个亚基的结构，计算基于碳叠合后的均方根误差（）。找出斑头雁血红蛋白链第位丙氨酸侧链碳原子和链位亮氨酸侧链末端两个碳原子和，分别测量和、之间的距离。找出灰雁血红蛋白链第位脯氨酸侧链碳原子和链位亮氨酸侧链末端两个碳原子和，分别测量和、之间的距离。根据上述分析结果，参阅相关文献，说明斑头雁和灰雁血红蛋白侧链大小和柔性不同，如何影响其构象变化，从而进一步引起氧气结合能力的变化。利用模拟突变的方法，将灰雁血红蛋白链第位脯氨酸突变成丙氨酸，测量突变后的和、之间的距离。课题相关蛋白质结构分析在蛋白质结构数据库中下载课题相关或分子月报中你最感兴趣的蛋白质分子，用显示其结构。该蛋白质有几个亚基，其二级结构是否含有螺旋和折叠。该蛋白质是否含二硫键，其配对方式如何。

蛋白结构分析和比较

蛋白结构分析和比较姓名________ 学号______________ 日期________年___月___日阅读分子月报科普短文，参阅相关文献，从蛋白质结构数据库下载以下蛋白质三维结构原子坐标文件，利用Swiss-PdbViewer显示观察，说明其结构特点。猪胰岛素(4INS): 由几个亚基组成，每个亚基有几条多肽链，每条多肽链由哪些二级结构单元组成；每条多肽链有几对链内二硫键，多肽链之间由几对二硫键连接；每个亚基如何与锌原子结合。抹香鲸肌红蛋白(1MBO): 由几股alpha螺旋组成；与血色素卟啉环中央铁原子以配位健结合的是哪个组氨酸，该组氨酸位于第几股alpha 螺旋；与血色素携带的氧分子通过氢键连接的是哪个组氨酸，该组氨酸位于第几股alpha螺旋。小鼠免疫球蛋白(1IGT): 由几个亚基组成，每个亚基各有几个结构域；两条重链之间由几对二硫键连接，重链和轻链之间由几对二硫键连接；每个结构域内部的二硫键和色氨酸如何形成疏水内核；多糖链对稳定分子结构的作用。水母（Jellyfish）绿色荧光蛋白(1GFL): 选择PDB原始文件中二聚体A链，保存为单个亚基1GFLa.pdb; 打开1GFLa.pdb，并用不同颜色显示二级结构beta折叠; 找出分子内部发光基团Ser65-Tyr66-Gly67并说明其发光机理。核小体(1AOI): 用不同颜色显示组蛋白8个亚基；观察DNA分子碱基配对特点；显示组蛋白表面与DNA相互作用的碱性氨基酸。斑头雁和灰雁血红蛋白比较实例从UniProt数据库中提取斑头雁和灰雁血红蛋白alpha亚基序列，进行序列比对，找出差异位点。用SwissPDB-Viwer软件中选择并保存灰雁氧合血红蛋白1FAW中四个亚基中的A链B 链两个亚基。用结构叠合方法分析比较灰雁氧合血红蛋白A链B链两个亚基与斑头雁血红蛋白1A4F 两个亚基的结构，计算基于alpha碳叠合后的均方根误差（RMSD）。找出斑头雁血红蛋白A链第119位丙氨酸侧链beta碳原子CB和B链55位亮氨酸侧链末端两个碳原子CD1和CD2，分别测量A119CB和B55CD1、B55CD2之间的距离。找出灰雁血红蛋白A链第119位脯氨酸侧链gamma碳原子CG和B链55位亮氨酸侧链末端两个碳原子CD1和CD2，分别测量A119CG和B55CD1、B55CD2之间的距离。根据上述分析结果，参阅相关文献，说明斑头雁和灰雁血红蛋白A119侧链大小和柔性不同，如何影响其构象变化，从而进一步引起氧气结合能力的变化。利用模拟突变的方法，将灰雁血红蛋白A链第119位脯氨酸突变成丙氨酸，测量突变后的A119CB和B55CD1、B55CD2之间的距离。课题相关蛋白质结构分析

文档之家

蛋白质结构研究现状与展望

蛋白质的二级结构

蛋白质结构分析原理及工具-文献综述

以多种蛋白为例阐述蛋白质结构与功能的关系

蛋白质中二硫键的定位及其质谱分析解析

蛋白质结构预测和序列分析软件

蛋白质结构预测在线软件

2-蛋白质结构与功能

蛋白质结构预测和序列分析软件

蛋白质的二级结构主要有哪些类型

第1章 蛋白质结构与功能习题

蛋白质的二级结构主要有哪些类型

蛋白质结构预测在线软件

蛋白质结构预测方法综述

蛋白质的结构和功能

蛋白质结构预测

蛋白结构分析和比较

蛋白结构分析和比较

第1章蛋白质结构与功能习题