基于蛋白质相互作用界面的比对算法研究
- 格式:doc
- 大小:24.00 KB
- 文档页数:4
蛋白质间相互作用研究的方法和技术蛋白质是生命体中最重要的分子之一,它们在细胞内扮演着各种重要的生物学角色,包括信号传导、结构支撑、运输和催化等。
蛋白质的功能主要通过它们的结构和相互作用来实现。
因此,了解蛋白质间相互作用的研究方法和技术对于理解生命体系中的复杂过程至关重要。
蛋白质-蛋白质相互作用的类型和标准方法蛋白质间相互作用可以大致分为两类:非共价相互作用和共价相互作用。
前者包括氢键、疏水作用、离子键等;后者主要包括二硫键。
了解这些不同种类的相互作用的方式,是了解蛋白质结构和功能的基础。
因此,研究这些相互作用的方法和技术是非常必要的。
在研究蛋白质-蛋白质相互作用的方法中,目前最常用的方法是表面等离子体共振(SPR)和交联质谱(XL-MS)技术。
SPR技术基于蛋白质与配体之间的结合,可以实时监测蛋白质-蛋白质复合物的形成。
该技术通过测量蛋白质与配体之间的反应率来确定它们之间的结合强度和动力学参数。
与SPR技术相比,XL-MS技术更加直接和精确。
该技术通过将蛋白质交联,然后将其裂解并用于质谱分析来确定相互作用的位点和强度。
与其他方法相比,这种方法有一个很大的优点,即不需要事先知道被测蛋白质之间的相互作用通路,因为它可以同时检测多种相互作用。
细胞表面展示技术的应用细胞表面展示技术是一种新兴的技术,它允许将蛋白质展示在细胞表面上,从而实现了高通量筛选和发现新的蛋白质-蛋白质相互作用。
这个技术实现方式可以通过基因工程手段,将目标蛋白质的一个表面区域作为 "派对 "的地方,展示在基因改造的细胞表面上,从而诱使其他蛋白质与它相互作用。
通过这种方式,可以在筛选大规模基因库或鉴定蛋白质并行结构时有效地发掘新的蛋白质-蛋白质相互作用。
结论在生命体系中,蛋白质-蛋白质相互作用是如何实现功能的重要机制。
研究蛋白质间相互作用的方法和技术不仅有助于我们理解生命体系中动态和复杂的过程,还有助于我们发现新的药物和治疗方法。
蛋白质相互作用预测的算法研究关键信息项1、研究目的2、研究方法3、数据来源4、算法评估指标5、研究进度安排6、研究成果归属7、保密条款8、违约责任9、协议变更与终止10、争议解决方式1、研究目的11 本研究旨在开发和优化一种准确、高效的蛋白质相互作用预测算法,以增进对生物体内蛋白质功能和细胞过程的理解。
2、研究方法21 采用多种数据挖掘技术,包括但不限于机器学习算法、深度学习模型等。
22 整合多种数据源,如蛋白质结构数据、基因表达数据、蛋白质序列信息等。
23 运用特征工程方法,提取与蛋白质相互作用相关的关键特征。
3、数据来源31 公共数据库,如 UniProt、PDB 等。
32 实验室内部积累的实验数据。
4、算法评估指标41 准确率(Accuracy):正确预测的相互作用数量与总预测数量的比例。
42 召回率(Recall):正确预测的真实相互作用数量与实际存在的相互作用数量的比例。
43 F1 值:综合考虑准确率和召回率的评估指标。
44 马修斯相关系数(Matthews Correlation Coefficient,MCC):用于衡量二分类问题的预测效果。
5、研究进度安排51 第一阶段(时间区间 1):完成数据收集和预处理工作。
511 确定所需数据的范围和类型。
512 从各种数据源获取数据,并进行清洗、整合和标准化。
52 第二阶段(时间区间 2):算法设计与开发。
521 选择合适的算法模型,并进行初步的参数调整。
522 进行模型训练和验证。
53 第三阶段(时间区间 3):算法优化与评估。
531 根据评估结果对算法进行优化。
532 重复进行评估,直到达到预期的性能指标。
54 第四阶段(时间区间 4):撰写研究报告和论文。
6、研究成果归属61 研究过程中产生的所有知识产权归研究团队共同所有。
62 研究成果的发表应以合作的形式进行,各方应共同协商确定发表的期刊和会议。
7、保密条款71 双方应对在研究过程中获取的未公开数据和信息予以保密。
举世瞩目的基因组计划使大量的新基因不断被发现,然而单纯的基组DNA序列尚不能解答许多生命问题。
基因是相对静态的,而基因编码的产物-蛋白质则是动态的,具有时空性和调节性,是生物功能的主要体现者和执行者。
蛋白质的表达水平、存在方式以及相互作用等直接与生物功能相关。
在所有生命活动中,蛋白质之间的相互作用是必不可少的,它是细胞进行一切代谢活动的基础。
细胞接受外源或是内源的信号,通过其特有的信号途径,调节其基因的表达,以保持其生物学特性。
在这个过程中,蛋白质占有很重要的地位,它可以调控,介导细胞的许多生物学活性。
虽然有一些蛋白质可以以单体的形式发挥作用,但是大部分的蛋白质都是和伴侣分子一起作用或是与其他蛋白质形成复合物来发挥作用的。
因此,为了更好地理解细胞的生物学活性,必须很好地理解蛋白质单体和复合物的功能,这就会涉及到蛋白质相互作用的研究。
在现代分子生物学中,蛋白质相互作用的研究占有非常重要的地位。
因此,揭示蛋白质之间的相互作用关系、建立相互作用关系的网络图,已成为蛋白质组学研究中的热点。
一、生物物理学方法1. 融合蛋白pull-down实验融合蛋白pull-down技术基本原理是将一种蛋白质固定于某种基质上(如Sepharose),当细胞抽提液经过该基质时,可与该固定蛋白相互作用的配体蛋白被吸附,而没有被吸附的“杂质”则随洗脱液流出。
被吸附的蛋白可以通过改变洗脱液或洗脱条件而回收下来。
为了更有效地利用pull-down技术,可以将待纯化地蛋白以融合蛋白地形式表达,即将“诱饵”蛋白与一种易于纯化地配体蛋白相融合。
1988年Smith等利用谷胱甘肽-S-转移酶(glutathione-S-transferase ,GST)融合标签从细菌中一步纯化出GST融合蛋白。
从此GST融合蛋白在蛋白质相互作用研究领域里得到了极大的推广。
GST融合蛋白在经过固定有GST(glutathione)的色谱柱时,就可以通过GST与GSH的相互作用而被吸附。
生物信息学中的蛋白质序列比对算法研究在生物学研究中,蛋白质序列比对是一种重要的技术手段,用于分析和理解蛋白质的结构和功能。
蛋白质序列比对算法旨在寻找两个或多个蛋白质序列之间的相似性关系和差异性。
基于这些比对结果,我们可以推断蛋白质的功能、亲缘关系以及进化历史等信息。
本文将介绍几种常用的蛋白质序列比对算法,并讨论它们在生物信息学中的应用。
一、序列比对的重要性蛋白质序列比对为我们理解蛋白质的结构和功能提供了基础。
蛋白质是生物体内最为重要的大分子,其功能与结构紧密相关。
通过比对蛋白质序列,我们可以推断其可能的功能和结构特征。
而蛋白质序列的比对不仅可以研究同一物种的不同蛋白质,还可以比较不同物种之间的蛋白质,从而推断它们之间的进化关系。
二、常用的蛋白质序列比对算法1. Smith-Waterman算法Smith-Waterman算法是一种动态规划算法,用于比对两个蛋白质序列或核酸序列。
该算法通过构建一个得分矩阵来计算序列的相似性。
在得分矩阵中,每个单元格代表两个相应序列位置之间的最佳得分。
最终根据最高得分确定比对的起始位置,从而得到最优的比对结果。
Smith-Waterman算法适用于比对相对较短的序列,但对于大规模比对问题计算复杂度较高。
2. Needleman-Wunsch算法Needleman-Wunsch算法也是一种动态规划算法,用于全局比对两个蛋白质序列或核酸序列。
与Smith-Waterman算法不同的是,Needleman-Wunsch算法通过引入罚分来惩罚不匹配的碱基或氨基酸,以确定最佳比对结果。
这个算法适用于比对相对较长的序列,但也面临计算复杂度较高的问题。
3. BLAST算法BLAST(Basic Local Alignment Search Tool)算法是一种快速比对算法,广泛应用于生物信息学领域。
BLAST算法采用启发式搜索策略,通过预先建立一个库,将待比对序列与库中的序列进行比对。
检测两种蛋白质之间相互作用的实验方法比较蛋白质相互作用是生物学研究中的重要课题,对于理解细胞生物过程以及疾病的发病机制具有重要意义。
目前已经开发出多种实验方法用于检测蛋白质相互作用,其中最常用的方法包括:免疫共沉淀、双杂交、表面等离子共振、斑点免疫印迹、荧光共振能量转移(FRET)和生物传感等。
下面将对这些方法进行比较。
免疫共沉淀是一种利用抗体特异性识别蛋白质相互作用的方法。
通过特异性抗体与检测蛋白质结合,将目标蛋白质及其相互作用的蛋白质一起通过沉淀进行分离和检测。
这种方法常用于检测蛋白质复合物,缺点是需要高质量的抗体,抗体的选择和结合效率对结果的可靠性有较大的影响。
双杂交是一种检测蛋白质相互作用的基因工程方法。
该方法利用两个蛋白质的相互作用引起的转录活性调控来筛选蛋白质相互作用。
该方法的优点在于操作简单,筛选速度较快,但是可能存在假阳性结果以及对蛋白质的折叠状态和后转录修改对结果的影响。
表面等离子共振是一种通过测量光敏感表面上的变化来检测蛋白质相互作用的方法。
该方法通过共振的光波与蛋白质结合引起的表面层折射率变化来测量蛋白质的结合动力学参数。
该方法的优点在于实时、直接、无标记以及高灵敏度。
斑点免疫印迹是一种检测蛋白质相互作用的方法,该方法通过将蛋白质分离电泳然后向膜转移,并使用特异性抗体来探测蛋白质的相互作用。
该方法的优点包括操作简单,对蛋白质的结构没有要求,但是这种方法不能提供定量信息。
荧光共振能量转移(FRET)是一种检测蛋白质相互作用的方法,该方法通过基于荧光分子之间的非辐射能量转移来测量蛋白质的相互作用。
该方法对于分子间距离和颗粒之间的角度较敏感。
FRET要求有适当的选择标记的蛋白质,并能够量化蛋白质的相互作用。
生物传感是一种检测蛋白质相互作用的方法,该方法通过表面增强拉曼散射(SERS)或增强荧光技术来获得蛋白质的信号。
该方法对于小样本和灵敏度要求较高的蛋白质相互作用研究具有优势,但需要专门的实验条件和设备。
研究蛋白质与蛋白质相互作用方法总结-实验步骤蛋白质与蛋白质之间相互作用构成了细胞生化反应网络的一个主要组成部分,蛋白-蛋白互作网络与转录调控网络对调控细胞及其信号有重要意义。
把原来spaces空间上的一篇蛋白质与蛋白质间相互作用研究方法转来,算就是实验技巧分类目录的首篇。
(另补充2:检测两种蛋白质之间相互作用的实验方法比较)一、酵母双杂交系统酵母双杂交系统就是当前广泛用于蛋白质相互作用组学研究的一种重要方法。
其原理就是当靶蛋白与诱饵蛋白特异结合后,诱饵蛋白结合于报道基因的启动子,启动报道基因在酵母细胞内的表达,如果检测到报道基因的表达产物,则说明两者之间有相互作用,反之则两者之间没有相互作用。
将这种技术微量化、阵列化后则可用于大规模蛋白质之间相互作用的研究。
在实际工作中,人们根据需要发展了单杂交系统、三杂交系统与反向杂交系统等。
Angermayr等设计了一个SOS蛋白介导的双杂交系统。
可以研究膜蛋白的功能,丰富了酵母双杂交系统的功能。
此外,酵母双杂交系统的作用也已扩展至对蛋白质的鉴定。
二、噬茵体展示技术在编码噬菌体外壳蛋白基因上连接一单克隆抗体的DNA序列,当噬菌体生长时,表面就表达出相应的单抗,再将噬菌体过柱,柱上若含目的蛋白,就会与相应抗体特异性结合,这被称为噬菌体展示技术。
此技术也主要用于研究蛋白质之间的相互作用,不仅有高通量及简便的特点,还具有直接得到基因、高选择性的筛选复杂混合物、在筛选过程中通过适当改变条件可以直接评价相互结合的特异性等优点。
目前,用优化的噬菌体展示技术,已经展示了人与鼠的两种特殊细胞系的cDNA文库,并分离出了人上皮生长因子信号传导途径中的信号分子。
三、等离子共振技术表面等离子共振技术(Surface Plasmon Resonance,SPR)已成为蛋白质相互作用研究中的新手段。
它的原理就是利用一种纳米级的薄膜吸附上“诱饵蛋白”,当待测蛋白与诱饵蛋白结合后,薄膜的共振性质会发生改变,通过检测便可知这两种蛋白的结合情况。
蛋白质相互作用研究方法蛋白质是生命现象和功能特性的物质基础,其参与有机物的催化和调节,并在信号传递、细胞空间组织和免疫反应等方面发挥着关键的重要作用。
因此,对蛋白质相互作用的研究非常重要,其研究方法也正得到学界的广泛关注。
蛋白质相互作用研究方法主要有生物信息学分析、生物实验室技术分析和分子生物学技术分析三种。
一、生物信息学分析生物信息学分析是一种快速、准确、易操作的理论研究手段,可用于探索蛋白质之间的相互作用关系。
它主要由群体数据分析、序列比对、序列特征分析、结构预测和功能预测五部分组成,可以通过计算机的技术手段实现上述五项内容的研究工作,为深入探索蛋白质相互作用奠定基础。
二、生物实验室技术分析生物实验室技术分析是实验室分析技术,也称为检测技术。
它是利用特定的实验试剂,通过专用仪器和具体的实验步骤,进行蛋白质结构与功能的检测研究,其常用的技术分析包括:离子液体层析技术(HPLC)、电泳定位技术(2DE)、蛋白质质谱技术(MS)、生物复制技术(PCR)等。
三、分子生物学技术分析分子生物学技术分析是指将生物学结构和作用机制与具体的实验技术相结合,使用分子生物学方法研究蛋白质相互作用的研究方法。
其常用的技术分析有:蛋白质结合黄金标准法(GBP)、蛋白质结合免疫锁定法(IP)、转录激活蛋白质结合法(TAP)、蛋白质结合基因组测序(ChIP-sequencing)等。
蛋白质相互作用研究是一项系统性的研究,不仅需要有效的实验技术手段,而且需要理论分析手段,才能得出准确的结论。
目前,随着生物技术的发展,蛋白质相互作用研究方法也在不断创新发展,也有助于解决生物学谜题。
未来,蛋白质相互作用研究方法将会得到进一步完善,并应用到蛋白质在基因表达、调控、信号传递、免疫等领域的研究中,从而使我们更深入地了解蛋白质的相互作用以及其在生命现象和功能特性中的角色。
蛋白质相互作用的研究方法摘要过去15年来,蛋白质组学得到迅速发展,蛋白质间的相互作用作为蛋白质组学的重要内容,更是成为国内外竞相研究的重点,研究方法的快速发展为蛋白质间相互作用的研究奠定了坚实基础。
本文综述了当前研究蛋白质相互作用的主要技术方法,包括酵母双杂交技术,GST pull-down技术,免疫共沉淀技术和串联亲和纯化技术等多种研究方法,总结了各种研究方法的原理及应用。
关键词:蛋白质,相互作用,研究方法1 酵母双杂交技术(two hybrid system)1.1基本原理真核生物细胞转录激活因子一般都含有2个不同的结构域: DNA结合结构域(DNA-bindingdomain, BD)和DNA转录激活结构域(transcription activation domain, AD)。
这两个结构域相互独立但功能上又相互依赖,它们之间只有通过某种方式结合在一起才具有完整的转录激活因子的活性。
将拟研究的编码“猎物”蛋白的基因与AD序列结合,编码“诱饵”蛋白的基因与BD序列结合,形成两段融合基因,并在同一菌株核内表达,若“诱饵”蛋白与“猎物”蛋白在核内存在相互作用,就可以重新形成完整的有活性的转录因子,从而激活报告基因的转录。
因此根据报告基因的表达与否,即可判断“诱饵”蛋白与“猎物”蛋白之间是否具有相互作用。
1.2应用 Hurst等利用酵母双杂交的方法研究与乳腺癌转移抑制因子1(BRMS1)的相互作用蛋白,得到此蛋白为Hsp90伴侣蛋白。
Reddi等利用酵母双杂交系统研究肝炎B病毒反式作用因子HBx蛋白的自我偶联作用,结果发现HBx蛋白在分子环境中可以通过其碳末端区域产生自我偶联作用。
酵母双杂交技术也应用于大规模蛋白质相互作用网络的研究,Lim 等人利用此技术鉴定了770多个可能相互作用的蛋白,有75对蛋白质产生相互作用,其中有83%相互作用的蛋白质在哺乳动物细胞中得到验证。
1.3优点在检测蛋白质之间相互作用方面,酵母双杂交系统具有非常高的灵敏度,尤其对蛋白质间微弱的、瞬间的作用也能够通过报告基因的表达产物敏感地检测到。
蛋白质结构预测算法比较分析蛋白质是生物体中最重要的分子之一,它们在细胞功能和生化过程中扮演着关键的角色。
蛋白质的结构即其三维空间构象,对其功能和相互作用具有决定性的影响。
然而,通过实验手段确定蛋白质结构的过程耗时且昂贵,因此发展蛋白质结构预测算法具有重要的理论和实践意义。
本篇文章将对目前常见的蛋白质结构预测算法进行比较分析,以期为科学家们选择合适的算法提供参考。
一、基于比对的方法比对是一种常见的蛋白质结构预测方法,通过将待预测的蛋白质序列与已知结构的蛋白质序列进行比对,从而预测其结构。
这种方法的基本原理是假设相似的序列具有相似的结构。
比对方法主要有两种:序列比对和结构比对。
1. 序列比对方法:序列比对方法基于已知蛋白质序列与待预测序列之间的相似性,通过查找数据库中已知结构和目标序列在相似区域的拓扑关系,预测目标蛋白质的结构。
其中,PSI-BLAST和HHpred是常用的序列比对算法。
PSI-BLAST通过迭代搜索蛋白质数据库中相似的序列,然后通过对齐和比对预测目标蛋白质的结构。
HHpred则通过比对目标蛋白质的序列和数据库中的序列以及结构,预测目标蛋白质的结构。
2. 结构比对方法:结构比对方法基于已知蛋白质结构与待预测结构之间的相似性,通过查找数据库中已知结构与目标蛋白质结构的相似区域以及拓扑结构,预测目标蛋白质的结构。
其中,DALI和TMalign是常用的结构比对算法。
DALI通过比对目标蛋白质的结构和数据库中的结构,预测目标蛋白质的结构。
TMalign则通过比对目标蛋白质的结构和数据库中的结构以及序列之间的相似性,预测目标蛋白质的结构。
二、基于物理力场的方法基于物理力场的方法通过分析蛋白质的氨基酸序列以及不同部分之间的相互作用,利用物理力场的理论计算蛋白质的结构。
这种方法的基本原理是假设蛋白质的结构是最佳的、能量最低的状态。
常用的基于物理力场的方法有:1. 分子力学模拟:分子力学模拟基于牛顿定律和库仑定律,通过计算分子之间的相互作用力来模拟蛋白质结构。
蛋白质相互作用的计算分析方法研究一、引言蛋白质在生物体内发挥着重要的生理功能,而蛋白质相互作用则是其发挥生理功能的基础。
因此,研究蛋白质相互作用的计算分析方法具有重要的意义。
在本文中,我们将着重介绍蛋白质相互作用的计算分析方法。
二、基本概念蛋白质相互作用是指在生物体内发生的一种相互作用,其特点是蛋白质之间通过多种方式相互作用。
它们可以相互识别、相互结合,从而完成生物体内各种生理功能。
蛋白质相互作用的计算分析方法是指利用计算机技术对蛋白质相互作用的特性进行研究。
通过计算蛋白质三维结构和多肽链之间的相互作用力,可以更好地掌握蛋白质的生物学特性。
三、计算分析方法(一)晶体学方法晶体学方法主要是通过X射线晶体学的手段研究蛋白质三维结构,目前已经成为研究蛋白质相互作用力学性质的重要手段。
通过X射线衍射技术,可以获得蛋白质晶体的原子三维坐标,从而得到蛋白质的分子结构,进一步分析研究蛋白质相互作用。
(二)计算机模拟方法计算机模拟方法包括分子动力学模拟和分子对接。
分子动力学模拟模拟蛋白质分子在动态下的构象变化情况,并可预测其相应的力学性质及其相互作用。
分子对接法主要是在蛋白质与作用物之间预测模拟相互作用的方式,不断调整两者之间的构象,来逐步优化相互作用模型。
(三)分子动力学模拟方法分子动力学模拟使用数学模型来描述蛋白质与其环境之间的相互作用,并通过计算机算法执行这些模型。
通过分子动力学模拟手段,可以模拟蛋白质分子的构象变化情况,预测其力学性质和相互作用。
(四)分子对接方法分子对接方法通过计算机模拟的方式,预测蛋白质分子与作用物之间的相互作用力学性质。
分子对接法通过调整蛋白质分子的构象,不断优化蛋白质和分子之间的相互作用力学模型,以达到更准确的计算结果。
四、结论蛋白质相互作用的计算分析方法是一种重要的生物技术研究方法。
通过晶体学方法、计算机模拟方法等手段对蛋白质的分子结构和相互作用进行分析,可以更好地掌握蛋白质在生物体内的功能及其相互作用的机制和本质。
生物体内蛋白质相互作用的研究方法和技术蛋白质是生命体系中最重要的基础元素之一,也是生命体系功能发挥的重要载体。
在生物体内,蛋白质之间相互作用形成复杂的分子网络,调控着生物体内各种生物过程的进行。
因此,研究蛋白质之间相互作用的机制和规律对理解生物体内复杂的分子网络起着重要的作用。
本文将介绍一些生物体内蛋白质相互作用的研究方法和技术。
1. 距离约束光学显微镜(FRET)距离约束光学显微镜(FRET)是一种广泛应用于研究蛋白质之间相互作用的方法。
该方法基于蛋白质相互作用引起的分子间能量转移,通过测量两个染料分子之间的共振能量转移来确定蛋白质分子距离。
在该方法中,将荧光染料分别标记在所研究的两个蛋白质分子上,此时两个荧光染料间的能量传递将引起一个发射峰的强度下降,另一个发射峰的强度增加。
通过测量这两个发射峰之间的比值,就可以确定两个蛋白质分子之间的距离。
2. 亲和层析亲和层析是一种经典的生物化学方法,已被广泛应用于蛋白质相互作用的研究中。
该方法基于蛋白质相互作用的特异性,利用某些亲和剂(例如抗体、其他蛋白质或化合物),使其能够高度特异性地结合到所研究的蛋白质上,并通过与其它无关蛋白质的分离纯化,来寻找目标蛋白质结合的伴侣蛋白质。
这种方法不仅可用于鉴定蛋白质间相互作用,并且也能够鉴定蛋白质的受体和配体,其在药物研发中也具有重要的应用前景。
3. BiFC技术生物荧光互补技术(BiFC)是近年来新发展起来的一种用来研究蛋白质之间相互作用的方法。
该方法利用了荧光蛋白的性质,通过将荧光蛋白的N和C端分别标记在所研究的两个蛋白质上,当这两个蛋白质相互作用时,N和C端荧光蛋白结构的互补性质使得两个半片组合,重新恢复荧光蛋白的单体结构。
这时,只要荧光显微镜就可以直接观察到待研究蛋白质的互补荧光信号。
与其他方法相比,BiFC技术不需要对样品进行固定处理,在非固定活细胞中也可以应用,被广泛采用。
4. 硅基芯片技术硅基芯片技术是一种基于生物识别的方法,利用硅基芯片表面的高通量载体给多个荧光染料分子提供载体标记点,从而通过观察载体点间是否发生融合,来鉴定蛋白质之间的相互作用。
生物信息技术在蛋白质互作网络研究中的蛋白质相互作用分析和复合物预测算法优化及细胞过程模拟效果评估蛋白质相互作用在细胞内的过程中起着关键作用,因此对于蛋白质相互作用的研究具有重要意义。
随着生物信息技术的发展,研究人员开始应用生物信息学方法来分析蛋白质互作网络并预测蛋白质相互作用。
本文将重点介绍生物信息技术在蛋白质相互作用分析和复合物预测算法优化以及细胞过程模拟效果评估方面的应用进展。
蛋白质相互作用网络是由许多蛋白质相互作用关系构成的,可以通过实验方法或计算方法来获取这些关系。
生物信息学方法主要基于计算机模拟来预测和识别蛋白质相互作用。
其中,蛋白质相互作用分析是研究蛋白质间相互作用模式和特性的过程。
蛋白质相互作用的预测包括两个方面,一是预测蛋白质间是否存在相互作用,二是预测相互作用的结构和特性。
首先,蛋白质相互作用分析中的蛋白质相互作用预测算法是关键。
目前,常用的预测算法包括机器学习方法、模板匹配方法和基于结构的方法。
机器学习方法通过分析已知的蛋白质相互作用数据集,学习出一个预测模型,并将该模型应用于新的蛋白质序列来预测相互作用。
模板匹配方法则通过比对蛋白质序列与已知相互作用蛋白质序列的相似性来预测相互作用。
基于结构的方法则通过分析蛋白质的三维结构来预测相互作用,其中包括蛋白质的界面特征、结构域和二级结构等信息。
为了优化蛋白质相互作用的预测算法,研究人员提出了许多改进方法。
例如,引入生物信息学中的深度学习算法,通过构建多层神经网络模型,可以有效地提高蛋白质相互作用的预测准确性。
此外,一些研究还尝试在预测模型中引入多种特征,如结构、进化和功能信息,以提高预测模型的综合性能。
另外,一些研究也关注于利用大规模的实验数据来训练和验证预测模型,以增加数据的可信度和预测模型的准确性。
其次,复合物预测是蛋白质相互作用分析的重要环节之一。
复合物是由多个蛋白质组成的稳定结构单元,它们之间的相互作用形成了复杂的生物过程。
一文搞清蛋白质相互作用的研究方法相当多的蛋白质行使功能的时候并不是单打独斗的,蛋白质们通过蛋白质相互作用形成复合体然后进行工作,在工作的过程中,蛋白质们也可以通过更换相互作用的伙伴,从而改变蛋白质复合体的功能。
因此,研究蛋白质的相互作用成为研究蛋白质功能和作用机制的最为重要的环节之一。
另外,蛋白质相互作用的本质其实是三种力,氢键,分子间作用力(范德华力)和疏水力,因为这三种力的作用距离都非常的短,所以相互作用的蛋白我们通常认为它们必定相互接近,尽管这是个充分非必要命题,但是我们常常使用这个命题的逆命题来进行实验检测。
那么,如何对这个问题进行研究呢?这里狗哥就带大家简单梳理一下常用的蛋白质相互作用的研究方法。
图 1<1>酵母双杂交,Yeasttwo hybrid(Y2H), 这是一个古老的技术,Stanley Fields 和Ok-KyuSong 在1989 年的时候利用大肠杆菌中GAL4 乳糖操纵子的原理,开发出这个方法用于检测蛋白质之间的相互作用。
GAL4 操纵子有两个结构域,BD(binding domain)结构域和AD(activation domain),其中BD 结构域可以结合在UAS (upstreamactivating sequence)DNA 区域,在 AD 结构域可以激活 UAS 下游的基因表达。
因此,他们把 GAL4 的两个结构域切分开,这样,BD 可以与目标蛋白结合,并且先行结合在报告基因lacZ 上游的UAS 区域,接着,把需要检验是否与目标蛋白相互作用的蛋白与AD 结构域融合表达,如果目标蛋白和被检测蛋白可以相互作用,它们必定会在空间上相互接近彼此,这种相互作用可以使得AD 和BD 结构域也在空间上相互接近,这样就可以激活报告基因 lacZ 的表达,使得人们可以检测到,如图 1 所示。
这个方法的优势在于廉价且易操作,这个方法一度非常流行,既可以用于筛选目标基因的相互作用蛋白,也可以用于验证相互作用,以及定量检测相互作用的强度。
基于蛋白质相互作用界面的比对算法研究
摘要:蛋白质相互作用界面是蛋白质相互作用产生的物理载体。
考虑蛋白质相互作用界面间的结构相似性对于研究蛋白质功能,信号传导网络和药物设计具有非常重要的意义,而现有的蛋白质结构比对算法仅适用于蛋白质单体的全局空间结构。
我们给出了基于整数二次规划模型的方法来考虑蛋白质相互作用界面的比对问题,该方法整合了蛋白质序列的进化信息、结构信息,并用进化谱的相似性来对比对上的残基打分以衡量其进化保守性。
通过计算实验,发现进化上和结构上保守的残基有可能就是对于蛋白质结合起重要
作用的残基,即热点。
关键词:蛋白质;相互作用界面比对;热点;整数二次规划
中图分类号:tp301 文献标识码:a 文章编号:1009-3044(2013)14-3410-03
蛋白质经常通过与其它蛋白质相互作用来行使其功能,例如信号传导网络和代谢网络中的蛋白质复合物,而蛋白质相互作用界面是蛋白质相互作用发生的物理载体。
蛋白质相互作用界面(~
1500-3000 ?2)要比蛋白质-配体相互作用界面(~300-1000 ?2)大很多,而且一般不像配体结合位点那样蛋白质表面呈凹槽状,而是平坦的。
实验证明界面上残基的结合能量并不是均匀分布的,而是一些残基的结合能量较大而且仅占界面残基的一小部分,这些对于蛋白质结合起关键作用的残基叫做热点(hot spots)。
丙氨酸扫描变异(alanine scanning mutagenesis)是目前主要的识别热点
的实验方法,其基本原理是把界面上的单个残基替换成丙氨酸,并测得替换以后残基结合能量的变化值。
选择丙氨酸作为替换残基是因为丙氨酸的侧链仅有一个碳原子,并且替换后不改变主链构象,也不会产生很大的静电或者位阻效应。
由于其实验过程较为复杂,目前获得的丙氨酸扫描变异数据很少,主要存放在丙氨酸扫描变异数据库asedb中。
分析发现热点要比蛋白质相互作用界面上的其它残基进化上和结构上保守,并且其在空间结构上聚在一起,周围被一些能量较小的残基包围着。
基于这些特征,我们这里用整数二次规划方法,结合蛋白质的进化和结构信息来对蛋白质相互作用界面进行比对,进而可以用来预测热点。
1 数据获取
首先从丙氨酸扫描变异数据库(asedb)中获取含有丙氨酸扫描变异残基的蛋白质链及相关复合物。
对于一个复合物中不同蛋白质链的两个残基,如果这两个残基的任意两个原子其距离小于两个原子的范德瓦尔半径之和再加上0.5 ?,则这两个残基叫做接触式残基(contact residues),这些接触式残基构成的蛋白质表面被定义为蛋白质相互作用界面。
我们从每组复合物中提取出包含丙氨酸扫描变异残基的蛋白质相互作用界面。
2 蛋白质相互作用界面比对方法
2.2 基于整数二次规划方法的残基网络比对模型
3 蛋白质相互作用界面热点预测方法
4 计算结果
4.1 免疫球蛋白和溶菌酶的相互作用热点预测
4.2 对asedb数据库中蛋白质复合物的热点预测
5 讨论
蛋白质相互作用界面比对对于研究蛋白质相互作用、蛋白质功能非常重要。
现有的蛋白质结构比对算法只适用于研究蛋白质单体的全局空间结构,并不适用于蛋白质相互作用界面。
这里我们将界面比对问题转化为网络比对问题,并结合蛋白质的进化信息和结构信息,用基于整数二次规划模型的方法来有效地找出界面上的进化和结构上都保守的残基,并验证这些残基有可能是热点。
丙氨酸扫描变异数据库asedb 是基于对单个残基替换成丙氨酸
后能量变化的测定,这种实验方法对于组合残基的能量变化并不能有效地确定。
最近丙氨酸切削技术(alanineshaving technologies)可以同时使多个氨基酸变异为丙氨酸,这样对一些单个残基变异能量变化不大但多个残基一块变异则对蛋白质相互作用能量影响较
大的残基组可以有效地识别出来。
这些残基组在进化上和空间结构上可能是保守的,因此我们的预测结果可以进一步作为丙氨酸切削技术的候选残基。
参考文献:
[1] wells j a, mcclendon c l.reaching for high-hanging fruit in drug discovery at proteinprotein interfaces[j]. nature, 2007, 450:1001–1009.
[2] bogan a a, thorn k s. anatomy of hot spots in protein
interfaces[j]. journal of molecular biology, 1998, 280:1-9.
[3] cunningham b c, wells j a. high-resolution epitope mapping of hgh-receptor interaction by alanine-scanning mutagenesis[j].science, 1989, 244:1081-1085.
[4] thorn ks, bogan aa. asedb: a database of alanine mutations and their effects on the free energy of binding in protein interactions[j].bioinformatics, 2001, 17: 284-285.
[5] ma b, elkayam t, wolfson h, et al. protein-protein interactions: structurally conserved residues distinguish between binding sites and exposed protein surfaces[j]. proc. natl. acad. sci. usa, 2003, 100:5772-5777.。