蛋白质组分析word版
- 格式:doc
- 大小:5.09 MB
- 文档页数:14
蛋白质组什么是蛋白质组?蛋白质组(Proteome)是指在特定生物体内或某一特定生物过程中所参与的所有蛋白质的集合。
与基因组类似,蛋白质组也具有复杂性和多样性,涉及到某个生物体或组织中存在的所有蛋白质的种类、数量和功能。
研究蛋白质组可以帮助我们更好地理解生命活动的基本规律以及疾病的发生机制。
蛋白质组研究方法蛋白质组研究涉及到多种方法和技术,以实现对蛋白质组的全面分析和描述。
以下是常用的蛋白质组研究方法:1.二维凝胶电泳(2-DE):通过将样品中的蛋白质进行电泳分离,然后使用染色剂进行染色,最后对结果进行图像分析和识别。
2-DE是一种传统的蛋白质组分析方法,可以提供目标蛋白质的信息。
2.液相色谱质谱联用(LC-MS/MS):液相色谱质谱联用技术结合了液相色谱和质谱技术,可以在蛋白质水平上进行深度分析。
这种方法适用于检测低丰度蛋白质和翻译后修饰,能够更好地揭示蛋白质组的复杂性和多样性。
3.同位素标记定量(Isobaric tags for relative andabsolute quantitation,iTRAQ):iTRAQ是一种用于定量蛋白质组的技术,它通过将不同样品中的蛋白质使用不同的同位素标记,并将它们混合在一起进行质谱分析,从而实现定量。
4.蛋白质芯片技术:蛋白质芯片技术是一种高通量的蛋白质组研究方法,可以同时检测成千上万个蛋白质。
它通过固相化学方法将蛋白质捕获在特定位置上,然后使用荧光或质谱方法进行检测。
蛋白质组在科学研究中的应用蛋白质组学研究可以广泛应用于医学、生物学、药物研发等领域,对于认识生物体内蛋白质的种类和功能,以及它们在生理和病理状态下的变化具有重要意义。
1.药物研发:通过研究蛋白质组可以更好地了解疾病的发生机制,从而寻找新的药物靶点和开发治疗手段。
蛋白质组学的应用在药物研发中扮演着重要的角色。
2.疾病诊断和治疗:研究蛋白质组可以帮助鉴定出特定疾病的生物标记物,从而提高疾病的早期检测和诊断的准确性。
7 蛋白质序列分析与功能预测 (1)7.1 引言 (1)7.2 功能描述 (2)7.2.1 基因本体 (3)7.2.2 利用GO术语的功能注释 (7)7.3 基于序列相似性的功能预测 (8)7.3.1 基本预测方法 (10)7.3.2 分析与讨论 (14)7.3.3 蛋白质家族与序列的相似性聚类 (15)7.4 基于蛋白质信号的功能预测 (17)7.4.1 蛋白质信号 (17)7.4.2 信号的描述 (22)7.4.3 蛋白质模体、结构域和家族数据库 (28)7.4.4 分析与讨论 (34)7.5 基于蛋白质序列特征的功能预测 (35)7.5.1 序列的理化性质 (35)7.5.2 跨膜与卷曲螺旋分析 (37)7.5.3 蛋白质翻译后修饰分析 (40)7.5.4 亚细胞定位预测 (42)7.5.5 基于序列特征的蛋白质分子功能预测 (44)7.6 功能预测的其他思路 (45)参考书目 (47)7 蛋白质序列分析与功能预测DNA经常被比喻为构筑生命的蓝图,相应地,蛋白质就是构筑生命体最主要的材料。
蛋白质在生命过程中发挥着巨大的作用,它们执行着大部分生物功能。
这些功能包括结构功能(如细胞骨架中的肌动蛋白)、酶功能(很多蛋白质可以催化生物反应,常见的蛋白质催化功能是使生物反应加速一定数量级),以及在细胞内或细胞间转运物质的功能。
大量序列被测定带给了生物信息学家一个挑战,那就是如何从这些序列中找到基因,然后给基因加上注释,即给这些基因提供关于它们性质或功能的简单描述。
7.1 引言继基因组结构注释(genome structural annotation)完成后,阐明基因组所表达的全部蛋白质的表达规律和生物功能,称为功能注释(functional annotation),成为研究的热点,是基因组注释(genome annotation)的重要组成部分。
据Friedberg I称,2006年时,GeneBack中约有~40%的序列被标注为“unknown function”。
一、引言随着生物技术的飞速发展,蛋白组学作为研究蛋白质表达和功能的重要手段,在生命科学领域扮演着越来越重要的角色。
本报告旨在通过对某特定样本的蛋白组数据进行分析,揭示其蛋白质表达谱的变化,为后续的生物学研究和疾病诊断提供数据支持。
二、研究背景本研究选取了某疾病模型组和正常对照组的样本,通过蛋白组学技术获取了两组样本的蛋白质表达谱。
通过对这些数据进行深入分析,旨在揭示疾病状态下蛋白质表达的变化规律,为疾病的发生机制研究提供线索。
三、实验方法1. 样本采集与处理:采集疾病模型组和正常对照组的样本,经过适当处理和裂解,获得蛋白质提取物。
2. 蛋白组学技术:采用蛋白质组学技术(如二维电泳、质谱等)对蛋白质提取物进行分离和鉴定。
3. 数据采集:通过蛋白质组学技术获得的数据,包括蛋白质点、分子量、等电点等。
4. 数据分析:采用生物信息学方法对蛋白质组数据进行处理和分析,包括蛋白质点检测、蛋白质鉴定、差异表达分析等。
四、结果与分析1. 蛋白质点检测:通过对实验数据的处理,成功检测到数千个蛋白质点,覆盖了蛋白质组的多个功能类别。
2. 蛋白质鉴定:采用生物信息学工具,对蛋白质点进行鉴定,获得蛋白质的分子量、等电点等信息。
3. 差异表达分析:通过对疾病模型组和正常对照组的蛋白质表达谱进行比较,筛选出差异表达的蛋白质,并对其功能进行注释。
4. 功能富集分析:对差异表达蛋白质的功能进行富集分析,发现与疾病发生发展相关的信号通路和生物学过程。
五、讨论1. 差异表达蛋白质的功能分析:通过差异表达蛋白质的功能注释,揭示了疾病状态下蛋白质表达的变化与疾病发生发展的关系。
2. 信号通路分析:通过对差异表达蛋白质的信号通路分析,发现某些信号通路在疾病状态下被激活或抑制,为疾病的发生机制研究提供了线索。
3. 疾病诊断与治疗:通过对蛋白组数据的分析,可以筛选出与疾病相关的生物标志物,为疾病的早期诊断和个性化治疗提供依据。
六、结论本报告通过对疾病模型组和正常对照组的蛋白组数据进行深入分析,揭示了疾病状态下蛋白质表达的变化规律,为疾病的发生机制研究提供了数据支持。
蛋白质组分析蛋白质组(proteome)源于蛋白质(protein)与基因组(genome)两个词的杂合,其定义为proteins expressed by a genome,即一个基因组表达的全部蛋白质。
目前认为蛋白质组的内涵是一个细胞、一类组织或一种生物的基因组所表达的全部蛋白质。
蛋白质组学(proteomics)是研究蛋白质组的一门新兴学科,旨在阐明生物体全部蛋白质的表达模式及功能模式。
蛋白质化学着重于单一蛋白质结构、功能的研究,例如某一种蛋白质或蛋白质亚基的全序列分析,三维立体结构的确定,这样的结构如何执行功能、在生理上所扮演的角色,以及代谢的生化机制等。
蛋白质组学则是研究多种蛋白质组成的复杂系統。
Proteomics的字尾“-omics”的意思是“组学”,代表对生物、生命体系研究工作方式的重新定义,也就是说,蛋白质组学是对基因组所表达的整套蛋白质的分析,其研究对象是多蛋白质混合物的“系统”行为,而不是“单一组成”的行为。
它通过对一个大系统中包含的所有蛋白质进行分离、鉴定、表征和定量,提供关于该系统准确和全面的数据和信息。
蛋白质组与基因组通常,一个细胞中表达两类基因:①必须功能蛋白质的基因;②行使细胞专一性功能蛋白质的基因。
因此,一种生物有一个基因组,但有许多蛋白质组。
因此,蛋白质组与基因组在内涵上有很大的不同,主要表现在以下四个方面:(1)蛋白质组具有多样性图11.1 基因以多种mRNA形式剪接的示意图EXON:外显子,真核细胞基因DNA中的编码序列。
这样的序列可转录为RNA并进而翻译为蛋白质。
P代表磷酸化,sugar代表糖基化,lipid代表脂肪酰化,Ub代表泛素化[3]。
(2)在蛋白质组的研究中,时间和空间的影响都不可忽视(3)蛋白质间主要以相互作用的形式参与生命活动(4)蛋白质组研究对技术的依赖性和要求远远超过基因组学蛋白质组学研究对生物分析化学提出的挑战表11.1 目前蛋白质组学分析中使用的分离与鉴定技术[6-12]技术是否需要标记是否可用于可测定的蛋白质分子量范围动态范围可分离的蛋白点数方法的适用范围检测传统的双向电泳方法(2-DE ) 否 是10 kD ~200 kD1, 0003, 000定量困难,方法的重复性差 荧光双向差示凝胶电泳(DIGE ) Cy-2,3 or 5 fluorophores 标记伯氨基是 10 kD ~200 kD 10, 000[6]3, 000[7]适用于检测高表达水平、长半衰期的蛋白质 基于反相色谱的二维色谱系统[8]否是 >5 kD 的肽或蛋白质100 2, 500限于UV 检测,未与MS 联用 LC-MS/MS 多维色谱系统(MudPit)可以用N 14/N 15标记氨基酸是 蛋白质经酶解后的多肽混合物 10, 000[9]872[10]适用于较复杂的蛋白质混合物,进行MS 分析前需进行分级分离 MALDI-TOF-MS 否 是 >10 kD ,实际测定蛋白质经酶解后的多肽混合物25 不适用 通过肽质量指纹图鉴定已分离的蛋白质 SELDI-TOF-MS [11]否 是 <40 kD 25 不适用利用蛋白质芯片对生物样品中蛋白质的质量进行分析I CAT分析技术 以ICAT 试剂标记巯基 是蛋白质经酶解后的多肽混合物 无数据 496[12]适用于含巯基蛋白质的相对定量分析cICAT 分析技术以可裂解的C 12/C 13ICAT 试剂标记巯基否 蛋白质经酶解后的多肽混合物10, 000 496 适用于含巯基蛋白质的相对定量分析differential gel electrophoresis );MudPit ,用于蛋白质分离的多维色谱(multi-dimensional for protein identification );SELDI-MS ,表面增强激光解吸离子化—质谱(surface enhanced laser desorption ionization-MS );基质辅助激光解吸离子化—质谱(MALDI-MS ,matrix-assisted laser desorption ionization-MS);ICAT ,同位素标记的亲和标签(isotope-coded affinity tag)技术;cICAT ,可裂解的ICAT (cleavable ICAT )技术;PTM ,蛋白质翻译后的修饰(posttranslational modification )。
图11.2 蛋白质组学分析方法的灵敏度和分辨率[13]表11.1和图11.2表明,蛋白质组学研究对生物分析化学提出了很高的要求:(1)对含有巨大数量的多蛋白质成分的复杂体系进行全分离是蛋白质组学研究迫切需要解决的问题。
(2)所建立的生物分析化学分离分析方法应具有很宽的动态范围,才能适应细胞内蛋白质组分析的要求。
(3)蛋白质组学研究对检测灵敏度也提出了很高的要求。
(4)原位、实时检测。
(5)对蛋白质相互作用的检测是蛋白质组学研究中一个非常重要的内容,因此,发展基于生物化学的新的、重现性好的蛋白质相互作用研究策略也是十分重要的。
蛋白质组学的分析策略与研究路线蛋白质组学的基本分析策略图11.3 蛋白质组学分析的基本分析策略图11.4 鸟枪法的基本分析策略蛋白质组学的研究路线一条路线类似于基因组学的研究,即力图查清人类3~4万个基因编码的所有蛋白质,建立蛋白质数据库,从而获得有关生命活动的“全景式”信息。
另一条是基于比较的研究路线,称为比较蛋白质组学(comparative proteomics),国外的文献中也有称为差异显示蛋白质组学(differential display proteomics)或表达蛋白质组学(expression proteomics)。
图11.5 比较蛋白质组学分析的研究路线双向电泳技术及其改进双向电泳(two dimensional electrophresis,2-DE)是当前蛋白质组学研究中分辨率最高、信息量最大的分离技术。
在比较蛋白质组学研究中,双向电泳还是不可缺少的手段。
目前所应用的二维电泳体系是由O’Farrell等人于 1957 年发明,其原理是根据蛋白质的两个一级属性(等电点和相对分子质量),将一种蛋白质样品进行两次电泳,即:在第一个方向上按等电点高低进行分离,称为等电聚焦;在第二个方向(与第一次电泳成直角的方向)上按相对分子质量大小进行分离。
蛋白质组学研究中用得最多的是由固相pH梯度等电聚焦(immobilized pH gradients isoelectric focusing,IEF)/SDS-PAGE所构成的双向电泳体系。
双向电泳的流程图11.6 双向电泳流程图[19]蛋白质样品的制备蛋白质样品制备的一般要求一般来说,一种理想的、有效的样品制备方法应满足以下要求:①应使所有待分析的蛋白样品全部处于溶解状态(包括多数疏水性蛋白),且制备方法应具有可重现性;②溶解方法要保证样品在电泳过程中保持溶解状态,避免溶解性低的蛋白质(如膜蛋白)在等电聚焦时由于溶解度降低而沉淀析出;③防止在样品处理过程发生蛋白质的化学修饰,包括蛋白质降解、蛋白酶或尿素热分解后所引起的修饰;④排除核酸、多糖、脂类和其它干扰分子;同时,应避免处理环境对蛋白质的污染;⑤尽量去除起干扰作用的高丰度或无关蛋白,从而保证待研究蛋白在可检测水平;⑥尽可能缩短处理样品的时间,尽可能在低温环境中处理样品。
双向电泳图谱所传达的信息由双向电泳图可以得到:①蛋白质的分布范围(偏酸性或偏碱性);②表达蛋白质的可能个数(凝胶点的数目);③蛋白质的大概相对分子量;④蛋白质的大概等电点;⑤蛋白质相对表达丰度(点的灰度值)等信息。
图11.7 双向电泳例图[23]图像分析技术图像分析包括图像采集、背景消减、斑点配比、数据库构建。
常用的图像采集系统有电感偶合装置(charge coupled devices,CCD)、光密度仪、激光诱导荧光检测器等。
无论何种采集系统,都必须具备透射扫描的功能以获得较高的灵敏度。
图像采集的信息为光密度值,一般来说,该光密度值与蛋白质点的表达丰度成正比。
影响图像采集质量的因素有:扫描系统的分辨率、灵敏度,以及扫描时所选择的图像对比度和明亮度。
双向电泳图像分析通过软件的运行来实现。
软件分析所要做到的有以下几点:蛋白质点数的统计;蛋白质点的定位、编号;相对丰度分析;在进行差异蛋白质组分析时,则要对相互对照样品的凝胶图像进行同步分析,比较对应蛋白点的表达丰度,获得差异蛋白质点的缺失、出现以及表达量的变化等信息。
目前有多种图像分析软件可以使用,如表11.6所列。
表11.6 用于2-DE图像分析的软件工具软件名称来源应用Fliker National Cancer Institute( /fliker/)可视的胶-胶对比PDQuest Bio-Rad()凝胶图像比较Image Mster Amersham Biosciences()凝胶图像比较DeCyder Amersham Biosciences()2D-DIGE分析*Melanie Genebio(http: // www. /)凝胶图像比较Phoretix/Progenesis Nonlinear Dynamics(http: // www. /)凝胶图像比较Investigator HT Analyzer Genomic Solutions(http: // www. /)凝胶图像比较Proteome Weawer Definiens(http: // www. /)凝胶图像比较Delta 2D Decodon(http: // www. /)凝胶图像比较*2D-DIGE:荧光双向差示凝胶电泳目前双向电泳技术存在的问题(1)进行可完全重复的2-DE分析是困难的。
(2)许多较大的疏水蛋白质在IEF分析中的结果不理想。
(3)对相对分子质量过大(>100, 000)的蛋白质分离分析能力差。
(4)双向电泳不易实现自动化操作,因此,尚不能适应大规模蛋白质组分析的需要。
(5)双向电泳现有的主要染色技术的检测灵敏度较差。
图11.8 目标蛋白拷贝数与胶上荷载的由细胞提取的蛋白质量的关系[24]双向电泳技术的改进目标主要有两个:①提高分辨率,增加可分离的蛋白点的数目;②提高低丰度蛋白点的可检出程度。
§11. 4. 5. 1 三步提取法图11.9 三步提取法流程图§11. 4. 5. 2 亚细胞器分离优点为:①增加了蛋白的点分离数量;②可提高低丰度蛋白的检出;③可明确蛋白点的亚细胞定位。
图11.10 肝癌细胞QGY-7703全细胞及细胞核、20000 g沉淀、100, 000 g沉淀、细胞质的双向电泳图荧光双向差示凝胶电泳技术(fluorescence two-dimensional differential gel electrophoresis,2-D DIGE)2-D DIGE是由Amersham公司开发的一种改良技术。