当前位置：文档之家› 生物信息学及其在蛋白质组学中的应用

生物信息学及其在蛋白质组学中的应用

生物信息学课程论文

班级: 农学051

姓名: 景玉川

学号: 03

生物信息学及其在蛋白质组学中的应用

20世纪80年代, 随着基因组学和蛋白质组学的发展, 数据量迅速的增加,生物信息学(bioinformatics)就应运而生。它研究的重点内容为基因组学(Genomics)和蛋白质组(Proteomics)，其在基因组学中的应用已经相当成熟, 各种数据库已经被人们广泛的使用。而今, 随着功能基因组学的信息量不断的增加, 生物信息学在蛋白质组学中的应用也显得越来越重要。

1蛋白质组数据库

蛋白质组数据库是蛋白质组学研究的主要内容之一。通过构建不同环境条件下组织或细胞全部蛋白质的数据库来研究蛋白质表达的差异情况。与其他数据库相比, 目前大部分蛋白质组数据库都有以下几个方面的特点:(1)由于蛋白质相关数据的种类繁多, 蛋白质组数据库的种类也多种多样, 如双向电泳数据库，基于蛋白序列的数据库蛋白质一级或高级结构数据库，蛋白质相互作用数据库等等; (2)数据更新速度快, 网络上的蛋白质组数据库的数据几乎每天都在更新;(3)网络共享程度高, 越来越多的数据库资源与互联网相互配合, 使得蛋白质相关数据的利用率空前的提高。蛋白质组数据库的主要内容即集中在基于双向电泳结果的数据库和基于蛋白质序列信息的数据库"

1.1 双向电泳图谱的数据库

双向电泳技术是蛋白质组学研究中最重要的实验技术之一, 所以基于双向电泳图片的数据库也成了蛋白质组学研究中主要内容。这些数据库有以下几个特点: (1)数据直观，以蛋白质双向电泳图片为索引, 将图片放在互联网上, 每一个蛋白点的信息(等电点，分子量等等)都可以通过点击图片上相应位置的蛋白点得到; (2)以蛋白质双向电泳图片为基础, 并与其他数据(蛋白质序列结构和功能等信息)进行整合。

1.2 水稻蛋白质组数据库

水稻基因组测序完成之后, 关于水稻蛋白质组的数据库也随之建立了起来。从双向电泳实验中分离鉴定出水稻组织或细胞器中的蛋白质, 经分析后获得关于这些蛋白质的各种信息, 对这些数据进行总结整合之后, 水稻蛋白质组学数据库逐渐建立了起来, 可供研究人员通过网络方便使用。这个数据库可以从以下四个方面为研究人员提供服务务: (1)在数据库的2-D参考胶上选择相应的蛋白点,获得该蛋白点的各种信息;(2)输入与蛋白相关的关键词(蛋白质名字!序列号)查询蛋白相关信息; (3)根据蛋白质的分子量和pI值来查询该蛋白的相关信息;(4)由蛋白质的氨基酸序列查询某类相似蛋白质的信息。

1.3 SWISS-2DPAGE数据库

SWISS-2DPAGE数据库是由日内瓦大学附属医院临床化学中心实验室与瑞士生物信息协会合作创办的人类维凝胶蛋白数据库, 为在2D凝胶上预测蛋白质迁移提供了许多标化的凝胶图象和工具, 比较已知细胞类型或组织的凝胶和SWISS-2DPAGE的图象即可以帮助识别关键标志物。虽然这个数据库使用方便，信息量大且准确, 但是详细的比对低到中等丰度的蛋白质还存在困难,除非凝胶在同一实验室中在严格控制的条件下电泳(蛋白质样品本身的变化性，样品制备的不可重复性，任何凝胶系统不能完全分辨样品中的所有蛋白质)。因此MS的数据已经逐渐的引入到了该数据库中, 通过与蛋白质相关的更详细的信息排除凝胶对凝胶比对方式重复性差的劣势。

2基于蛋白质序列信息的数据库

基于蛋白质序列信息的数据库是生物信息学数据库中最基本的数据库, 这些数据库以氨基酸残基顺序为基本内容, 并附有注释信息(计算机的序列分析结果和生物学家查阅文献的结果)。基于蛋白质序列的数据库很多, 主要有蛋白质信息资源数据库(PIR)，SWISS-PROT 数据库,蛋白质序列数据库NRL_3D和TrEMBL等等"

2.1 蛋白质信息资源数据库(PIR)

蛋白质信息资源数据库由佐治堂大学创立,收集的序列用来研究蛋白质在进化中的关系。该数据库建立较早(雏形可追溯到20世纪60

年代),内容非常全面。

数据库现在已经和其它3个数据中心建立了国际联盟: 美国华盛顿的乔治城大学全国生物医学研究基金会(NBRF)!慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质信息数据库(JIPD)。这3个中心共同制作和发布一个“野生型(wild-type)”蛋白质序列数据库。这是一个国际蛋白质序列数据库, 它包含所有序列已知的自然界中野生型蛋白质的信息。PIR数据库按数据的性质分为四个部分: PIR1中的序列已经经过验证, 注释十分详尽; PIR2中大部分序列已经经过验证, 但还含有尚未确定的冗余序列; PIR3中的序列还没有经过检验, 注释也还没有加入; PIR4中的信息都由其他渠道获得, 没有经过验证也没有加入注释。

2.2 SWISS-PROT数据库

SWISS-PROT(http:PPwww.expasy.chPsprotPsprot-top.html)是一个经过整理后的蛋白质序列数据库,内容丰富,信息详细。它致力于提供高水平的注释(例如描述蛋白质的功能，作用域结构，翻译后修饰，突变体等)最低水平的冗余以及与其它数据库的整合。这个数据库建立于1986年,从1987年开始与日内瓦大学以及EMBL数据实验室(EMBLDataLibrary,欧洲生物信息学学会)共同维护"SWISS-PROT数据库是对数据人工审读最严格的数据库之一, 信息可信度很高, 且每一条数据都有详细注释, 包括功能，结构域，翻译后的修饰等, 齐全的引文和与许多其他数据库的链接更是为用户提供了方便。

一般说, 研究人员都默认一条规则,即任何蛋白质序列数据的搜寻和比较都应当从SWISS-PROT开始。

2.3 其他蛋白质组数据库

蛋白质生物信息学包含很多方面的内容: 如蛋白质大分子的结构，相互作用等等, 所以,除了上述的一些数据库之外, 还有很多关于构象，相互作用等方面的数据库, 如: (1)PDB(ProteinDataBank,蛋白质三维结构坐标库https://www.doczj.com/doc/3d15581054.html,),即美国国家实验室(BrookhavenNationalLaboratory,BNL)蛋白结构数据库。

(2)Predictome(http:https://www.doczj.com/doc/3d15581054.html,P)蛋白质功能预测数据库, 为44个

基因组和蛋白之间的功能联系提供预测。

3 总结

将生物信息学的实验思路引入蛋白质组学的实验方案后, 试验人员可以通过互联网上的信息设计实验方案, 避免了很多重复性的劳动, 少走很多弯路, 为蛋白质组学的发展提供了可靠的信息资源。值得一提的是, 上文提到的大多数数据库都能实现数据接收，在线查询和空间结构的可视化浏览等多种功能。而且, 几乎所有这些数据库都是免费的, 都可以免费下载或提供免费服务, 使得蛋白质组学可以在生物信息学的辅助之下快速发展。