当前位置:文档之家› 蛋白质分析方法路线数据库

蛋白质分析方法路线数据库

蛋白质分析方法路线数据库
蛋白质分析方法路线数据库

蛋白质分析方法路线

1.蛋白质结构预测

PDB数据库

蛋白质基本立体结构数据库(PDB, https://www.doczj.com/doc/d910728174.html,)其中有大量工具用于查看PDB数据库中的结构,如rasmol,可用于显于出蛋白质的空间结构,下载地址:https://www.doczj.com/doc/d910728174.html,/microbio/rasmol)

PDBFinder 数据库

是在PDB、DSSP、HSSP基础上建立的二级库,它包含PDB序列,作者,R因子,分辨率、二级结构等,这些些信息随着PDB库每次发布新版,PDBFinder在EBI自动生成,网址为“www.sander.embl-heideberg.de/pdbfinder/ ftp://swift.embl-heidelberg.de/pdbfinder.

NRL-3D数据库

是所有已知结构蛋白质的数据库,可用于查询蛋白序列时行相似性分析以确定其结构,https://www.doczj.com/doc/d910728174.html,/Dan/protein/nrl3d.html

ISSD数据库

蛋白质序列数据库,其每个条目包含一个基因的编码序列,同相应的氨基酸序列对比,并给出相应的多肽链结构数据。www.protein.bio.msu.su/issd

HSSP数据库

是根据同源性导出的蛋白质二级结构数据库,每一条PDB项目都有一个对应的HSSP 文件,www.sander.embl-heidelberg.de/hssp

蛋白质结构分类数据库

对已知蛋白质三维结构进行手工分类得到的数据库,位于剑桥的站点也提供BLAST 检索服务 https://www.doczj.com/doc/d910728174.html,/scop/

MMDB蛋白质分子模型数据库

是ENTREZ检索工具所使用的三维结构数据库,以ASN格式反蚋的PDB中的结构和序列数据。NCBI同时提供一个配套的三维结构显示程序的**3*,https://www.doczj.com/doc/d910728174.html,/Structure/

Dali/FSSP数据库

基于PDB数据库中现有的蛋白质三维结构,用自动结构对比程序Dali比较而形成的折叠单元和家庭分类库。https://www.doczj.com/doc/d910728174.html,/dali

蛋白质二级结构预测

基于序列进行蛋白质二级结构方面已有了大量文献描述,本质上,这些研究可被分为两大类:基于单一序列的分析和基于多重序列对齐的分析。

文献报道PHD程序是目前此方面的最好程序,提供了从二级结构到折叠方面分析的多种资源。其网址为www.embl-heidel-berg.de/predictprotein/predictprotein.html,也可通过email:predictprotein@embl-heidelberg.de进行数据分析。

蛋白质三级结构预测

蛋白质同源家庭的分析对于确立物种之间的亲缘关系和预测新蛋白质序列的功能有重要意义,同源蛋白质(homolog)进一步划分为直系同源(ortholog)和旁系同源(paralog),

前者指不同物种中具有相同功能和共同起源的基因,后者则指在同一物种内具有不同功能,但也有共同起源的基因,例如同是起源于珠蛋白的α珠蛋白、β珠蛋白和肌红蛋白。

蛋白质分类数据库(ProtoMap)

是对SWISS-PROT数据库中的全部蛋白质由计算机自动时行层次分类,把相关者聚集分极所得到的数据库。www.proteinmap.cs.huji.ac.il

蛋白质序列多重对齐分析及进化分析

如果发现一个未知蛋白质序列和较多不同和种属或同一种属的蛋白质序列具有较高的同源性(大于30%)那么提示待分析的蛋白质序列可能是相应家族的成员,从而可从分子时化的角度对蛋白质序列进行综合分析。

物理性质预测:

Compute PI/MW http://expaxy.hcuge.ch/ch2d/pi-tool.html Peptidemass http://expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp://https://www.doczj.com/doc/d910728174.html,/pub/fasta/ SAPS http://ulrec3.unil.ch/software/SAPS_form.html

基于组成的蛋白质识别预测

AACompIdent http://expaxy.hcuge.ch/ch2d/aacompi.html AACompSim http://expaxy.hcuge.ch/ch2d/aacsim.html PROPSEARCH http://www.embl-heidelberg.de/prs.html

二级结构和折叠类预测

nnpredict https://www.doczj.com/doc/d910728174.html,/~nomi/nnpredictPredictprotein http://www.embl-heidelberg.de/predictprotein/SOPMA

http://www.ibcp.fr/predict.htmlSSPRED

http://www.embl-heidelberg.de/sspred/ssprd_info.html

特殊结构或结构预测

COILS http://ulrec3.unil.ch/software/COILS_form.htmlMacStripe https://www.doczj.com/doc/d910728174.html,/matsudaira/macstripe.html

与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到

本地检索和通过国际互联网进行检索均是可行的。

由NCBI检索蛋白质序列

可联网到:“https://www.doczj.com/doc/d910728174.html,:80/entrz/query.fcgi?db=protein”进行检索。

利用SRS系统从EMBL检索蛋白质序列

联网到:https://www.doczj.com/doc/d910728174.html,/”,可利用EMBL的SRS系统进行蛋白质序列的检索。

通过EMAIL进行序列检索

当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。

2.蛋白质基本性质分析

蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。

疏水性分析

位于ExPASy的ProtScale程序( https://www.doczj.com/doc/d910728174.html,/cgi-bin/protscale.pl)可被用来计算蛋白质的疏水性图谱。该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。

进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等。

跨膜区分析

有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知跨膜螺旋的研究而得到的。自然存在的跨膜螺旋Tmbase 数据库,可通过匿名FTP获得(http://www.isrec.isb-sib.ch/ftp-server/tmbase),参见表一

资源名称网址说明

TMPRED https://www.doczj.com/doc/d910728174.html,/software/TMPRED_form.html 基于对tmpred 数据库的统计分析PHDhtm http://www.embl-heidelberg.de/services/sander/predictprotein/predictpr otein.htmlMEMSAT ftp://https://www.doczj.com/doc/d910728174.html, 微机版本

,蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚

定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。http://genome.cbs.dtu.dk/sevices/TMHMM-2.0“或“https://www.doczj.com/doc/d910728174.html,/software/TMPRED_form.html”

前导肽与蛋白质定位

在生物内,蛋白质的合成场所与功能场所常被一层或多层细胞膜所隔开,这样就涉及到蛋白质的转运。合成的蛋白质只有准确地定向运行才能保证生命活动的正常进行。一般来说,蛋白质的定位的信息存在于该蛋白质自身结构中,并通过与膜上特殊的受体相互作用而得以表达。在起始密码子之后,有一段编码疏水性氨基酸序列的RN***段,这个氨基酸序列就这个氨基酸序列就是信号肽序列。含有信号肽的蛋白质一般都是分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。

http://genome.cbs.dtu.dk/sevices/signalP-2.0

卷曲螺旋分析

另一个能够直接从序列中预测的功能motif是α-螺旋的卷曲排列方式。在这种结构中,两种螺旋通过其疏水性界面相互缠在一起形成一个十分稳定的结构。

蛋白质卷曲的相关资源

资源网址

coiled-coil

https://www.doczj.com/doc/d910728174.html,/depts/biol/units/coils/coilcoil.htmlCOILS

https://www.doczj.com/doc/d910728174.html,/software/COILS_form.htmlEpitopeInfo

https://www.doczj.com/doc/d910728174.html,/Links.htm

3.蛋白质功能预测

基于序列同源性分析的蛋白质功能预测

到少有80个氨基酸长度范围内具有25%以上序列一致性才提示可能的显著性意义。最快的工具如BlastP能很容易地发现显著性片段,而无需使用十分耗时的BLITZ 软件。

基于NCBI/BLAST软件的蛋白序列同源性分析

类似于核酸序列同源性分析,用户直接将待分析的蛋白质序列输入NCBI/BLAST(https://www.doczj.com/doc/d910728174.html,/blast),选择程序BLASTP就可网上分析。

基于WU/BLAST2软件进行分析

华盛顿大学的BLAST软件(dove.embl-heidelberg.dl/blast2)也可进行蛋白质序列的同源性分析。

基于motif、结构位点、结构功能域数据库的蛋白质功能预测

蛋白质的磷酸化与糖基化对蛋白质的功能影响很大,所以对其的分析也是生物信息学的一个部分。

同时,分子进化方面的研究表明,蛋白质的不同区域具有不同的进化速率,一些氨基酸必须在进化过程中足够保守以实现蛋白质的功能。在序列模式的鉴定方面有两类技术,第一类是依赖于和一致性序列(consensus sequence)或基序各残

基的匹配模式,该技术可用于十分容易并快速搜索motif数据库。

Motif数据库-PROSITE

最好的是PROSITE(https://www.doczj.com/doc/d910728174.html,/prosite)

蛋白质序列的(profile)分析

www.isrec.isb-sib.ch/software/PFSCAN_form.html

InterProScan综合分析网站

InterProScan是EBI 开发的一个集成了蛋白质结构域和功能位点的数据库,其中把SWISS-PROT,TrEMBL.PROTSITE.PRINTS.PFAM.ProDom等数据库提供的蛋白质序列中的各种局域模式,如结构域,motif等信息统一起来,提供了一个较为全央的分析工具。

https://www.doczj.com/doc/d910728174.html,/interpro/scan.html

蛋白质的结构功能域分析

简单模块构架搜索工具(simple modular architecture research tool,SMART)一个较好的蛋白质结构功能域的数据,可用于蛋白质结构功能域的分析,所得到的结构域同时提供相关的资源的链接http://smart.embl-heidelberg.de/

数据库设计各阶段

1.数据库应用系统的设计步骤 按规范设计的方法可将数据库设计分为以下六个阶段 (1)需求分析; (2)概念结构设计; (3)逻辑结构设计; (4)数据库物理设计; (5)数据库实施; (6)数据库运行和维护。 2.需求分析 需求收集和分析是数据库应用系统设计的第一阶段。明确地把它作为数据库应用系统设计的第一步是十分重要的。这一阶段收集到的基础数据和一组数据流图(Data Flow Diaˉgram———DFD)是下一步设计概念结构的基础。概念结构对整个数据库设计具有深刻影响。而要设计好概念结构,就必须在需求分析阶段用系统的观点来考虑问题、收集和分析数据及其处理。如何分析和表达用户需求呢?在众多的分析方法中,结构化分析(Structured Analysis,简称SA方法)是一个简单实用的方法。SA方法用自顶向下、逐层分解的方式分析系统。用数据流图,数据字典描述系统。然后把一个处理功能的具体内容分解为若干子功能,每个子功能继续分解,直到把系统的工作过程表达清楚为止。在处理功能逐步分解的同时,它们所用的数据也逐级分解。形成若干层次的数据流图。数据流图表达了数据和处理过程的关系。处理过程的处理逻辑常常用判定表或判定树来描述。数据字典(Data Dictionary,简称DD)则是对系统中数据的详尽描述,是各类数据属性的清单。对数据库应用系统设计来讲,数据字典是进行详细的数据收集和数据分析所获得的主要结果。数据字典是各类数据描述的集合,它通常包括以下5个部分: (1)数据项,是数据最小单位。 (2)数据结构,是若干数据项有意义的集合。 (3)数据流,可以是数据项,也可以是数据结构。表示某一处理过程的输入输出。 (4)数据存储,处理过程中存取的数据。常常是手工凭证、手工文档或计算机文件。 (5)处理过程。

蛋白质结构分析原理及工具-文献综述

蛋白质结构分析原理及工具 (南京农业大学生命科学学院生命基地111班) 摘要:本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具,系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举,并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。 关键词:蛋白质;结构预测;跨膜域;保守结构域 1 蛋白质相似性检测 蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源,它们通常具有相似的功能;由基因复制而来的序列称为旁系同源,它们通常有不同的功能[1]。因此,推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。 表一常用蛋白质数据库 网址可能有更新 氨基酸替代模型。进化过程中,一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。 序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH,它们使用了Smith-Waterman 算法。全局联配工具有FASTA和GGSEARCH,基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树,这里不阐述。表二列举了常用的成对序列相似性比对搜索工具

蛋白质数据库

生物芯片北京国家工程研究中心 湖南中药现代化药物筛选分中心 暨湖南涵春生物有限公司 常用数据库名录 1、蛋白质数据库 PPI - JCB 蛋白质与蛋白质相互作用网络 ?Swiss-Prot - 蛋白质序列注释数据库 ?Kabat - 免疫蛋白质序列数据库 ?PMD - 蛋白质突变数据库 ?InterPro - 蛋白质结构域和功能位点 ?PROSITE - 蛋白质位点和模型 ?BLOCKS - 生物序列分析数据库 ?Pfam - 蛋白质家族数据库 [镜像: St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] ?PRINTS - 蛋白质 Motif 数据库 ?ProDom - 蛋白质结构域数据库 (自动产生) ?PROTOMAP - Swiss-Prot蛋白质自动分类系统 ?SBASE - SBASE 结构域预测数据库 ?SMART - 模式结构研究工具 ?STRING - 相互作用的蛋白质和基因的研究工具

?TIGRFAMs - TIGR 蛋白质家族数据库 ?BIND - 生物分子相互作用数据库 ?DIP - 蛋白质相互作用数据库 ?MINT - 分子相互作用数据库 ?HPRD - 人类蛋白质查询数据库 ?IntAct - EBI 蛋白质相互作用数据库 ?GRID - 相互作用综合数据库 ?PPI - JCB 蛋白质与蛋白质相互作用网络 2、蛋白质三级结构数据库 ?PDB - 蛋白质数据银行 ?BioMagResBank - 蛋白质、氨基酸和核苷酸的核磁共振数据库?SWISS-MODEL Repository - 自动产生蛋白质模型的数据库 ?ModBase - 蛋白质结构模型数据库 ?CATH - 蛋白质结构分类数据库 ?SCOP - 蛋白质结构分类 [镜像: USA | Israel | Singapore | Australia] ?Molecules To Go - PDB数据库查询 ?BMM Domain Server - 生物分子模型数据库 ?ReLiBase - 受体/配体复合物数据库 [镜像: USA] ?TOPS - 蛋白质拓扑图 ?CCDC - 剑桥晶体数据中心 (剑桥结构数据库 (CSD))

图书馆数据库设计实例(需求分析、概念结构、逻辑结构)

数据库设计实例分析 一、需求分析实例 现要开发高校图书管理系统。经过可行性分析和初步的需求调查,确定了系统的功能边界,该系统应能完成下面的功能: (1)读者注册。 (2)读者借书。 (3)读者还书。 (4)图书查询。 1、数据流图 顶层数据流图反映了图书管理系统与外界的接口,但未表明数据的加

工要求,需要进一步细化。根据前面图书管理系统功能边界的确定,再对图书管理系统顶层数据流图中的处理功能做进一步分解,可分解为读者注册、借书、还书和查询四个子功能,这样就得到了图书管理系统的第0层数据流图 从图书管理系统第0层数据流图中可以看出,在图书管理的不同业务中,借书、还书、查询这几个处理较为复杂,使用到不同的数据较多,因此有必要对其进行更深层次的分析,即构建这些处理的第1层数据流图。下面的图8-7分别给出了借书、还书、查询子功能的第1层数据流图

2、数据字典 2.1 数据项 数据项名称:借书证号 别名:卡号 含义说明:惟一标识一个借书证 类型:字符型 长度:20 …… 2.2 数据结构 (1)名称:读者类别 含义说明:定义了一个读者类别的有关信息 组成结构:类别代码+类别名称+可借阅数量+借阅天数+超期罚款额(2)名称:读者 含义说明:定义了一个读者的有关信息 组成结构:+性别+所在部门+读者类型 (3)名称:图书 含义说明:定义了一本图书的有关信息 组成结构:图书编号+图书名称+作者++价格 …… 2.3 数据流 (1)数据流名称:借书单 含义:读者借书时填写的单据 来源:读者 去向:审核借书 数据流量:250份/天

组成:借书证编号+借阅日期+图书编号 (2)数据流名称:还书单 含义:读者还书时填写的单据 来源:读者 去向:审核还书 数据流量:250份/天 组成:借书证编号+还书日期+图书编号 …… 2.4 数据存储 (1)数据存储名称:图书信息表 含义说明:存放图书有关信息 组成结构:图书+库存数量 说明:数量用来说明图书在仓库中的存放数 (2)数据存储名称:读者信息表 含义说明:存放读者的注册信息 组成结构:读者+卡号+卡状态+办卡日期 说明:卡状态是指借书证当前被锁定还是正常使用(3)数据存储名称:借书记录 含义说明:存放读者的借书、还书信息 组成结构:卡号+书号+借书日期+还书日期 说明:要求能立即查询并修改

生物信息研究中常用蛋白质数据库的总结

生物信息研究中常用蛋白质数据库简述 内蒙古工业大学理学院呼和浩特孙利霞 2010.1.5 摘要:在后基因组时代生物信息学的研究当中,离不开各种生物信息学数据库。尤其在蛋白质从序列到功能的研究当中,目前各种行之有效的方法都是基于各种层次和结构的蛋白质数据库。随着计算机技术及网络技术的发展,目前的蛋白质数据库不论是所包含数据量还是功能都日新月异,新的数据库层出不穷。一个新手面对如此浩瀚的数据量往往无从下手。本文粗浅地为目前蛋白质数据库的使用勾画出一个轮廓,作为自己蛋白质研究入门的一个引导。 关键词:蛋白质;数据库 0 引言 随着科技的发展,个人的知识往往赶不上快速膨胀的信息量,人们为了解决这个问题,便创建了形形色色的数据库。蛋白质数据库是指:在蛋白质研究领域根据实际需要,对蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建出具有特殊生物学意义和专门用途的数据库。蛋白质数据库总体上可分为两大类:蛋白质序列数据库和蛋白质结构数据库,蛋白质序列数据库来自序列测定,结构数据库来自X-衍射和核磁共振结构测定(详见图1)。这些数据库是分子生物信息学的基本数据资源。上世纪90年代,我国从事蛋白质研究的学者使用的蛋白质数据库储存介质还是国外实验室发布的激光光盘[1]。信息的传播储存甚为不便。随着蛋白质研究的发展飞快,同时伴随着计算机和因特网发展,蛋白质数据库的储存传播方式也发生的巨大的变化。进入21世纪后,我们所用的各种蛋白质数据库都发展成为存储在网络服务器上,基于“服务器—客户机”的访问查询方式。伴随着计算机及物理测试技术的发展数据库的容量和功能成数量级膨胀。但是面对如此浩瀚的数据,新手往往感到无从下手,在需要时找不到自己需要的合适数据库。 本文从目前蛋白质数据库建立的的逻辑层次出发,系统地简绍了常用蛋白质数据的概况,它们的查询方法以及它们相互之间的联系。同时尽量不涉及数据库建设和维护方面的计算机和网络这些数据库底层的技术,为蛋白质研究的入门者及对蛋白质感兴趣的人员的一个引导。

数据库分析与设计报告

1.需求分析 2.概念结构设计 3.逻辑结构设计 4.物理结构设计 5.数据库的建立和测试 6.数据库运行和维护 《车辆管理系统》数据库设计 班级:11计算机转 学号:1116939040 姓名:王湘萍 一.需求分析 1.1可行性分析 现在随着企业规模的扩大以及车辆作为最为普遍的交通工具,在企业中已经不是单一的存在,由于单位车辆数目的急剧增加,与之相对应的问题随之而生,比如车辆的使用权问题,车辆的费用问题等,不再是简单的少量的数据。为了解决这一系列的问题,我们必须借助于电脑的强大的数据处理能力和存储能力,如此可以减少人力财力来维护这些数据,可以用更少的投入来换取更佳的数据管理。因此,在这样的情况下,开发单位车辆管理系统是可行的,是必要的。如今,MIS开发已经慢慢的驱向成熟,车辆管理系统也有部分开发,但是都还不是十分完善。现今已经开发的车辆管理系统都是针对以运营为主的具有盈利目的的单位。比如,公交管理、出租车管理、运输公司管理、汽车站点的管理,而这些管理最主要是针对盈利的管理,很少有针对各种汽车使用权、车辆调配等各种普通单位,不是以车辆运营为盈利手段的车辆管理,针对这点,此系统就是适合如今大多数企业管理的车辆管理系统。 通过计算机系统对学校进行全面的管理,满足了学校的现代化管理的要求。 1)经济性 ①系统建设不需要很大的投入; ②可缩减人员编制,减少人力费用; ③人员利用率的改进; 2)技术性 ①处理速度快,准确; ②通过权限的设置,数据的安全性好; ③方便查询; ④控制精度或生产能力的提高 3)社会性

①可降低工作人员工作强度,提高效率,会得到上下员工的一致同意的; ②可引进先进的管理系统开发方案,从而达到充分利用现有资源 1.2需求分析 现代信息技术特别是计算机网络技术的飞速发展,使我们的管理模式产生了质的飞跃,网络化管理将成为信息时代的重要标志和组成部分。探索、研究并构建适宜于在计算机网络环境下的管理模式,是我们责无旁贷的使命。 通过调查,要求系统需要具有以下功能: 1)由于操作人员的计算机知识普遍较差,要求有良好的人机界面。 2)由于该系统的使用对象多,要求有较好的权限管理。 3)方便的数据查询,支持多条件查询。 4)基础信息管理与查询(包括车辆信息、用车记录、部门信息)。 5)通过计算机,能够直接“透视”仓库存储情况。 6)数据计算自动完成,尽量减少人工干预。 7)系统退出。 1.3 系统的模型结构 该系统的模型结构如图2.1所示: 图2.1 系统的模型结构 1.4业务流程分析

SWISS-MODEL_蛋白质结构预测教程

SWISS-MODEL 蛋白质结构预测 SWISS-MODEL是一项预测蛋白质三级结构的服务,它利用同源建模的方法实现对一段未知序列的三级结构的预测。该服务创建于1993年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。 同源建模法预测蛋白质三级结构一般由四步完成: 1. 从待测蛋白质序列出发,搜索蛋白质结构数据库(如PDB,SWISS-PROT等),得到许多相似序列 (同源序列),选定其中一个(或几个)作为待测蛋白质序列的模板; 2. 待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守位置尽量对齐; 3. 建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间结构——待测蛋白 质空间结构模型; 4. 利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。 最后提供给用户的是经过如上四步(或重复其中某几步)后得到的蛋白质三级结构。 SWISS-MODEL工作模式 SWISS-MODEL服务器是以用户输入信息的最小化为目的设计的,即在最简单的情况下,用户仅提供一条目标蛋白的氨基酸序列。由于比较建模程序可以具有不同的复杂性,用户输入一些额外信息对建模程序的运行有时是有必要的,比如,选择不同的模板或者调整目标模板序列比对。该服务主要有以下三种方式: ?First Approach mode(简捷模式):这种模式提供一个简捷的用户介面:用户只需要输入一条氨基酸序列,服务器就会自动选择合适的模板。或者,用户也可以自己指定模板(最多5条),这些模板可以来自ExPDB 模板数据库(也可以是用户选择的含坐标参数的模板文件)。如果一条模板与提交的目标序列相似度大于25%,建模程序就会自动开始运行。但是,模板的可靠性会随着模板与目标序列之间的相似度的降低而降低,如果相似度不到50%往往就需要用手工来调整序列比对。这种模式只能进行大于25个残基的单链蛋白三维结构预测。 ?Alignment Interface(比对界面):这种模式要求用户提供两条已经比对好的序列,并指定哪一条是目标序列,哪一条是模板序列(模板序列应该对应于ExPDB模板数据库中一条已经知道其空间结构的蛋白序列)。服务器会依据用户提供的信息进行建模预测。 ?Project mode(工程模式):手工操作建模过程:该模式需要用户首先构建一个DeepView工程文件,这个工程文件包括模板的结构信息和目标序列与模板序列间的比对信息。这种模式让用户可以控制许多参数,例如:模板的选择,比对中的缺口位置等。此外,这个模式也可以用于“first approach mode简捷模式”输出结果的进一步加工完善。 此外,SWISS-MODEL还具有其他两种内容上的模式: ?Oligomer modeling(寡聚蛋白建模):对于具有四级结构的目标蛋白,SWISS-MODEL提供多聚模板的模式,用于多单体的蛋白质建模。这一模式弥补了简捷模式中只能提交单个目标序列,不能同时预测两条及以上目标序列的蛋白三维结构的不足。 ?GPCR mode(G蛋白偶联受体模式):是专门对7次跨膜G蛋白偶联受体的结构预测。

蛋白常用数据库

搞蛋白质的童鞋们,甭要只查NCBI了~蛋白质相关数据库启蒙~ ★ 小木虫(金币+1):奖励一下,谢谢提供资源 qinhy:恭喜,您的帖子被版主审核为资源贴了,别人回复您的帖子对资源进行评价后,您就可以获得金币了理由:资源贴2011-11-26 16:56 本来是带图的,可是弄过来就变成米图了,附件里面一个是PDF版、一个是WORD版均是带图的,童鞋们看带图的可能比较方便点哦~ 基于蛋白质序列的蛋白质相互作用位点预测(闲谈版) 这个不是论文不是论文啊~~这个是应某某的要求帮他找的,所以都是用现成的免费的网站数据库做的预测分析。无论文为依托,无原理为根据,纯粹就是流连各大网站作个的闲谈。 1、用这些网站先查查你要研究的蛋白质的底细。 这些网站的数据库大多数是实验或者一些相关文献报道的数据的组成。 ★String http://string.embl.de/ 输入你要搜寻的蛋白,它就把这个蛋白相关的数据反映给你,分confidence、evidence的数据可信度参考,同时还具有actions选项,反应它们之间可能是激活/抑制的关系。按按+、-号可以扩大缩小关联蛋白的数量范围。 往下拉一点点就是数据,哈哈,我们都要看数据吃饭啊~~ 分析的数据源自Neighborhood、Fusion、Occurrence、Coexpression、Experiments Database、Textminin及Homology,表示点得证明有数据,根据各项数据给出综合评分。评分越高相互存在关系可能性越高。点击下方各项图标等详细看到各项数据内容。 设条件确定筛选范围。 ★DIP https://www.doczj.com/doc/d910728174.html,/dip/Main.cgi 跟上面的大同小异的功能,装上它附带的软件可能操作性会好一点,不过我米有试过哦。倒是跟它有链接的几个数据库都很强大,大家可以点击看看。 ★BIND http://www.bind.ca 文献有介绍的网站,不过我不能理解为什么我注册就注不了……. 2、继续查,用这些网站将要研究的蛋白质的家庭背景,月收入也大起底。 这里的网站可能跟相互作用方面的关系不大,但是如果知道这些,可以对研究的蛋白有更深的了解。 ★PDB https://www.doczj.com/doc/d910728174.html,/pdb/home/home.do 要查3D结构就往这里查~通常说的PDB号为文献号末4位。 ★PIR https://www.doczj.com/doc/d910728174.html,/pirwww/index.shtml 在蛋白质方面如NCBI般强大的网站,去上面晃荡下吧,会有收获滴。 ★KEGG http://www.genome.jp/kegg/ 粉强大的一个网站,我只说说它的KEGG PA THW AY子项,能迅速掌握一个蛋白质的功能通路,对于小白的偶们来说,很有用,有木有。 3、正题正题,做完上面那些后,接着就是纯预测的成分。也因为如此,要找着这些网站是很悲催的一件事。就算你找着了,你不懂语言,不懂算法,到底结果的可靠性怎样,见人见智。 需要PDB号作分析: promate http://bioinfo.weizmann.ac.il/promate/

蛋白质结构预测在线软件

蛋白质预测分析网址集锦? 物理性质预测:? Compute PI/MW?? ?? SAPS?? 基于组成的蛋白质识别预测? AACompIdent???PROPSEARCH?? 二级结构和折叠类预测? nnpredict?? Predictprotein??? SSPRED?? 特殊结构或结构预测? COILS?? MacStripe?? 与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。? 由NCBI检索蛋白质序列? 可联网到:“”进行检索。? 利用SRS系统从EMBL检索蛋白质序列? 联网到:”,可利用EMBL的SRS系统进行蛋白质序列的检索。? 通过EMAIL进行序列检索?

当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。? 蛋白质基本性质分析? 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。? 疏水性分析? 位于ExPASy的ProtScale程序(?)可被用来计算蛋白质的疏水性图谱。该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。? 进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等。? 跨膜区分析? 有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知

蛋白质相互作用数据库和分析方法

蛋白质相互作用数据库和分析方法 1. 蛋白质相互作用的数据库 蛋白质相互作用数据库见下表所示: 数据库名 说明 网址 BIND 生物分子相互作用数据库 http://bind.ca/ DIP 蛋白质相互作用数据库 https://www.doczj.com/doc/d910728174.html,/ IntAct 蛋白质相互作用数据库 https://www.doczj.com/doc/d910728174.html,/intact/index.html InterDom 结构域相互作用数据库 https://www.doczj.com/doc/d910728174.html,.sg/ MINT 生物分子相互作用数据库 http://mint.bio.uniroma2.it/mint/ STRING 蛋白质相互作用网络数据库 http://string.embl.de/ HPRD 人类蛋白质参考数据库 https://www.doczj.com/doc/d910728174.html,/ HPID 人类蛋白质相互作用数据库 http://wilab.inha.ac.kr/hpid/ MPPI 脯乳动物相互作用数据库 http://fantom21.gsc.riken.go.jp/PPI/ biogrid 蛋白和遗传相互作用数据,主要来自于酵母、线虫、果蝇和人 https://www.doczj.com/doc/d910728174.html,/ PDZbase 包含PDZ 结构域的蛋白质相互作用数据库 https://www.doczj.com/doc/d910728174.html,/services/pdz/start Reactome 生物学通路的辅助知识库 https://www.doczj.com/doc/d910728174.html,/ 2. 蛋白质相互作用的预测方法 蛋白质相互作用的预测方法很非常多,以下作了简单的介绍 1) 系统发生谱 这个方法基于如下假定:功能相关的(functionally related)基因,在一组完全测序的基因组中预期同时存在或不存在,这种存在或不存在的模式(pattern)被称作系统发育谱;如果两个基因,它们的序列没有同源性,但它们的系统发育谱一致或相似.可以推断它们在功能上是相关的。

数据库课后题答案 第7章 数据库设计

第7章数据库设计 1.试述数据库设计过程。 答:这里只概要列出数据库设计过程的六个阶段:( l )需求分析;( 2 )概念结构设计;( 3 )逻辑结构设计;( 4 )数据库物理设计;( 5 )数据库实施;( 6 )数据库运行和维护。这是一个完整的实际数据库及其应用系统的设计过程。不仅包括设计数据库本身,还包括数据库的实施、运行和维护。设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。 2 .试述数据库设计过程各个阶段上的设计描述。 答:各阶段的设计要点如下:( l )需求分析:准确了解与分析用户需求(包括数据与处理)。( 2 )概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS 的概念模型。( 3 )逻辑结构设计:将概念结构转换为某个DBMS 所支持的数据模型,并对其进行优化。( 4 )数据库物理设计:为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。( 5 )数据库实施:设计人员运用DBMS 提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。( 6 )数据库运行和维护:在数据库系统运行过程中对其进行评价、调整与修改。 3 .试述数据库设计过程中结构设计部分形成的数据库模式。 答:数据库结构设计的不同阶段形成数据库的各级模式,即:( l )在概念设计阶段形成独立于机器特点,独立于各个DBMS 产品的概念模式,在本篇中就是E 一R 图;( 2 )在逻辑设计阶段将 E 一R 图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式,然后在基本表的基础上再建立必要的视图( Vi 娜),形成数据的外模式;( 3 )在物理设计阶段,根据DBMS 特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式。 4 .试述数据库设计的特点。 答:数据库设计既是一项涉及多学科的综合性技术又是一项庞大的工程项目。其主要特点有:( l )数据库建设是硬件、软件和干件(技术与管理的界面)的结合。( 2 )从软件设计的技术角度看,数据库设计应该和应用系统设计相结合,也就是说,整个设计过程中要把结构(数据)设计和行为(处理)设计密切结合起来。 5 .需求分析阶段的设计目标是什么?调查的内容是什么? 答:需求分析阶段的设计目标是通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求,然后在此基础上确定新系统的功能。调查的内容是“数据’夕和“处理”,即获得用户对数据库的如下要求:( l )信息要求,指用户需要从数据库中获得信息的内容与性质,由信息要求可以导出数据要求,即在数据库中需要存储哪些数据;( 2 )处理要求,指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理;( 3 )安全性与完整性要求。 6 .数据字典的内容和作用是什么? 答:数据字典是系统中各类数据描述的集合。数据字典的内容通常包括:( l )数据项;( 2 )数据结构;( 3 )数据流;( 4 )数据存储;( 5 )处理过程五个部分。其中数据项是数

第三讲:Uniprot蛋白数据库及其他蛋白质分析工具

第三讲 Uniprot蛋白数据库及其他蛋白质 分析工具
2013/03/19

Uniprot数据库
? Uniprot(Universal?protein?resource)是蛋白 质序列的联合数据库。
– SIB:?Swiss?Institute?of?Bioinformatics – EBI:?European?Bioinformatics?Institute – PIR:?Protein?Information?Resource – 2002年三家联合形成了Uniprot

Swiss‐Prot
? 1986年建立 ? 低冗余度 ? 功能导向 ? 由Swiss?Institute?of?Bioinformatics?和EBI共同 建立并维护

TrEMBL
? TrEMBL=Translation?from?EMBL ? EBI建立并维护 ? 是一个自动数据库 ? 冗余度高,可信度低

UniprotKB
? 部分经过专家注释的数据库 ? 具有很高的可信度 ? 包括两部分UniprotKB/Swiss‐Prot和 UniprotKB/TrEMBL ? UniprotKB/Swiss‐Prot包括539,165条序列 ? UniprotKB/TrEMBL包括29,769,971?条序列 ? 具有非冗余性

Uniparc
? 非冗余性 ? 给予序列的特异性,非同一物种的相同序 列被认为是同一个蛋白质 ? 每一条序列被給予一个特异的编号

数据库表结构分析

5.3.1新闻发布统计分析1.分析逻辑设计 2.数据组织设计 1)分析来源表

2)数据组织设计 表:YongRi_NewsArticles_Category 表:yongri_newsarticles_article

存储过程JZ_GetReport_XWFB USE[Zjsme] GO /****** Object: StoredProcedure [dbo].[JZ_GetReport_XWFB] Script Date: 05/28/2013 17:00:10 ******/ SET ANSI_NULLS ON GO SET QUOTED_IDENTIFIER ON GO -- ============================================= -- Author: -- Create date: -- Description: -- ============================================= ALTER PROCEDURE[dbo].[JZ_GetReport_XWFB] @dtmBeginDate DATETIME, @dtmEndDate DATETIME AS

SELECT CASE WHEN ISNULL(parentname,'')=''THEN'其他'ELSE parentname END,SUM(TM) FROM(select parentname,parentname as name,sum(isnull(sl,0))tm from ( select a.categoryid,name,parentid, parentname= case when parentid= 0 then name when parentid<> 0 then (select name from YongRi_NewsArticles_Category b where parentid= 0 and a.parentid=b.categoryid) end, d.sl from YongRi_NewsArticles_Category a left join( select categoryid,isnull(count(1),0)sl from yongri_newsarticles_article WHERE UpdatedDate BETWEEN@dtmBeginDate AND@dtmEndDate group by categoryid) d on a.categoryid=d.categoryid )c group by parentname union all select parentname,name,sl from ( select a.categoryid,name,parentid, parentname= case when parentid= 0 then name when parentid<> 0 then (select name from YongRi_NewsArticles_Category b where parentid= 0 and a.parentid=b.categoryid) end, d.sl from YongRi_NewsArticles_Category a left join( select categoryid,count(1)sl from yongri_newsarticles_article group by categoryid)d on a.categoryid=d.categoryid

整理(蛋白质序列数据库)

蛋白质序列数据库 我们可以根据基因组序列预测新基因,预测编码区域,并推测其产物(即蛋白质)的序列。因此,随着基因组序列的不断增长,蛋白质序列也在不断增加。 PIR 历史上,蛋白质数据库的出现先于核酸数据库。在1960年左右,Dayhoff和其同事们搜集了当时所有已知的氨基酸序列,编著了《蛋白质序列与结构图册》。从这本图册中的数据,演化为后来的蛋白质信息资源数据库PIR(Protein Information Resource)。 PIR是由美国生物医学基金会NBRF(National Biomedical Research Foundation)于1984年建立的,其目的是帮助研究者鉴别和解释蛋白质序列信息,研究分子进化、功能基因组,进行生物信息学分析。它是一个全面的、经过注释的、非冗余的蛋白质序列数据库。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PIR提供一个蛋白质序列数据库、相关数据库和辅助工具的集成系统,用户可以迅速查找、比较蛋白质序列,得到与蛋白质相关的众多信息。目前,PIR已经成为一个集成的生物信息数据源,支持基因组研究和蛋白质组研究。至2004年,PIR 有近30万个蛋白质的登录数据项,包括来自不同生物体的蛋白质序列。 除了蛋白质序列数据之外,PIR还包含以下信息: (1)蛋白质名称、蛋白质的分类、蛋白质的来源; (2)关于原始数据的参考文献; (3)蛋白质功能和蛋白质的一般特征,包括基因表达、翻译后处理、活化等; (4)序列中相关的位点、功能区域。 对于数据库中的每一个登录项,有与其它数据库的交叉索引,包括到GenBank、EMBL、DDBJ、GDB、MELINE等数据库的索引。PIR中一个具体的登录项如图4.4所示。

图书馆信息数据库结构分析与设计

设计综述 本课程的课程设计实际上工商管理(物流方向)专业学习完《数据库原理及应用》课程后,进行的一次全面的综合训练,其目的在于加深对数据库基础理论和基础知识的理解,掌握运用数据库应用系统开发软件的基础方法. 按指导教师提供的课题,为图书馆的图书借阅管理信息建立数据库,一个现代化的图书馆在正常运营中总是面对大量的读者信息、查询信息和书籍管理信息,传统的管理方法耗费大量的人力物力,又容易导致大量的错误,为了避免大量的错误,因此实现一个智能化、信息化、系统化的图书馆管理的自动化控制.将会使图书管理工作大大减轻,成为图书管理人员的得力助手. 建立这样一个数据库是很有必要的,不仅仅体现在图书馆内,其他工作也可以很好的运用.针对此次建立这个数据库,根据课题要求建立了四个表,分别为读者表、借还表、图书管理表和图书表.这些表结合图书馆的相关储存功能可以很好的帮助图书馆的借阅管理.而且为了清晰明确的将用户的数据表现出来,建立了一个概念性的数据模型E-R图.完成了数据模型之后,把得到的数据模型转换为特定的数据库管理系统下的数据表.最后录入数据,可以便于图书馆查询借阅信息. 采用数据库技术开发的图书馆信息管理系统可以用来实现对图书馆的信息管理,可以提高管理的效率,方便查询.根据以上的综述希望可以很好的运用数据库.

问题描述 数据库名称:图书借阅管理信息数据库 数据库应记录的主要信息和核心查询功能 1.查询馆藏图书总数 2.查询注册读者信息 3.查询当前库存书册数 4.查询在借图书信息 5.查询张三今年借了多少本书 6.查询当前借出次数最多的图书 7.查询最受欢迎的出版社 8.查询李四未归还的图书信息 9.查询三年以上老读者的信息 10.查询《鲁迅全集》这本书的当前库存 11.查询今年到馆/ 还图书的读者信息 12.查询《高等数学》这本书被哪些读者借阅过 13.查询书名为《数据库原理》的图书信息(出版社、作者、单价、分类号等)

蛋白质的功能域、结构及其药物设计----6

第六章 蛋白质的功能域、结构及其药物设计 随着人类基因组全序列测定的完成,预示着基因组研究从结构基因组(Structural Genomics)进入了功能基因组(Functional Genomics)研究时代。研究基因组功能当然首先要研究基因表达的模式。当前研究这一问题可以基于核酸技术,也可以基于蛋白质技术,即直接研究基因的表达产物。测定一个有机体的基因组所表达的全部蛋白质的设想是由Williams于1994年正式提出的,而“蛋白质组”(proteome)一词是Wilkins于1995年首次提出。蛋白质组是指由一个细胞或组织的基因组所表达的全部相应的蛋白质。蛋白质组与基因组相对应,均是一个整体概念,但是两者又有根本的不同:一个有机体只有一个确定的基因组,组成该有机体的所有不同细胞都共享有一个基因组;但是,基因组内各个基因表达的条件、时间和部位等不同,因而它们的表达产物(蛋白质)也随条件、时间和部位的不同而有所不同。因此,蛋白质组又是一个动态的概念。由于以上原因,再加上由于基因剪接,蛋白质翻译后修饰和蛋白质剪接,基因遗传信息的表达规律更趋复杂,不再是经典的一个基因一个蛋白的对应关系,而是一个基因可以表达的蛋白质数目大于一。由此可见,蛋白质组研究是一项复杂而艰巨的任务。 蛋白质结构与功能的研究已有相当长的历史,由于其复杂性,对其结构与功能的预测不论是方法论还是基础理论方面均较复杂。统计学方法曾被成功地应用于蛋白质二级结构预测中,如Chou和Fasman提出的经验参数法便是最突出的例子。 该方法统计分析了各种氨基酸的二级结构分布特征,得出相应参数(P а,P β 和P t )并 用于预测。本章将简要介绍蛋白质结构与功能预测的生物信息学途径。 第一节 蛋白质功能预测 一、根据序列预测功能的一般过程 如果序列重叠群(contig)包含有蛋白质编码区,则接下来的分析任务是确定表达产物——蛋白质的功能。蛋白质的许多特性可直接从序列上分析获得,如疏水性,它可以用于预测序列是否跨膜螺旋(transmenbrane helix)或是前导序列(leader sequence)。但是,总的来说,我们根据序列预测蛋白质功能的唯一方法是通过数据库搜寻,比较该蛋白是否与已知功能的蛋白质相似。有2条主要途径可以进行上述的比较分析: ①比较未知蛋白序列与已知蛋白质序列的相似性; ②查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。 图6.1给出了根据序列预测蛋白质功能的大致过程。由于涉及数条技术路线,所得出的分析结果并不会总是相一致。一般来说,数据库相似性搜索获得的结果最为可靠,而来自PROSITE的结果相对不可靠。

UniProt:蛋白质的全信息数据库

Nucleic Acids Research, 2004, Vol. 32, Database issue D115-D119? 2004 Oxford University Press UniProt:蛋白质的全信息数据库 摘要 为了给科学界提供一个专门,集中,权威的蛋白质序列和功能的信息资源,瑞士-Prot,TrEMBL 和PIR蛋白质数据库已经合作组成了蛋白质的全信息数据库 (UniProt)。我们的目的是用广泛的对照和询问接口来提供一个全面的,分类完全的,丰富并且准确的蛋白质序列信息。中心数据库将有两个部分:符合熟悉的瑞士-Prot(完全手工操作入口)和TrEMBL(使用丰富的自动化的分类,注释和广泛的对照)。为方便序列查寻,UniProt也提供几个无冗余的序列数据库。 UniProt NREF(UniRef)数据库为高效率的搜寻提供适当的蛋白质的全信息数据库的代表性的子集。全面的UniProt 档案(UniParc)每天从很多公共来源数据库更新。 数据库那些UniProt接口可在线访问(https://www.doczj.com/doc/d910728174.html,)或者以几个形式下载(ftp://https://www.doczj.com/doc/d910728174.html,/pub)。我们鼓励科学界人士向UniProt 提供数据。 介绍 近来,瑞士-Prot + TrEMBL和PIR-PSD如同蛋白质数据库不同的序列信息覆盖面和注释优势共存。 2002年,在生物信息科学(SIB)的瑞士研究所和欧洲生物信息科学研究所的瑞士-Prot + TrEMBL 组 (EBI)和蛋白质信息资源(PIR)组织在乔治敦大学医学中心和国家生物医学的研究基金会联合协作。新联合的组织的主要任务是通过建立一个综合,详细分类,丰富并且准确注释蛋白质序列的优质的数据库和广泛序列对比和询问服务的到科学团体免费接口

蛋白质的组成及特点

蛋白质的组成及特点 蛋白质是由C(碳)、H(氢)、O(氧)、N(氮)组成,一般蛋白质可能还会含有P(磷)、S(硫)、Fe(铁)、Zn(锌)、Cu(铜)、B(硼)、Mn(锰)、I(碘)、Mo(钼)等。 这些元素在蛋白质中的组成百分比约为:碳50% 氢7% 氧23% 氮16% 硫0~3% 其他微量。 (1)一切蛋白质都含N元素,且各种蛋白质的含氮量很接近,平均为16%; (2)蛋白质系数:任何生物样品中每1g元N的存在,就表示大约有100/16=6.25g蛋白质的存在,6.25常称为蛋白质常数 整体结构 蛋白质是以氨基酸为基本单位构成的生物高分子。蛋白质分子上氨基酸的序列和由此形成的立体结构构成了蛋白质结 构的多样性。蛋白质具有一级、二级、三级、四级结构,蛋白质分子的结构决定了它的功能。 一级结构(primary structure):氨基酸残基在蛋白质肽链中的排列顺序称为蛋白质的一级结构,每种蛋白质都有唯一而确切的氨基酸序列。 二级结构(secondary structure):蛋白质分子中肽链并非直链状,而是按一定的规律卷曲(如α-螺旋结构)或折叠(如β-折叠结构)形成特定的空间结构,这是蛋白质的二级结

构。蛋白质的二级结构主要依靠肽链中氨基酸残基亚氨基(—NH—)上的氢原子和羰基上的氧原子之间形成的氢键而 实现的。 三级结构(tertiary structure):在二级结构的基础上,肽链还按照一定的空间结构进一步形成更复杂的三级结构。肌红蛋白,血红蛋白等正是通过这种结构使其表面的空穴恰好容纳一个血红素分子。 四级结构(quaternary structure):具有三级结构的多肽链按一定空间排列方式结合在一起形成的聚集体结构称为蛋白质 的四级结构。如血红蛋白由4个具有三级结构的多肽链构成,其中两个是α-链,另两个是β-链,其四级结构近似椭球形状。 连接方法 用约20种氨基酸作原料,在细胞质中的核糖体上,将氨基酸分子互相连接成肽链。一个氨基酸分子的氨基和另一个氨基酸分子的羧基,脱去一分子水而连接起来,这种结合方式叫做脱水缩合。通过缩合反应,在羧基和氨基之间形成的连接两个氨基酸分子的那个键叫做肽键。由肽键连接形成的化合物称为肽。 检测方法 分别向甲乙两支试管加入3毫升蛋清稀释液和清水,再依次向两支试管中加入双缩脲试剂A液和B液。观察甲乙两试管

相关主题
相关文档 最新文档