蛋白质组学常用的网站和数据库

格式：docx
大小：19.94 KB
文档页数：13

下载文档原格式

/ 13

Uniprot数据库介绍及信息检索下载指南

UniProt数据库一、UniProt数据库简介蛋白质组常用数据库——UniProt数据库，是信息最丰富、资源最广的蛋白质数据库。

它由Swiss-Prot、TrEMBL 和PIR-PSD三大数据库的数据整合而成，数据主要来自于基因组测序项目完成后，后续获得的蛋白质序列，并包含了大量来自文献的蛋白质生物功能的信息。

一般蛋白质组搜库首选数据库也是UniProt，所以对于通过UniProt库搜库的组学数据，可以在此网站中进行蛋白功能查询。

UniProt数据库可以提供的信息包括蛋白功能描述、GO条目、细胞定位、组织特异性表达情况、生理病理情况描述、互作蛋白、Domain、翻译后修饰位点等信息。

蛋白的信息描述段落均会标出引用文章，并且可以跳转到PubMed界面进行浏览。

UniProt 数据库由UniProt 知识库（UniProtKB ）、UniProt 档案（UniParc ）、UniProt 参考资料库（UniRef）以及UniProt元基因组学与环境微生物序列数据库（UniMES）构成。

UniProtKB全称 UniProt Knowledgebase（UniProt知识库）它是经过专家校验的数据集，主要由两部分组成：UniProtKB/Swiss-Prot (包含检查过的、手工注释的条目) 和 UniProtKB/TrEMBL (包含未校验的、自动注释的条目)。

Swiss-Prot 数据库特点高质量的、手工注释的、非冗余的数据集；主要来自文献中的研究成果和E-value校验过计算分析结果。

有质量保证的数据才被加入该数据库！TrEMBL数据集包含高质量的计算分析结果，一般都在自动注释中富集，主要应对基因组项目获得的大量数据流以人工校验在时间上和人力上的不足。

它能注释所有可用的蛋白序列。

在三大核酸数据库（EMBL-Bank/GenBank/DDBJ）中注释的编码序列都被自动翻译并加入该数据库中。

它也有来自PDB数据库的序列，以及Ensembl、Refeq和CCDS基因预测的序列。

蛋白质数据库

生物芯片北京国家工程研究中心湖南中药现代化药物筛选分中心暨湖南涵春生物有限公司常用数据库名录1、蛋白质数据库PPI - JCB 蛋白质与蛋白质相互作用网络•Swiss-Prot - 蛋白质序列注释数据库•Kabat - 免疫蛋白质序列数据库•PMD - 蛋白质突变数据库•InterPro - 蛋白质结构域和功能位点•PROSITE - 蛋白质位点和模型•BLOCKS - 生物序列分析数据库•Pfam - 蛋白质家族数据库 [镜像： St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] •PRINTS - 蛋白质 Motif 数据库•ProDom - 蛋白质结构域数据库 (自动产生)•PROTOMAP - Swiss-Prot蛋白质自动分类系统•SBASE - SBASE 结构域预测数据库•SMART - 模式结构研究工具•STRING - 相互作用的蛋白质和基因的研究工具•TIGRFAMs - TIGR 蛋白质家族数据库•BIND - 生物分子相互作用数据库•DIP - 蛋白质相互作用数据库•MINT - 分子相互作用数据库•HPRD - 人类蛋白质查询数据库•IntAct - EBI 蛋白质相互作用数据库•GRID - 相互作用综合数据库•PPI - JCB 蛋白质与蛋白质相互作用网络2、蛋白质三级结构数据库•PDB - 蛋白质数据银行•BioMagResBank - 蛋白质、氨基酸和核苷酸的核磁共振数据库•SWISS-MODEL Repository - 自动产生蛋白质模型的数据库•ModBase - 蛋白质结构模型数据库•CATH - 蛋白质结构分类数据库•SCOP - 蛋白质结构分类 [镜像: USA | Israel | Singapore | Australia]•Molecules To Go - PDB数据库查询•BMM Domain Server - 生物分子模型数据库•ReLiBase - 受体/配体复合物数据库 [镜像： USA]•TOPS - 蛋白质拓扑图•CCDC - 剑桥晶体数据中心 (剑桥结构数据库 (CSD))•HSSP - 蛋白质二级结构数据库•MutaProt - PDB数据库中点突变的比较•SWISS-3DIMAGE - 蛋白质和其他生物分子的三维图像•BioImage - 生物图像数据库 (包含生物大分子图像) 3、蛋白质组数据库和链接•2－D胶数据库以及与2－D胶相关的数据库•蛋白质组链接4、与核酸相关的数据库•EMBL - EMBL核酸序列数据库 (EBI)•Genbank - GenBank核酸序列数据库 (NCBI)•DDBJ - 日本DNA数据库•dbEST - dbEST(表达序列标签)数据库 (NCBI)•dbSTS - dbSTS(序列标签位点)数据库 (NCBI)•AsDb - 异常剪切数据库•ACUTS - DNA非转录保守序列数据库•密码子数据库•EPD - 真核生物启动子数据库•HOVERGEN - 颈椎动物同源基因数据库•IMGT - 免疫遗传学数据库 [镜像： EBI]•ISIS - 内含子序列信息•RDP - 核糖体数据库•gRNAs db - gRNA数据库•PLACE - 植物DNA顺势调控元件数据库•PlantCARE - 植物中DNA顺势调控组件数据库•ssu rRNA - 欧洲核糖体RNA数据库－小核糖体•lsu rRNA - 欧洲核糖体RNA数据库－大核糖体•5S rRNA - 5S核糖体RNA数据库•tmRNA Website - tmRNA站点•tmRDB - tmRNA数据库•tRNA - tRNA剪切（ Bayreuth大学）•uRNA db•RNA editing - RNA剪切位点•RNAmod db - RNA修饰数据库•TelDB - 多介质端粒数据库•MPDB - 分子探针数据库•VectorDB - 载体序列数据库5、糖类•FCCA - 糖类论坛•GlycoSuiteDB - 多聚糖数据库•Monosacharide browser - Space filling Fischer projection for monosaccharides•Thorkild's lectin page - 凝集素通道6、特殊物种数据库:人类：•OMIM - 孟德尔遗传在线－－人类•GENATLAS - 人类基因图集•GeneClinics - 医学基因学库•GDB - 基因组数据库•GeneCards - 人类基因整合信息数据库•UDB - 人类基因图谱数据库•Ensembl人类基因组浏览器•UCSC人类基因组工作草图•TIGR HGI - TIGR人类基因组索引•Hs UniGene - GenBank中的人类转录本•STACK - 序列标签比对• - 人类基因预测•GenLink - 人类基因组资源数据库•GeneLynx - 人类基因组•HUGE - 人类未知基因－大型蛋白质反转录得到的cDNA (KIAA...)•HUNT - 人类异常转录本•CGAP - 癌症基因组解剖学•MGC - 哺乳动物基因•SCDb - 干细胞数据库•Homophila - 人类疾病基因与果蝇基因对比数据库•Human Protein Atlas - 人类正常组织蛋白质与癌细胞蛋白质表达与位点的比较•Chr at Rutgers - Rutgers的人类染色体信息•Chr at Sanger - Sanger Center的人类染色体信息•Chr Swiss-Prot list - Swiss-Prot的染色体信息脊椎动物：•OMIA - 孟德尔遗传在线－－动物•MGI - 小鼠基因组学信息 [镜像： Australia]•Ensembl小鼠基因组浏览器•TIGR MGI - TIGR小鼠基因索引•Mm UniGene - GenBank 中的小鼠转录本(EST clusters) •MGC - 哺乳动物基因•Mouse gene knockouts db - 小鼠基因敲除数据库•RGD - 大鼠基因组数据库•RatMAP - 大鼠基因组数据库•TIGR RGI - TIGR大鼠基因组数据库•Rn Unigene - GenBank 中的大鼠转录本(EST clusters) •BOVMAP - 牛基因数据库 (法国)•DGP - 狗基因数据库•MIS - 孟德尔遗传－－羊•Ark-Cat - 猫基因组数据库•Ark-Chicken - 鸡基因组数据库•Ark-Cow - 奶牛基因组数据库•Ark-Deer - 鹿基因组数据库•Ark-Horse - 马基因组数据库•Ark-Pig - 猪基因组数据库•Ark-Sheep - 绵羊基因组数据库•Ark-Turkey - 火鸡基因组数据库•FishBase -鱼类综合信息系统•Fugu genome project - 河豚基因组•Fugu - HGMP 河豚数据•- Ensembl 河豚基因组浏览器•Medakafish - Mekada fish (Oryzias latipes) server •Ark-Tilapia - 罗飞鱼基因组数据库•Ark-Salmon - 大马哈鱼基因组数据库•The fish net - 斑马鱼基因组数据库•Ensembl斑马鱼基因组浏览器线粒体和叶绿体：•GOBASE - 细胞器基因组数据库•MitoDat - 孟德尔遗传和线粒体数据库• C.caldarium - 蓝藻纲PK1菌株叶绿体基因组昆虫•Drosophila Swiss-Prot list - Swiss-Prot中的果蝇链接•FlyBase - 果蝇遗传数据库和分子数据库•BDGP - Berkeley果蝇基因组项目•FlyView - 果蝇图像数据库•Homophila - 人类疾病与果蝇基因对照数据库•蚊子基因组学•AnoDB - 疟蚊数据库•Ensembl蚊子基因组浏览器7、人类突变数据库•HGMD - 人类基因突变数据库•SVD - EBI序列变异数据库•GeneDis - 人类遗传病数据库8、特殊基因和蛋白质数据库•Allergens in Swiss-Prot - Swiss-Prot中过敏反应的命名与索引•Allergome - 过敏症反应分子数据库•Aminoacyl-tRNA synthetases in Swiss-Prot - Swiss-Prot 中氨基化tRNA合成酶列表9、转录后修饰数据库•DSDBASE - 二硫化物数据库 (数据来源于三级结构数据库) •GlycoSuiteDB - 多聚糖结构数据库•LIPID MAPS - 脂类代谢及路径10、系统发生学数据库•COG - 全基因组中编码的蛋白质的系统发生学分类方法•EGO - 真核生物基因分类方法•InParanoid - 真核生物分类11、芯片数据库•ArrayExpress - EBI中芯片数据•ExpressDB - 酵母菌和大肠杆菌表达数据库•GeneX - 基因表达工程12、专利数据库•DPD - DNA专利数据库•Ag Patents - USDA收录的农业工艺专利•Esp@cenet - 欧洲专利事务所专利信息数据库 (世界范围内)13、参考文献(目录数据库)•PubMed Medline server - PubMed查询•AGRICOLA - NAL农业查询数据库•Article@INIST - 科技信息数据库•Korean Journals Abstract db - 韩国杂志摘要数据库•SeqAnalRef - 序列分析文献14、字典, 读物, 课程 ,命名法•BioABACUS - 缩写词•BioTech's life science dictionary生物科技及生命科学字典•DCB - 细胞生物学字典（Julian Dow编写）15、生物软件数据库及目录•CLC Free Workbench - 可在Linux, MacOS X and Windows操作系统上运行的，对DNA、RNA和蛋白质进行算法分析的软件•CLC Protein Workbench - 可在Linux, MacOS X and Windows 操作系统上运行的，对DNA、RNA和蛋白质进行算法分析的软件•BioCatalog - EBI的生物目录16、生命科学资源•Biofind - 生物科技工业信息、评论及新闻•Bioinformatik.de - 生物信息学网页目录17、生物杂志和发行人•生物杂志主页：Swiss-Prot journals list - Swiss-Prot杂志列表• - 电子出版物目录• - 电子期刊目录18、发行人•Allen Press, Inc. - Allen出版社•AMA - 美国医学联合出版物•ACS - 美国化工协会出版物19、生物信息学杂志和通讯•BioInformer - EBI通讯•NCBI Newsletter -NCBI通讯•PDB Quaterly Newsletter - PDB通讯20、基因组通讯•Human Genome Project Information - 人类基因组计划•FGN - 真菌遗传学•Rice Genome Newsletter - 水稻基因组21、其他•IJC - 化学杂志•Plant Gene Register - 植物基因注册22、生物商业杂志•BioCentury - 生物世纪•BioWorld Online - 生物世界•Drug Discovery and Development - 药物发现和发展•GEN - 基因工程新闻23、综合性科学杂志•Nature•New Scientist•La Recherche•Science•Scientific American24、生物学研究机构•APS - 美国缩氨酸社区•ASCB - 美国细胞生物学社区•ASHG - 美国人类遗传学社区25、计算生物学服务器主页欧洲：•EBI - 欧洲生物信息学协会•EMBnet - 欧洲分子生物信息学网•EMBL - EMBL计算生物学机构美国和加拿大：•NCBI - 美国生物学信息中心•ABCC - NCI高级生物医学计算中心•ACGT - Oklahoma大学基因组技术中心亚洲•APBioNet - 亚太生物信息网•BIC-JNU - Jawaharlal Nehru大学生物信息学中心•DIC - Pune (印度)大学生物信息澳洲•APBioNet - 亚太生物信息网•ANGIS - 澳大利亚国家遗传信息服务中心•ANU - 澳大利亚国大学生物信息学研究组•APAF - 澳大利亚蛋白质组分析工具26、其他•HUJI - 耶路撒冷Hebrew大学基因组学和生物信息学服务中心•Weizmann Bioinfo/BCU - Weizmann计算生物学和生物信息学研究协会•SANBI - 南非生物信息学研究协会27、生物公司和制药公司•美国药物研究和制造商目录•Bioportfolio - 生物技术企业•Affymetrix, Inc. - Affymetrix公司28、生物信息公司•Aborygen•Accelrys, Inc•AlgoNomics NV t29、其他链接其他医学查询•HON - 基于网络的健康服务• - 药物网络指南•MedWeb - 医学链接其他科学查询•GPSDB - 基因和蛋白质同义词数据库•Chemcyclopedia Online - 商业化学试剂数据库。

蛋白质数据库

蛋⽩质数据库
⼀、蛋⽩质数据库
》序列数据库：Uniprot (蛋⽩质序列和具有综合功能注释⽬录的中⼼资源库)
PIR （提供蛋⽩质序列数据和分析⼯具）
》结构数据库：PDB （实验测定的⽣物⼤分⼦三维结构）
MMDB
》模体及结构域数据库：PROSITE (蛋⽩质序列功能位点数据库)
Pfom (使⽤基于隐马模型的多序列⽐对对蛋⽩质进⾏家族分类) 》蛋⽩质分类数据库：SCOP （提供已知结构蛋⽩质间的结构和进化关系信息）
CAHT
HSSP
DSSP
⼆、蛋⽩质组数据库
》SWEISS PROT 2DE PAGE / neXtProt / PaxDb / PeptideAtlas / PRIDE
涉及不同⽣物、不同器官、组织、细胞的蛋⽩质图谱数据
三、蛋⽩质互作组数据库
》HPRD / DIP / INTERACT
四、综合型数据库
》ExPASy。

生命科学中最常用的5个数据库介绍

生命科学中最常用的5个数据库介绍生命科学是一个庞大而复杂的学科，其中包含了关于生命现象的各种研究。

对于生命科学的研究，特别是在分子水平上进行的研究，需要大量的数据支持。

这些数据包括分子序列、蛋白质结构、代谢途径等等。

为了有效地管理这些数据，生命科学中广泛应用了各种数据库。

本文将介绍生命科学中最常用的5个数据库。

1. GenBankGenBank是全球最大的分子生物学数据库，包含了全球各地实验室提交的DNA和RNA序列。

它由美国国家生物技术信息中心（NCBI）维护。

GenBank包含了数十亿条序列记录，其中包括了不同物种的基因组、蛋白质序列、DNA和RNA序列等。

与DNA和RNA序列相关的信息包括序列长度、基序、带电的特殊域、结构域、转录因子结合位点以及其他数据。

GenBank还包含了元数据，如物种和菌株的信息、文献引用以及序列的提交日期。

2. PubMedPubMed是美国国家医学图书馆（NLM）维护的一个生命科学文献数据库，包括了生命科学、医学和健康相关的数百万篇论文。

PubMed提供了对文献的全文搜索和存储，使科学家在查找特定话题时更加方便。

除了搜索全文的功能，PubMed还提供了很多额外的服务，如翻译摘要、相关文章推荐、绘制图表等。

3. EnsemblEnsembl是一种数据库、搜索引擎和分析平台，专门用于处理各种生命科学的数据。

Ensembl已经成为了全球最大的基因组数据库之一，包含了人类、其他哺乳动物、鸟类、篮球、双子蝎、无脊椎动物等近700个物种的基因组信息。

Ensembl提供的数据包括生物序列、调控区域、基因家族、基因结构、基因组的变异和基因表达信息等。

4. Protein Data Bank (PDB)蛋白质数据银行（PDB）是一个三维蛋白结构数据库，由改华大学、美国罗格斯大学和欧洲生物信息研究所等机构共同维护。

PDB存储了全球各地实验室提交的蛋白质晶体结构和生化分析，包括了大多数已知的蛋白质家族和酶。

蛋白质序列数据库

▪ PIR-PSD的另一个重要特征是其对蛋白质超家族的分类，提供序列的等级聚类信息，揭示序列间的进化关系。
4 UniPro
▪ 蛋白质信息资源（PIR）、欧洲生物信息学研究所（EBI）和瑞士生物信息学研究所（SIB）合作，于2002年共同组建世界蛋白质资源（the Universal Protein Resource， UniPro）。
▪ UniPro把Swiss-Prot、TrEMBL和PIR等蛋白质数据库整合在一起，是目前国际上最全面的蛋白质信息库。
综上所述，蛋白质序列数据库种类多且各有特色，因此，用户在分析蛋白质序列时，应根据实际情况，尽可能选择几个不同的数据库，并对结果加以比较。
The Universal Protein Resource (Uபைடு நூலகம்iProt)
属性。
5 序列描述:
是在生物和（或）生物文献的上下文中描述一个生物序列或生物序列集；
生物源（BioSource）－来源生物的信息；分子信息（MolInfo）－－描述器指示分子类型，如基因，
mRNA，EST，肽链信息。
蛋白质数据分析
由于传统的用X光晶体衍射和核磁共振技术测定蛋白质的三维结构、用生化方法研究蛋白质功能的效率不高，无法适应由基因组测序所带来的蛋白质序列数量飞速增长的需要，近年来，许多科学家致力于用理论计算的方法预测蛋白质的三维结构和功能，提高蛋白质功能研究的效率，并取得了一定的成果。
信息、注释、蛋白质序列等(如：Acetyltransferase)。
3D structure
c. 蛋白质注释
包括蛋白质的功能、翻译后修饰（如糖基化和磷酸化）、结构域和结合位点、二级结构（如α- 螺旋和β- 片层）、四级结构（如同聚体和异聚体）、与其它蛋白质序列的相似性、蛋白质序列残缺与疾病的关系、序列冲突和变异体等信息。

蛋白质组学研究中常用的网站和数据库

蛋白质组学研究中常用的网站和数据库蛋白质, 数据库, 研究本帖引用网址：/thread-35586-1-1.html一、蛋白质数据库1.UniProt (The Universal Protein Resource) 网址：//uniprot/简介：由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成，提供详细的蛋白质序列、功能信息，如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等，同时提供其他数据库，包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。

2.PIR(Protein Information Resource) 网址：/简介：致力于提供及时的、高质量、最广泛的注释，其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort，与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。

3.BRENDA(enzyme database) 网址：简介：酶数据库，提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。

4.CORUM(collection of experimentally verifiedmammalian protein complexes) 网址：http://mips.gsf.de/genre/proj/corum/index.html简介：哺乳动物蛋白复合物数据库，提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database) 网址：.au/cybase简介：环状蛋白数据库，提供环状蛋白的序列、结构等数据，提供环化蛋白预测服务。

6.DB-PABP 网址：/DB_PABP/简介：聚阴离子结合蛋白数据库。

蛋白质组学数据统计分析软件

TPP包含一系列蛋白质鉴定和定量分析的模块, 能够对经Sequest数据库搜索引擎得到的结果进行筛选过滤,从而达到蛋白质鉴定和测序的目的.
选择程序X!Tandem 选择需要搜索的质谱数据 DTA, PKL, MGF, mzData, mzXML or Tandem BIOML
选择数据库
数据检索输出阀值
(|Ｍ－Ｍ0|/M0)X10６(ppm) Ｍ为离子质量的实测值；Ｍ０为离子质量的理论值；
二级谱中片段离子理论与实际差异最大允许值
粘贴蛋白序列：PGYRNNVVN TMRLWSAKAPNDFNLKDFNVG
选择“Only the following selection of enzymes and chemicals”，并选择胰酶Trypsin酶切
蛋白质组学质谱分析背景介绍 APNDFNLK
蛋白质组学质谱分析背景介绍
v Alanine
开始>运行>输入“cmd” 开启命令行窗口
Download:/project/d
ownloading.php?group_id=69281&use_mirror=jai st&filename=ReAdW_2006Nov01.exe&40300388
2. 编辑参数
Threonine
T
101.10
Selenocysteine
U
150.03
Tryptophan
W
186.21
Tyrosine
Y
163.18
Valine
V
99.13
蛋白质组学质谱分析背景介绍
蛋白质组学质谱分析背景介绍
蛋白质组学质谱分析背景介绍
目前人类已知蛋白大约有6万8千种平均每种蛋白长度为500个氨基酸平均每种蛋白可以胰切成50个肽段平均每个肽段有10种可能打碎情况每一种可能情况产生一张理论图谱平均一次质谱实验有3000次扫描每一次扫描产生一张质谱谱图 ???面对如此多的质谱谱图和理论图谱我们将如何进行比对

ncbi使用指导

ncbi使用指导NCBI是美国国家生物技术信息中心（National Center for Biotechnology Information）的缩写，是一个提供生物医学和遗传学相关数据和信息的数据库。

NCBI提供了许多工具和资源，以帮助研究人员在基因组学、蛋白质学、遗传学和生物信息学等领域进行研究。

以下是使用NCBI的一些基本指南：1. 访问NCBI网站：使用任何现代网络浏览器，打开NCBI的主页（https://）即可开始使用。

2. 搜索文献：在NCBI主页上的搜索框中，输入你要搜索的关键词，如基因名、疾病名或其他相关的信息。

点击“搜索”按钮，即可看到与你的搜索关键词相关的论文和研究。

3. 搜索序列：如果你希望搜索某个特定基因或蛋白质的序列，可以使用“基因”或“蛋白质”选项卡下的搜索工具。

在搜索框中输入你要搜索的序列信息，点击“搜索”按钮，即可找到与该序列相关的信息和研究。

4. 访问数据库：NCBI提供了许多数据库，如GenBank（基因组数据库）、PubMed（文献数据库）和BLAST（序列比对工具）。

你可以使用NCBI的导航菜单，选择你感兴趣的数据库进行浏览和搜索。

5. 下载数据：在NCBI的数据库中，你可以找到大量的基因组序列、蛋白质序列和其他相关数据。

你可以通过点击数据记录的链接，进入详情页，然后选择下载你需要的数据文件或信息。

6. 利用NCBI工具：NCBI还提供了一些生物信息学工具，如BLAST（序列比对工具）、Primer-BLAST（引物设计工具）和Gene Expression Omnibus（基因表达数据库）。

你可以使用这些工具进行基因序列比对、引物设计和基因表达分析等。

7. 阅读文献：NCBI的PubMed数据库是一个广泛的生物医学文献数据库，你可以使用关键词搜索文献，并阅读或下载全文。

你还可以使用PubMed Central（PMC）访问免费的全文文章。

总之，NCBI是一个丰富的生物医学信息资源，提供了许多工具和数据库，以帮助研究人员进行基因组学和生物信息学研究。

蛋白质分析相关数据库及网站

表1蛋白质相互作用分析相关数据库及网站蛋白质序列分析和结构预测【实验目的】1、掌握蛋白质序列检索的操作方法；2、熟悉蛋白质基本性质分析；3、熟悉基于序列同源性分析的蛋白质功能预测，了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测；4、了解蛋白质结构预测。

【实验内容】1、使用Entrez或SRS信息查询系统检索人脂联素（adiponectin）蛋白质序列；2、使用BioEdit软件对上述蛋白质序列进行分子质量、氨基酸组成、和疏水性等基本性质分析；3、对人脂联素蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析；4、对人脂联素蛋白质序列进行motif结构分析；5、对人脂联素蛋白质序列进行二级结构和三维结构预测。

【实验方法】1、人脂联素蛋白质序列的检索：（1）调用Internet浏览器并在其地址栏输入Entrez网址（/Entrez）；（2）在Search后的选择栏中选择protein；（3）在输入栏输入homo sapiens adiponectin；（4）点击go后显示序列接受号及序列名称；（5）点击序列接受号NP_004788 （adiponectin precursor；adipose most abundant gene transcript 1 [Homo sapiens]）后显示序列详细信息；（6）将序列转为FASTA格式保存（参考上述步骤使用SRS信息查询系统检索人脂联素蛋白质序列）；2、使用BioEdit软件对人脂联素蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析：打开BioEdit软件→将人脂联素蛋白质序列的FASTA格式序列输入分析框→点击左侧序列说明框中的序列说明→点击sequence栏→选择protein→点击Amino Acid Composition→查看该蛋白质分子质量和氨基酸组成；或者选择protein后，点击Kyte & Doolittle Mean Hydrophobicity Profile→查看该蛋白质分子疏水性水平；3、人脂联素蛋白质序列的蛋白质同源性分析：（1）进入NCBI/Blast网页；（2）选择Protein-protein BLAST （blastp）；（3）将FASTA格式序列贴入输入栏；（4）点击BLAST；（5）查看与之同源的蛋白质；4、人脂联素蛋白质序列的motif结构分析：（1）进入http://hits.isb-sib.ch/cgi-bin/PFSCAN网页；（2）将人脂联素蛋白质序列的FASTA格式序列贴入输入栏；（3）点击Scan；（4）查看分析结果（注意Prosite Profile中的motif information）；5、人脂联素蛋白质序列的二级结构预测：（1）进入下列蛋白结构预测服务器网址http://www.embl-heidelberg.de/predictprotein//predictprotein.html（The PredictProtein Server）；（2）在You can栏点击default；（3）填写email地址和序列名称；（4）将人脂联素蛋白质序列的FASTA格式序列贴入输入栏点击Submit；（5）从email信箱查看分析结果；6、人脂联素蛋白质序列的三维结构预测：（1）进入/swissmod/SWISS-MODEL.html （SwissModel First Approach Mode）网页；（2）填写email地址、姓名和序列名称；（3）将人脂联素蛋白质序列的FASTA格式序列贴入输入栏；（4）点击Send Request；（5）从email信箱查看分析结果（注：需下载软件入rasmol查看三维图象）。

常用的生物数据库(二)

常用的生物数据库（二）引言概述：生物数据库是生物信息学领域的重要工具，可以帮助研究人员存储、管理和共享生物数据。

本文将介绍常用的生物数据库（二），以便研究人员更好地利用这些资源进行生物学研究。

正文内容：一、蛋白质相互作用数据库1. STRING数据库：提供蛋白质相互作用预测和注释功能。

2. IntAct数据库：收集整理蛋白质相互作用数据，提供数据检索和分析工具。

3. BioGRID数据库：整合多种物种的蛋白质相互作用数据，并提供丰富的功能注释。

二、基因组数据库1. GenBank数据库：包含大量的序列数据，包括基因组、转录本和蛋白质序列等。

2. ENSEMBL数据库：集成了各种生物信息学工具，提供全面的基因组注释信息。

3. UCSC数据库：基于人类基因组构建的浏览器，提供详细的基因组注释和可视化功能。

三、表达谱数据库1. GEO数据库：收集了大量的基因表达谱数据，可进行数据检索和分析。

2. ArrayExpress数据库：包含了来自各种高通量技术的表达谱数据，提供数据下载和分析工具。

3. TCGA数据库：整合了多种癌症的基因表达数据，可进行差异表达和生存分析等研究。

四、突变数据库1. dbSNP数据库：记录了常见的单核苷酸多态性（SNP）数据，是研究遗传变异的重要资源。

2. COSMIC数据库：专注于癌症相关的突变数据，包含了大量的突变谱系和功能注释信息。

3. ClinVar数据库：整合了与人类疾病相关的遗传变异数据，提供临床相关的注释信息。

五、药物数据库1. DrugBank数据库：收录了大量的药物信息，包括结构、作用机制和药理学数据等。

2. PubChem数据库：提供了大量的小分子化合物数据，可进行化学结构搜索和药物筛选等研究。

3. ChEMBL数据库：整合了化合物活性数据和药物靶点信息，可用于药物发现和优化。

总结：生物数据库为生物学研究提供了丰富的数据资源和分析工具。

蛋白质相互作用数据库、基因组数据库、表达谱数据库、突变数据库和药物数据库是常用的生物数据库之一。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

蛋白质组学常用的网站和数据库蛋白质组学研究中常用的网站和数据库蛋白质, 数据库, 研究本帖引用网址：一、蛋白质数据库1.UniProt (The Universal Protein Resource)网址：简介：由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成，提供详细的蛋白质序列、功能信息，如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等，同时提供其他数据库，包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。

2.PIR(Protein Information Resource)网址：简介：致力于提供及时的、高质量、最广泛的注释，其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort，与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。

3.BRENDA(enzyme database)网址：简介：酶数据库，提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。

4.CORUM(collection of experimentally verified mammalian protein complexes)网址：简介：哺乳动物蛋白复合物数据库，提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database)网址：简介：环状蛋白数据库，提供环状蛋白的序列、结构等数据，提供环化蛋白预测服务。

6.DB-PABP网址：简介：聚阴离子结合蛋白数据库。

聚阴离子结合蛋白与聚阴离子的互作在胞内定位、运输、蛋白质折叠等生命过程中起重要作用，此外许多与神经衰退疾病相关的蛋白质均为聚阴离子结合蛋白。

该数据库提供已被鉴定的聚阴离子结合蛋白的数据，与NCBI蛋白数据库存在交叉应用。

7.IUPHAR-DB网址：简介：G蛋白偶联受体、离子通道数据库。

提供这些蛋白的基因、功能、结构、配体、表达图谱、信号转导机制、多样性等数据。

8.GLIDA网址：简介：G蛋白偶联受体-配体数据库，提供G蛋白偶联受体-配体互作数据、配体数据、G蛋白偶联受体数据、同源受体关系网、保守识别区，为新药发现提供了支持。

9.LOCATE网址：简介：哺乳动物蛋白质亚细胞定位数据库10.InterPro网址：简介：蛋白质综合数据库，从大量的数据库中整合而成的包括蛋白质结构域、蛋白质家族、功能位点等信息的数据库。

11.OKCAM网址：简介：人体细胞粘附分子数据库。

二、蛋白质组数据库1.GELBANK网址：简介：提供全基因组的二维凝胶电泳图谱，搜集了已知基因组信息生物的蛋白质组二维凝胶电泳图。

可通过描述相对分子质量、等电点和蛋白质序列信息进行快速检索。

2.SWISS-2DPAGE网址：简介：提供人类、小鼠、大肠杆菌、酿酒酵母、盘基网柄菌的2D-PAGE参考图。

3.SysPIMP(Systematical Platform for Identifying Mutated Proteins)网址：简介：通过质谱技术建立的蛋白质突变数据库。

当蛋白质某一氨基酸残基发生改变时，其质谱图也会发生改变，通过蛋白质质谱图的改变，检测与疾病相关的突变。

4.Sys-BodyFluid网址：简介：人体体液蛋白组研究数据库。

提供人体各种体液的蛋白质组数据，包括血浆/血清、尿液、乳汁、泪、汗液、唾液、骨髓液、脑脊液、胃液等。

5.BloodExpress网址：简介：小鼠造血过程基因表达数据库6.CentrosomeDB(human centrosomal proteins database)网址：简介：人体中心体蛋白数据库7.ConsensusPathDB网址：简介：人类功能作用网络数据库，与多个数据库有交叉应用，提供蛋白质互作、生化反应、基因调控等作用网数据。

8.Proteome Analysis Database网址：简介：蛋白质组分析数据库10.HPRD(Human Protein Reference Database)网址：简介：人体蛋白文献数据库11.NOPdb网址：简介：核仁蛋白组数据库12.EndoNet网址：简介：细胞通讯网络数据库，提供激素、激素受体相关信息三、蛋白质互作、蛋白质网络数据库1.3DID(3D interacting domains)网址：简介：搜集3D结构已知的蛋白质的互作信息，可通过结构域名称、基序名称、蛋白质序列、GO编码、PDB ID、Pfam编码进行检索。

2.DOMINE网址：简介：结构域互作数据库。

3.PiSite(Database of Protein interaction sites)网址：简介：以PDB为基础，在蛋白质序列中搜寻互作位点。

4.Binding MOAD网址：简介：致力于提供蛋白质-配体晶体结构数据信息。

提供结构已知的蛋白质的相关配体，并附有详细注释，同时提供由实验而得的亲和力数据。

5.Phospho.ELM网址：简介：蛋白质磷酸化位点数据库6.SuperSite网址：简介：蛋白质中代谢物、药物结合位点数据库，提供结合机制、识别机制、保守结合位点等信息。

7.STITCH网址：简介：蛋白质-化合物作用网数据库8.Reactome网址：简介：人体生命活动路径与过程数据库，提供生化过程网络图，并对参与其中的蛋白质分子有详细注解，与其他数据库如UniPort、KEGG、OMIM等建立了广泛的交叉应用。

9.PID(Pathway Interaction Database)网址：简介：由NCI和Nature共同创立，提供已知的人体细胞信号转导、调节活动及主要细胞生命过的蛋白质路径网，可通过输入某个分子名或代谢过程名称进行查询。

10.UniHI(Unified Human Interactome database)网址：简介：人体蛋白-蛋白相互作用数据库，可根据蛋白质名称、代谢路径等进行查询。

11.VirHostNet网址：简介：病毒-宿主分子互作网数据库，提供病毒-宿主蛋白质互作信息及这些蛋白质的相关注释。

可通过输入基因、蛋白质、路径等关键词进行查询。

12.Bionemo(molecular information on biodegradation metabolism)网址：简介：搜集与生物降解代谢相关的蛋白质、基因数据，包括蛋白质序列、结构域、结构；基因序列、调控元件、转录单元等信息。

除此之外还包括生物降解的代谢路径图、相关生化反应等。

13.PMAP网址：简介：蛋白质水解路径数据库四、蛋白质三维结构数据库1.PDB(Protein Data Bank)网址：简介：生物大分子结构数据库，提供蛋白质、核酸等生物大分子的三维结构数据、序列详细信息、生化性质等。

2. SARST (Structural similarity search Aided by Ramachandran Sequential Transformation)网址：简介：高效的蛋白质结构比对数据库五、蛋白质基序数据库1. CDD(Conserved Domain Database)网址：简介：蛋白质的功能与其结构密切相关，一个蛋白质的保守结构域在一定程度上体现了该蛋白质的功能。

CDD，蛋白质保守结构域数据库，收集了大量保守结构域序列信息和蛋白质序列信息。

检索者通过CD-Search服务，可获得蛋白质序列中所含的保守结构域信息，从而分析、预测该蛋白质的功能。

2.Blocks网址：简介：蛋白家族保守区对比数据库3.CPDB(database of circular permutation in proteins)网址：cpdb简介：蛋白质环形序列重组基序数据库。

蛋白质的环形序列重组(Circular permutation, or CP)可看作是原来的N与C端被接在一起，然后在另一处产生新开口。

虽然当前已有很多知名的蛋白质家族被发现有CP成员，而且也有研究指出蛋白质结构资料库中可能存在着不少CP实例，高效率的CP搜寻工具却很罕见。

CPSARST提供了一套有效的CP搜寻工具。

4.MegaMotifbase网址：简介：蛋白质基序家族、超家族数据库，提供已知基序的3D定位图、转角距等数据。

5.Minimotif Miner网址：简介：蛋白质基序检测数据库，提供在蛋白质序列中寻找基序的服务。

6.Pfam网址：简介：提供多序列比对服务和并提供共同的蛋白质结构域的隐马尔可夫模型。

六、预测类数据库1.InterPreTS(Interaction Prediction through Tertiary Structure)网址：简介：提供通过三级结构预测蛋白质相互作用的服务，可输入两个蛋白质的序列信息进行查询。

2.Predictome网址：简介：预测蛋白质间功能关系的数据库。

这些蛋白质间的关系是基于将3种计算机预测法，即染色体相邻法、系统发育谱法、结构域融合法应用与44个基因组上而得到的。

参考文献：Nucleic Acids Research, 2009, Vol. 37, Database issueNucleic Acids Research, 2008, Vol. 36, Database issuePs：《Nucleic Acids Research》每年第一期是分子生物学数据库专刊，综述当前的分子生物学在线数据库。

期刊主页：。

蛋白质组学常用的网站和数据库

合集下载

Uniprot数据库介绍及信息检索下载指南

蛋白质数据库

蛋白质数据库

生命科学中最常用的5个数据库介绍

蛋白质序列数据库

蛋白质组学研究中常用的网站和数据库

蛋白质组学数据统计分析软件

ncbi使用指导

蛋白质分析相关数据库及网站

常用的生物数据库(二)

文档推荐

最新文档