NCBI分子数据库介绍
- 格式:doc
- 大小:38.50 KB
- 文档页数:3
NCBI (National Center for Biotechnology Information), 美国国家生物技术信息中心[url]/[/url]NCBI是NIH的国立医学图书馆(NLM)的一个分支。
NCBI提供检索的服务包括:1.GenBank(NIH遗传序列数据库):一个可以公开获得所有的DNA序列的注释过的收集。
GenBank是由NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库的。
它同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。
这三个组织每天交换数据。
其中的数据以指数形式增长,最近的数据为它已经有来自47000个物种的30亿个碱基。
2.Molecular Databases(分子数据库):Nucleotide Sequence(核酸序列库):从NCBI其他如Genbank数据库中收集整理核酸序列,提供直接的检索。
Protein Sequence (蛋白质序列库):与核酸类似,也是从NCBI多个不同资源中编译整理的,方便研究者的直接查询。
Structure(结构)-——关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问三维蛋白质结构的分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。
MMDB:分子模型数据库—一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。
Taxonomy(分类学)——NCBI的分类数据库,包括大于7万余个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。
其目的是为序列数据库建立一个一致的种系发生分类学。
3.Literature Databases(文献数据库)(1)PubMed是NLM提供的一项服务,能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问,并可以连接到参与的出版商网络站点的全文文章和其他相关资源。
ncbi使用指导摘要:一、NCBI简介1.NCBI的定义与作用2.NCBI的主要数据库二、NCBI数据库的使用1.基因数据库1.1 基因序列数据库1.2 基因表达数据库1.3 基因调控数据库2.蛋白质数据库2.1 蛋白质序列数据库2.2 蛋白质结构数据库3.核酸序列数据库3.1 核酸序列数据库概述3.2 核酸序列数据库的使用方法4.文献数据库4.1 PubMed简介4.2 如何利用PubMed进行文献检索三、NCBI工具的使用1.基因芯片数据分析工具2.基因序列比对工具3.蛋白质结构预测工具四、NCBI的进阶使用技巧1.如何利用NCBI进行基因注释2.如何利用NCBI进行基因家族分析3.如何利用NCBI进行共表达网络分析正文:一、NCBI简介CBI(National Center for Biotechnology Information,美国国家生物技术信息中心)是一个提供生物信息学资源的网站,它为全球科研工作者提供了大量的生物学数据和工具。
NCBI的主要数据库包括基因数据库、蛋白质数据库、核酸序列数据库和文献数据库等。
二、NCBI数据库的使用1.基因数据库基因数据库包括基因序列数据库、基因表达数据库和基因调控数据库。
基因序列数据库提供了大量的基因序列信息,用户可以通过关键词搜索、序列相似性搜索等方式找到需要的基因序列。
基因表达数据库则提供了基因在不同生物体、不同组织、不同发育阶段的表达信息。
基因调控数据库则包含了基因调控相关的信息,如启动子、转录因子结合位点等。
2.蛋白质数据库蛋白质数据库包括蛋白质序列数据库和蛋白质结构数据库。
蛋白质序列数据库提供了蛋白质的氨基酸序列信息,用户可以通过序列相似性搜索找到相似的蛋白质序列。
蛋白质结构数据库则提供了蛋白质的三维结构信息,用户可以通过结构域、功能域等关键词搜索需要的蛋白质结构。
3.核酸序列数据库核酸序列数据库包括DNA序列数据库和RNA序列数据库。
NCBI功能详介NCBI(National Center for Biotechnology Information)是美国国家生物技术信息中心,是全球最大的生物信息学数据库之一,也是生物医学研究领域最重要的资源之一、NCBI提供了广泛的生物学和医学数据库和工具,以帮助科学家们进行基因组学、蛋白质学、遗传学、药物研发等方面的研究。
NCBI的主要功能包括:1. PubMed:NCBI的PubMed是最大的生物医学文献数据库。
它收录了全球范围内的生物医学文献,并提供了非常强大的功能,以帮助科学家们找到自己感兴趣的论文。
3. BLAST:BLAST(Basic Local Alignment Search Tool)是NCBI 提供的一种重要的生物信息学工具。
它可以用来比对生物序列(如DNA、RNA或蛋白质序列),以找到相似的序列或已知的序列。
BLAST对生物学研究非常重要,可以用于序列比对、功能注释、物种分类等各种应用。
4. Entrez数据库:Entrez是NCBI提供的一种综合性数据库工具,可以用来访问和多个数据库,如PubMed、GenBank、Protein、Nucleotide等。
用户可以使用Entrez来查找和获取各种类型的生物学数据,如文献、序列、蛋白质结构等。
5. PubChem:PubChem是一个提供生物化学信息的数据库,包含大量的有关化合物的实验数据、化学结构、药物作用等信息。
它可以帮助研究人员进行药物发现、化合物筛选和毒性评估等方面的研究。
6. dbSNP:DBSNP(Single Nucleotide Polymorphism Database)是一个用于存储和查询单核苷酸多态性数据的数据库。
它收集了全球范围内各种不同物种的单核苷酸变异信息,包括单核苷酸变异的位点、变异类型、频率等。
7. GEO:GEO(Gene Expression Omnibus)是一个用于存储和共享基因表达数据的数据库。
分子生物学相关数据库Entrez由NCBI开发的一个数据库检索系统,它综合了下述各大数据库的信息,包括核酸、蛋白以及Medline 文摘数据库,在这三个数据库中建立了非常完善的联系。
因此,可以从一个序列查询到蛋白产物以及相关的结构、功能和文献信息,详见NCBI(美国国立生物技术信息中心) 简介。
EBI欧洲生物信息学研究所(European Bioinformatics Institute,EBI)是EMBL的分部,位于英国Hinxton 的Wellcome Trust Genome Campus。
EBI维护和发布的数据库:✓EMBL核酸数据库、欧洲原始核酸数据资源库✓SwissProt蛋白质序列数据库[与瑞士生物信息学协会(Swiss Institute for Bioinformatics,SIB)的Amos Bairroch合作]✓TrEMBL(SwissProt的附属数据库,由EMBL数据库编码序列翻译而来的蛋白质序列数据库)✓分子结构数据库(Molecular Structure Database,MSD)[与Brookhaven 国家实验室(纽约)的蛋白质三维结构数据库(Protein Data Bank,PDB)合作]✓放射杂交数据库(Radiation Hybrid database,RHdb)✓其他组织合作产生的分子生物学数据库:EBI还提供网络服务,通过互联网、其WEB界面和FTP服务器可以访问最新收集到的数据,同时也提供数据库和序列相似性的搜索工具。
核酸数据库:GenBankGenBank是NIH的基因序列数据库,由美国国立卫生研究院全国生物技术信息中心(NCBI)建立并维护,是所有公开的DNA序列的集合( Nucleic Acids Research 1998 Jan 1;26(1):1-7),GenBank包含所有已知的核苷酸及蛋白质序列、以及与之相关的生物学信息和参考文献,是世界上的权威序列数据库。
NCBI分子生物学数据库网络生物医学1. 引言生物医学研究的进展离不开大量的数据资源和分析工具的支持。
NCBI (National Center for Biotechnology Information) 是一个旨在促进生物信息学和分子生物学研究的重要组织。
它提供了多个分子生物学数据库,这些数据库存储了大量的生物信息学数据,并提供了丰富的分析工具,以帮助科学家进行生物医学研究。
本文将介绍一些常用的NCBI分子生物学数据库及其在网络生物医学研究中的应用。
2. NCBI基因数据库2.1 GenBankGenBank 是全球最大的基因序列数据库之一,它存储了大量的DNA和RNA序列数据。
研究者可以通过GenBank访问到已被发表的基因序列数据,以及一些未发表的序列数据。
这些数据对于研究基因功能、生物进化以及人类疾病等方面都非常重要。
2.2 RefSeqRefSeq (Reference Sequence) 是一个注释完整的、高质量的基因序列数据库。
与GenBank不同,RefSeq仅收录了经过验证且与蛋白质对应的基因序列,这使得研究者可以更加准确地进行基因结构和功能的研究。
RefSeq还提供了基因组、转录组和蛋白质序列的相关信息。
2.3 dbSNPdbSNP (database of Single Nucleotide Polymorphisms) 存储了人类和其他物种中的单核苷酸多态性数据。
这些多态性位点是基因组中常见的变异,对于人类疾病的研究和个体之间的遗传差异分析非常重要。
dbSNP收集了来自各种来源的单核苷酸多态性数据,包括人类单核苷酸多态性计划 (HapMap) 和千人基因组计划 (1000 Genomes Project)。
3. NCBI蛋白质数据库3.1 UniProtUniProt 是全球最大的蛋白质序列和注释数据库。
它整合了来自不同来源的蛋白质序列数据和相关的注释信息。
UniProt 提供了蛋白质序列、结构、功能、亚细胞定位和表达等方面的详细信息,帮助研究者理解蛋白质的结构和功能。
一:NCBI简介NCBI的GenBank与DDBJ(DNA Data Bank of Japan)、EMBL的EBI数据库共同组成国际DNA 数据库,每日都交换更新数据和信息,并主持两个国际年会-国际DNA数据库咨询会议和国际DNA数据库协作会议,互相交换信息,因此三个库的数据实际上是相同的。
GenBank 有来自于70,000多种生物的核苷酸序列。
每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。
(是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划( Benson等,1998)。
Entrez 是美国国家生物技术信息中心所提供的在线资源检索器。
该资源将GenBank序列与其原始文献出处链接在一起。
Entrez 是由NCBI主持的一个数据库检索系统。
它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。
因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。
)DDBJ主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,亦接受其他国家呈递的序列。
EBI的主要任务:⑴为科学界建立和维护生物学数据库,提供免费的数据和生物信息服务,支持生物学数据的存储和挖掘,促进科技进步;⑵通过生物信息学的基础研究继续推动生物学发展;⑶为各个层次的科学工作者提供生物信息学培训;⑷支持帮助边缘尖端科技成果向工业界的转化;⑸协调欧洲生物数据的提供。
RefSeq是NCBI数据库的参考序列。
RefSeq资料库是NCBI将GenBank的序列再做详细整理的non-redundent序列资料库,它的序列格式和GenBank几乎完全相同,但因为是完全不同的独立资料库,为与GenBank区别,RefSeq的Accession Number格式和GenBank不同。
NCBI的数据库资源及其应用随着生物技术的飞速发展,生物信息学已经成为当今科学研究的重要领域之一。
NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)作为世界领先的生物信息学机构之一,为广大科研人员提供了海量的生物信息学数据库资源。
本文将深入探讨NCBI的数据库资源及其在教育、科研和临床诊断等领域的应用。
NCBI拥有多种类型的数据库资源,包括核酸数据库、蛋白质数据库以及其他功能数据库等。
其中,最为著名的是GenBank核酸数据库,该数据库包含了全球范围内最新、最全面的核酸序列信息。
NCBI还拥有UniProte同心圆蛋白质数据库,这是全球最大的蛋白质序列数据库之一。
除此之外,NCBI还提供了一系列的实用工具和在线分析软件,帮助科研人员更好地处理和解析这些生物信息学数据。
在教育领域,NCBI的数据库资源发挥着重要的作用。
学生和教师可以通过NCBI的数据资源了解最新的生物医学研究成果,学习和研究生物信息的获取、处理和分析。
例如,学生可以使用NCBI的序列检索工具BLAST来查找特定的序列,并使用在线工具进行生物信息学分析。
在科研领域,NCBI的数据库资源为研究者提供了强有力的支持。
科研人员可以利用NCBI的数据资源进行基因组学、蛋白质组学、代谢组学等方面的研究。
例如,科学家可以使用GenBank数据库查找某种特定基因的序列,利用BLAST工具进行序列比对,进而研究物种间的亲缘关系和进化历程。
在临床诊断领域,NCBI的数据库资源同样具有广泛的应用价值。
医生可以利用NCBI的数据库资源进行病原菌检测、疾病诊断和治疗等方面的研究。
例如,医生可以通过访问GenBank数据库,查找导致疾病发生的病原菌基因序列,进而通过序列比对确定病原菌的种类和变异情况,为制定治疗方案提供依据。
NCBI的数据库资源在教育、科研和临床诊断等领域均发挥着重要作用。
⽣物数据库介绍——NCBINCBI(National Center for Biotechnology Information,美国国家⽣物技术信息中⼼)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源。
NCBI资源包括Entrez、Entrez编程组件、MyNCBI、PubMed、PudMed Central、PubReader、Gene、the NCBI Taxonomy Browser、BLAST、Pimer-Blast、COBALT、RefSeq、UniGene、HomoloGene、ProtEST、dbMHC、dbSNP、dbVar、Epigenomics、the Genetic Testing Registry、Genome和相关⼯具、⽐对查看器、跟踪存档、Sequence Read Archive、BioProject、BioSample、ClinVar、MedGen、HIV-1/⼈类蛋⽩质相互作⽤数据库、Gene Expression Omnibus、Probe、Online Mendelian Inheritance in Animals、the Molecular Modeling Database、the Conserved Domain Database、the Conserved Domain Architecture Retrieval Tool、Biosystem、Protein Clusters and thePubChem suite of small molecule databases,所有这些资源可以在NCBI主页找到。
Databases⼀个提供有关基因组组装结构,装配名称和其他元数据,统计报告以及基因组序列数据链接等信息的数据库。
⼀个有关培养物、动植物样本和其他⾃然样本的精选元数据集。
记录显⽰样本状态,有关馆藏的机构的信息,以及NCBI中相关数据链接。
NCBI数据库的使用与功能介绍NCBI (National Center for Biotechnology Information)数据库是世界上最大的生物信息学数据库之一,旨在为全球科学家提供生物学、生物化学、生物物理学和生物医学研究的数据和工具。
该数据库包含了来自各种生物学研究领域的大量数据,包括基因组序列、蛋白质序列、文献引用、医学图像和结构信息等。
NCBI数据库的使用和功能非常多样化,本文将介绍其中的一些主要功能。
一、检索和浏览数据NCBI数据库提供了强大的功能,可以帮助用户检索和浏览各种生物学数据。
用户可以使用关键词、序列、ID或其他查询方式来感兴趣的信息。
例如,用户可以通过基因组序列、蛋白质序列或特定生物物种来查找相关的数据。
二、基因组和基因信息NCBI数据库中包含大量的基因组序列和基因信息,包括人类和其他生物物种的基因组数据。
用户可以使用NCBI数据库来特定基因的相关信息,如基因序列,基因表达数据,蛋白质序列,基因功能和遗传变异等。
此外,NCBI数据库还提供了对基因组浏览器的访问,可以帮助用户在特定基因组上查看和分析基因注释和结构信息。
三、蛋白质信息NCBI数据库也包含了大量的蛋白质序列和相关信息。
用户可以使用NCBI数据库来特定蛋白质的相关信息,如蛋白质序列,结构信息,功能注释,亚细胞定位和表达水平等。
此外,用户还可以使用NCBI数据库中提供的BLAST工具来进行蛋白质序列比对和相似性,以帮助识别新的蛋白质序列。
四、文献和引用NCBI数据库中包含了大量的科学文献引用和摘要信息。
用户可以使用PubMed工具来特定主题的科学文献,并查看摘要和全文。
此外,用户还可以使用PubMed工具来查找相关文献的引用信息,以帮助了解和分析科学研究领域的发展趋势。
五、医学图像和结构信息NCBI数据库还提供了医学图像和结构信息的访问,帮助用户了解各种疾病和病理过程的图像和结构特征。
用户可以使用NCBI数据库来和浏览医学图像数据库,如CT扫描、MRI图像和遗传学图像等。
NCBI在线blast数据库说明Peptide Sequence Databases蛋白序列的数据库nrAll non-redundant GenBank CDS translations + RefSeq Proteins + PDB + SwissProt + PIR + PRF 所有非冗余的的GenBank CDS区的翻译序列+ 参考序列的蛋白+ PDB数据库+ SwissProt 蛋白数据库+ PRF蛋白数据库refseqRefSeq protein sequences from NCBI's Reference Sequence Project.所有NCBI的参考序列swissprotLast major release of the SWISS-PROT protein sequence database (no updates).swissprot的蛋白数据库patProteins from the Patent division of GenPept.专利的蛋白数据库pdbSequences derived from the 3-dimensional structure from Brookhaven Protein Data Bank.PDB数据库monthAll new or revised GenBank CDS translation+PDB+SwissProt+PIR+PRF released in the last 30 days.一个月内新增加的蛋白序列env_nrProtein sequences from environmental samples.来自environmental samples的蛋白序列Nucleotide Sequence Databases核酸数据库nrAll GenBank + RefSeq Nucleotides + EMBL + DDBJ + PDB sequences (excluding HTGS0,1,2, EST, GSS, STS, PA T, WGS). No longer "non-redundant".所有GenBank的核酸序列+ 参考序列中的核酸序列+ EMBL +DDBJ +PDB核酸序列(但不包括HTG,EST,GSS等序列)refseq_rnaRNA entries from NCBI's Reference Sequence projectNCBI参考序列中的核酸序列refseq_genomicGenomic entries from NCBI's Reference Sequence projectNCBI参考序列中的基因组序列estDatabase of GenBank + EMBL + DDBJ sequences from EST Divisions来自GenBank + EMBL + DDBJ 的EST序列est_humanHuman subset of est.人的EST序列est_mouseMouse subset.小鼠的EST序列est_othersNon-Mouse, non-Human subset of est.、除了人与小鼠之外的EST序列gssGenome Survey Sequence, includes single-pass genomic data, exon-trapped sequences, and Alu PCR sequences.htgsUnfinished High Throughput Genomic Sequences: phases 0, 1 and 2 (finished, phase 3 HTG sequences are in nr)未发布的高通量的基因组测序patNucleotides from the Patent division of GenBank.专利的核酸序列pdbSequences derived from the 3-dimensional structure from Brookhaven Protein Data BankPDB核酸序列monthAll new or revised GenBank + EMBL + DDBJ + PDB sequences released in the last 30 days.一个月内新增的核酸序列dbstsDatabase of GenBank+EMBL+DDBJ sequences from STS Divisions .STS数据库chromosomeA database with complete genomes and chromosomes from the NCBI Reference Sequence project..NCBI参考序列计划中所有的完整基因组和染色体序列wgsA database for whole genome shotgun sequence entries.基因组鸟枪法测序得到的序列env_ntNucleotide sequences from environmental samples, including those from Sargasso Sea and Mine Drainageprojects.来自environmental samples的核酸序列。
美国国家生物技术信息中心(National Center of Biotechnology Information)唐志立它的使命包括四项任务:1. 建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统2. 实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究3. 加速生物技术研究者和医药治疗人员对数据库和软件的使用。
山东师范大学2016年4月10日星期日30则留学生经典笑话,英语不好伤不起!凭你在国内口语练得多么娴熟,去了国外,照样有犯痴呆傻的时候!1、有次房东问我:did u eat anyting yet? 我说:no.她听后重复了一遍:so u didn’t eat anyting. 我说:yes.房东老太太犹豫了下又问:did u eat? 我说:no.她接着说:so u didn’t eat. 我说:yes. 估计她当时要崩溃了……2、刚上班不久,有个公司的A/R打电话来催支票,我循例问了一下他是哪间公司打来的,那男的很有礼貌的说:This is xxx calling from Beach Brother.听懂了很开心,不过由于对公司名字还不熟,心想先用笔记下来公司名,省得等下忘记了,正得意忘形之间,顺嘴开始拼写人家公司的名字,还说得一本正经:b.i.t.c.h.bitch, correct? 那男的终于还是没能忍住怒火,近似于怒吼似的对我喊道:NO!B.E.A.C.H.BEACH! 接下来的一年里,没再跟这间公司有过任何生意往来……3、我男朋友以前在温哥华乘skytrain 的时候,一个白人女人说:I am sorry. 他直接说:you are welcome. 对方都呆了。
4、第一次跟老外去打painball,玩的是抢旗的那种。
由于第一次玩,一直跟着个看起来很专业的队友跑,一路上躲着子弹跑到对方的base. 我们人都挂了,对方就剩一个人在看老家,就听那老外跟我说了一大堆术语,我也没听懂。
NCBI数据库集生物信息学 2010-08-20 16:08:59 阅读202 评论0字号:大中小订阅NCBI数据库集/?p=20049一综合数据库NCBI数据库集美国国立生物技术信息中心(National Center for Biotechnology Information),即我们所熟知的NCBI是由美国国立卫生研究院(NIH)于1988年创办。
创办NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统。
除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。
目前,NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能,而且都可以在NCBI的主页上找到相应链接,其中多半是由BLAST功能发展而来的。
1 NCBI最新进展1.1 PubMed搜索功能的增强去年,NCBI对PubMed进行了几项改进工作,改动最大的是搜索界面和摘要浏览界面。
其中,搜索界面中新增了“Advanced Search”选项(这实际上是对以往“Limits”和“Preview/Index”功能的整合),并且增加了一个新的窗口,用户可以在此窗口下通过“论文作者名”、“论文所属杂志名称”、“论文出版日期”等限定条件进行搜索。
而且,“论文作者名”和“论文所属杂志名称”还设有文本框自动填充功能。
现在,在PubMed数据库中进行文本搜索的同时还可以立即通过两个“内容传感器(content sensors)”进行分析。
NCBI (National Center for Biotechnology Information), 美国国家生物技术信息中心[url]/[/url]NCBI是NIH的国立医学图书馆(NLM)的一个分支。
NCBI提供检索的服务包括:1.GenBank(NIH遗传序列数据库):一个可以公开获得所有的DNA序列的注释过的收集。
GenBank是由NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库的。
它同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。
这三个组织每天交换数据。
其中的数据以指数形式增长,最近的数据为它已经有来自47000个物种的30亿个碱基。
2.Molecular Databases(分子数据库):Nucleotide Sequence(核酸序列库):从NCBI其他如Genbank数据库中收集整理核酸序列,提供直接的检索。
Protein Sequence (蛋白质序列库):与核酸类似,也是从NCBI多个不同资源中编译整理的,方便研究者的直接查询。
Structure(结构)-——关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问三维蛋白质结构的分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。
MMDB:分子模型数据库—一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。
Taxonomy(分类学)——NCBI的分类数据库,包括大于7万余个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。
其目的是为序列数据库建立一个一致的种系发生分类学。
3.Literature Databases(文献数据库)(1)PubMed是NLM提供的一项服务,能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问,并可以连接到参与的出版商网络站点的全文文章和其他相关资源。
NCBI分子数据库介绍
信息来源:中国生命科学论坛更新时间:2003-10-12 2:33:00
核酸序列(nucleotides)
·Entrez核酸- 用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索核酸序列记录(在GenBank + PDB中)。
更多的关于Entrez的信息见下。
如果要检索大量数据,也可使用Batch Entrez (批量Entrez)。
·RefSeq - NCBI数据库的参考序列。
校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。
Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。
·dbEST - 表达序列标签数据库,短的、单次(测序)阅读的cDNA序列。
也包括来自于差异显示和RACE实验的cDNA序列。
·dbGSS -基因组调查序列的数据库,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC 末端,及其他。
·dbSTS -序列标签位点的数据库,短的在基因组上可以被唯一操作的序列,用于产生作图位点。
·dbSNP - 单核苷酸多态性数据库,包括SNPs,小范围的插入/缺失,多态重复单元,和微卫星变异。
完整的基因组
·参见Genome 和Maps 部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。
·UniGene - 被整理成簇的EST和全长mRNA 序列,每一个代表一种特定已知的或假设的人类基因,有定位图和表达信息以及同其它资源的交叉参考。
序列数据可以以cluster 形式在Unigene 网页下载,完整的数据可以从FTP站点repository/UniGene 目录下下载。
1.奶牛UniGene
2.人类UniGene
3.小鼠UniGene
4.大鼠UniGene
5.斑马鱼UniGene
·BLAST - 将你的序列同核酸库中的的序列比较,检索相似的序列。
(更详细的信息见下面Tools/Sequence 相似搜索部分)
蛋白序列(proteins)
· Entrez蛋白-用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索蛋白序列记录(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。
更多的关于Entrez的信息见下。
如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。
·RefSeq - NCBI数据库的参考序列。
Curated, 非冗余集合包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。
Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。
·FTPGenPept - 下载"genpept.fsa.Z"文件,这个文件包含了从GenBank/EMBL/DDBJ记录中翻译过来的FASTA 格式的氨基酸序列,这些记录都有一到两个CDS特性的描述。
·Conserved Domain Database (CDD) - 蛋白质经常包含若干模块或域,每个有不同的进化源及功能。
CD-Search 服务可用来标记保存域中的蛋白质序列。
完整的基因组
·参见Genome 和Maps 部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。
·Entrez基因组- 提供了一个编码区的概要和各种物种的分类表(TaxTable)。
编码区概要列出了在基因组中所有的的蛋白,并提供链接到FASTA文件和BLAST。
分类表总结了蛋白BLAST分析的结果,建议他们的可能功能,并用颜色编码的图来显示物种同其它物种之间的关系(参见下面'Genomes和Maps,'部分Entrez基因组的一般描述)
·FTP基因组蛋白- 从ftp站点的genbank/genomes目录下下载各种物种的FASTA格式的氨基酸序列*.faa和蛋白表文件*.ptt。
参见readme文件。
蛋白表也可以在Entrez基因组中看到。
·PROW - Web上的蛋白资源,关于大约200种人类的CD细胞表面分子的简短官方向导。
互相检索,为每个CD 抗原提供大约20中标准信息的分类(生化功能,配体,等等)
·BLAST - 将你的序列同蛋白库中的的序列比较,检索相似的序列。
(更详细的信息见下面Tools/Sequence 相似搜索部分)
结构(structures)
·结构主页- 关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。
·MMDB:分子模型数据库- 一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。
MMDB是来源于Brookhaven蛋白数据库(PDB)三维结构的一部分,排除了那些理论模型。
MMDB重新组织和验证了这些信息,从而保证在化学和大分子三维结构之间的交叉参考。
数据的说明书包括生物多聚体的空间结构,这个分子在化学上是如何组织的,以及联系两者的一套指针。
利用将化学,序列,和结构信息整合在一起,MMDB 计划成为基于结构的同源模型化和蛋白结构预测的资源服务。
MMDB的记录以ASN.1格式存储,可以用Cn3D, Rasmol, 或Kinemage来显示。
另外,数据库中类似的结构已经被用VAST确认,新的结构可以用VASTsearch 来同数据库进行比较。
·Cn3D - "See in 3-D",一个用于NCBI数据库的结构和序列相似显示工具,它允许观察3-D结构和序列-结构或结构-结构同源比较。
Cn3D用起来就象你浏览器上的一个帮助工具。
· VAST - 矢量同源比较搜索工具-一个在NCBI开发的计算算法,用于确定相似的蛋白三维结构。
每一个结构的"结构邻居"都是预先计算好的,而且可以通过MMDB的结构概要页面的链接访问。
这些邻居可以用来确认那些不能被序列比较识别的远的同源性。
·VAST 搜索- 结构-结构相似搜索服务。
比较一个新解出的蛋白结构和在MMDB/PDB数据库中的结构的三维坐标。
VAST搜索计算一系列可能会被交互浏览的结构邻居,用分子图形来观察重叠和同源相似。
分类学(taxonomy)
·NCBI的分类数据库主页- 关于分类计划的一般信息,包括分类资源和同NCBI分类学家合作的外部管理者的列表。
·分类浏览器- 搜索NCBI的分类数据库,包括大于70000个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。
可以检索一个特定种或者更高分类(如属,科)的核酸,蛋白,和结构记录。
如果有新物种的序列数据被放到数据库中,这个物种就北加到(分类)数据库中。
NCBI的分类数据库的目的是为序列数据库建立一个一致的种系发生分类学。
·分类BLAST - 详细的信息见下面Tools/Sequence 相似搜索部分。