生物信息学数据库检索PPT课件

格式：ppt
大小：2.15 MB
文档页数：100

下载文档原格式

生物信息学第三章生物信息数据库及其信息检索 ppt课件

因组数据。
核酸序列数据库 GenBank（） EMBL（） DDBJ （）三个数据库每天互相交换数据 GenBank可通过NCBI的检索系统Entrez获取， Entrez集成来自主要DNA和蛋白
序列数据库的数据，包括物种、基因组、定位、蛋白结构和结构域等信息其他各种专业核酸数据库 A.非冗余参考序列数据库RefSeq B.密码子使用数据库Codon Usage Database CUTG C.基因可变剪接数据库ASDB D.转录因子数据库TRANSFAC
生物信息学数据库类型
序列数据库结构数据库功能数据库其ws、Linux或 Mac等操作系统
肤浅的百姓工具
一、序列数据库
主要收录核酸和蛋白质序列的数据库，包括由基因组计划产生的基因组及其表达序列，由基因组序列所推测的编码和非编码核酸和蛋白质序列，以及个别生物学实验中测序获得的核酸和蛋白质序列。
生物信息学第三章生物信息数据库及其信息检索
第三章生物信息数据库及其信息检索
本章主要内容
▪ 生物信息学数据库类型 ▪ 序列数据库 ▪ 结构数据库 ▪ 功能数据库 ▪ 其它专业数据库
▪ 生物信息学数据库的检索 ▪ 检索方法概述 ▪ 检索实践和案例
生物信息学数据库的地位和作用
经典生物医学实验
elegans
Borrelia burgorferi
Plasmodium falciparum
Borrelia burgorferi
Aquifex aeolicus
Neisseria meningitidis Z2491
Mycobacteriu m tuberculosis
Genome sizes in nucleotide pairs (base-pairs)

生物信息学数据库检索

– PRINTS(Protein motif fingerprint database)
/dbbrowser/PRINTS/
• 结构域数据库(families,domains,regions,sites)
– Pfam /
– 国际上专门用于处理和发布生物大分子三维结构的知识库，提供数据库的检索和下载服务，以及PDB数据文件格式和其它文档的说明，使用软件可对PDB数据库记录用多种模式显示生物大分子三维结构
• 蛋白质结构分类数据库SCOP /scop/
– 包含从PDB数据库中提取的所有结构域，并详细描述已知蛋白质结构之间的关系
第十九页，共99页。
第十九页，编辑于星期一：二十三点五十分。
二、结构数据库(核酸)
• 核酸结构数据库(NDB,
/)
– 收录核酸的晶体结构数据，包含X射线衍射和核磁共振的结果，可通过ADIT (the AutoDep Input Tool)同时将结构存储到NDB和 PDB中，提供序列号检索功能，可以用NDB或PDB的ID号检索，结果包含核酸结构的简要信息和图片
第十一页，共99页。
第十一页，编辑于星期一：二十三点五十分。
主要内容
• 生物信息学数据库类型
– 序列数据库 – 结构数据库 – 功能数据库 – 其它专业数据库
• 生物信息学数据库的检索
– 检索方法概述 – 检索实践和案例
第十二页，共99页。
第十二页，编辑于星期一：二十三点五十分。
一、序列数据库
第四页，共99页。
第四页，编辑于星期一：二十三点五十分。
大规模组学研究
• 上世纪90年代初启动人类基因组计划，短时间内产生海量生物学数据
• 随着基因组计划进行，多种相关高通量研究逐渐开展起来

生物信息学PPT课件

生物信息学在农业研究中的应用
1 2 3
作物育种
生物信息学可以通过基因组学手段分析作物的遗传变异，为作物育种提供重要的遗传资源。
转基因作物研究
通过生物信息学分析，可以了解转基因作物的基因表达和性状变化，为转基因作物的研发和应用提供支持。
农业环境监测
生物信息学可以帮助研究人员监测农业环境中的微生物群落、土壤质量等指标，为农业生产提供科学依据。
特点
生物信息学具有数据密集、技术依赖、多学科交叉、应用广泛等特点。
生物信息学的重要性
促进生命科学研究
提高疾病诊断和治疗水平
生物信息学为生命科学研究提供了强大的数据分析和挖掘工具，有助于深入揭示生命现象的本质和规律。
生物信息学在疾病诊断和治疗方面具有重要作用，通过对基因组、蛋白质组等数据的分析，有助于实现个体化精准医疗。
03 生物信息学技术与方法
基因组测序技术
基因组测序技术概述
基因组测序是生物信息学中的一项关键技术，它能够测定生物体的全部基因序列，为后续的基因组学研究提供基础数据。
测序原理
基因组测序主要基于下一代测序技术，如高通量测序和单分子测序，通过这些技术可以快速、准确地测定生物体的基因序列。
测序应用
基因组测序在医学、农业、生物多样性等多个领域都有广泛应用，如疾病诊断、药物研发、作物育种等。
生物信息学ppt课件
目录
• 生物信息学概述 • 生物信息学的主要研究领域 • 生物信息学技术与方法 • 生物信息学的应用前景 • 生物信息学的挑战与展望 • 案例分析
01 生物信息学概述
定义与特点
定义
生物信息学是一门跨学科的学科，它利用计算机科学、数学和工程学的原理、技术和方法，对生物学数据进行分析、解释和利用，以解决生物学问题。

pubmed生物学数据库ppt课件

;
35
;
36
;
37
;
38
;
39
6.4.2 PubMed检索辅助工具
三. Preview/Index(预览/索引)
Preview是对检索结果进展预览，显示检索结果的条数和检索式，用户可根据详细情况在检索提问框中用逻辑运算符组配新的检索式。适宜于各类检索概念并未十清楚确下的试探性查询。
Index列出提交的检索词在某一选取字段中，按字
IM
MEDLINE
PubMed 2021/7/12
;
3
6.2 经过PubMed可检索信息
6.2.1 Medline 6.2.2 PreMedline 6.2.3 出版商提供的书目信息
6.2.4 NCBI其它数据库的相关记录
2021/7/12
;
4
6.2.1 MEDLINE：
美国国立医学图书馆MEDLARS系统中最大的生物医学数据库。
2021/7/12
;
14
6.3 PubMed检索界面的构造
根本检索区相关数据库链接、检索
提问框
辅助检
索区
检索提示区对各项检
个性化
索功能的简单描画
检索区
Entrez简介、
PubMed效力、
特有检索、相
关资2源021/7/12
;
15
•Overview-引见PubMed的覆盖范围和刊物信息。 New/Noteworthy-关于PubMed系统更新和未来开展。
6课 PubMed生物医学数据库
内容见教材4章1节〔P59〕
目的与要求：
了解PubMed的特点，掌握运用该数据库进展课题检索的根本途径与方法。本课内容安排有实习，要求掌握检索途径与方法。

生物信息学检索系统PPT课件

搜索 ▪ 序列分子量搜索 ▪ 区域搜索 ▪ 通配符搜索
7
8
9
10
11
12
2. SRS
▪ SRS（Sequence Retrieval System）是EMBL研制的一个基于WEB的查询系统,是目前生物信息界应用最为广泛的数据库系统。
▪ SRS在中国的镜像站点建立在北京大学生物信息中心。
3
Entrez
4
/Entrez/
5
Entrez的查询方式
➢快速查询 ➢限定查询 ➢其他查询方式
批处理查询交叉引用的信息查询 E－mail查询
6
Entrez基本查询功能
▪ 主题词（Subject）搜索 ▪ 短语（phrase）搜索 ▪ 文献作者（Authous）搜索 ▪ 序列独特识别信息（Unique Identifiers）
14
15
16
SRS与ENTREZ的区别
布林逻辑运算结果信息量查询速度
NCBI AND,OR,BUT 小
快
SRS &, I, !
大
慢
17
18
19
20
21
22
学习总结
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
三、数据库检索工具简介Βιβλιοθήκη ▪ Entrez ▪ SRS
1
1、Entrez
/gquery/gquery.fcgi
Entrez的特点
▪ 链接的数据库多 ▪ 使用方便 ▪ 实际匹配、相近匹配、查询结果按匹配
程度排列
2

生物信息学数据库——文检论文检索课件PPT

2020/10/22
复旦大学图书馆文献检索教研室
蛋白质结构数据库
PDB Protein DataBank，美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库 /pdb/
NCBI STRUCTURE MMDB （Molecular Modelling DataBase），包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库
2020/10/22
复旦大学图书馆文献检索教研室
核酸序列研究数据库
2020/10/22
复旦大学图书馆文献检索教研室
2020/10/22
复旦大学图书馆文献检索教研室
相关数据库及其主要分类
1 核酸序列数据库
2. RNA 序列数据库 3. 蛋白质序列数据库 4.结构数据库 5. 基因组数据库（非脊椎动物） 6. 代谢酶相关产物 7. 人类和其他脊椎动物基因组 8. 人类基因和疾病 9. 其他数据和其他基因表达数据库 10. 蛋白组资源 11. 其他分子生物学数据库 12.细胞器官数据库 13.植物数据库 14.免疫学数据库
我国生物信息相关网站
中国生物信息网
国家南方基因研究中心
/ch/ 北京大学生物信息中心
中国生物技术信息网
/ 中国科学院（上海文献中心）
SCOP （Structural classification of proteins）英国医学研究会（MRC）剑桥分子生物学实验室开发的蛋白质结构分类数据库。包含描述蛋白质域的家族、超家族、折叠、等级等信息。/scop
2020/10/22
英国人类基因图谱数据库 HGMPGenomeWeb
/genomeWeb/
美国人类基因组资源整合体系 /genome/guide/human/

生物序列的数据库信息检索74页PPT

6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂，怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿
生物序列的数据库信息检索
6、纪律是自由的第一条件。——黑格尔 7、纪律是集体的面貌，集体的声音，集体的动作，集体的表情，集体的信念。 ——马卡连柯
8、我们现在必须完全保持党的纪律，否则一切都会陷入污泥中。 ——马克思 9、学校没有纪律便如磨坊没有水。— —夸美纽斯
10、一个人应该：活泼而守纪律，天真而不幼稚，勇敢而鲁莽，倔强而有原则，热情而不冲动，乐观而不盲目。 ——马克思
Thank you
ห้องสมุดไป่ตู้

生物信息学 NCBI数据库PPT

线虫 ACeDB, Sanger 果蝇 FlyBase, Berkeley 小鼠 MGD, Japan
酵母 Stanford, MIPS
大肠杆菌 WISC
DNA结构数据库
CUTG (Codon Usage Tabulated from GenBank, 密码子使用频度表) [日]
EPD (Eukaryotic Promotor Database, 真核生物启动子数据库) [欧]
7
2、我的实验室
简单重复序列
简单重复序列(Simple Sequence Repeats， SSRs)也称微卫星序列(Microsatellites)或短串联重复序列(Short Tandem Repeats，STRs)，是由 1-6个碱基对组成的串联重复DNA片段。SSRs在真核和原核生物的基因组中分布广泛、数量丰富, 并具有较高的突变频率。
12
13
14
NCBI数据库
1、国外的重要生物信息中心 2、NCBI介绍
15
1、国外重要生物信息中心
16
NCBI
• 美国国家生物技术信息中心(National Center for Biotechnology Information)
• 前身是NIH所属的一个研究所的计算生物学研究室,1988年独立为NCBI,形式上属于国家医学图书馆(National Library of Medicine/NLM)
21
DDBJ homepage
22
22
国际核苷酸序列数据库联盟
• International Nucleotide Sequence Database Collaboration (INSDC)包括
– GenBank

生物学数据库及其检索精选ppt

二级数据库（ Secondary database ）：在一级数据库的信息基础上进行计算机加工处理并增加了许多的人为注释而构成的（例如：NCBI的RefSeq数据库等）。
Primary vs. Secondary Databases
Curators
Sequencing Centers
Labs
2. PIR
美国国家生物医学研究基金会与国际蛋白质信息中心（PIR-International）共同维护。 PIR是第一个蛋白质分类和功能注释数据库
➢ PIR的子数据库：蛋白质序列数据库（PIR-PSD）蛋白质分类数据库（iProClass）非冗余的蛋白质参考资料数据库（PIR-NREF）
酵母蛋白质定位 YPL.db
一、核酸数据库
• （一）核酸序列数据库
目前，国际上主要有 Genbank 、 EMBL 、 DDBJ三大核酸序列数据库，三大核酸数据库之间每天相互交换数据，保持数据同步更新。
三大基因数据库之间的关系
GenBank
EMBL Data Library
DDBJ (DNA Data Bank of Japan)
• PIR网址：
3.TrEMBL
➢是一个经计算机注释的蛋白质数据库，采用 SWISS-PROT数据库格式。 ➢主要包含从EMBL/ Genbank/DDBJ三大核酸数据库中根据编码序列翻译的、尚未集成到 SWISS-PROT数据库中的蛋白质序列。 ➢TrEMBL为SWISS-PROT数据库及时提供补充。 ➢ TrEMBL网址：
Genbank 由美国国立生物技术信息中心 (NCBI)建立维护，其主页如图所示。
NCBI 简介
• NCBI全称National Center of Biotechnology Information（美国国家生物技术信息中心）

6生物信息学数据库-PPT精选文档

• Once data is in digital format, various procedures can be applied on the data to get useful information.
• Data processing may involve various processes, including:
–描述客观事物(对象)的符号记录
• 数据的种类
–文字、图形、图像、声音
• 数据的特点
–数据与其语义是不可分的
Data
• The term data means groups of information that represent the qualitative or quantitative attributes of a variable or set of variables.
• Because data are most useful when well-presented and actually informative, data-processing systems are often referred to as information systems.
• Data analysis
– When the domain from which the data are harvested is a science or an engineering, data processing and information systems are considered too broad of terms and the more specialized term data analysis is typically used, focusing on the highly-specialized and highlyaccurate algorithmic derivations and statistical calculations that are less often observed in the typical general business environment.

02-生物信息学算法：数据库检索--课件

生物信息学生物信息学算法：数据库检索高歌北京大学生物信息学算法：数据库检索●问题的提出●BLAST：实例●BLAST：算法()()()()()()⎪⎩⎪⎨⎧+-+-+--==d j i F dj i F y x s j i F j i F F j i 1,,1,1,1max ,00,0()()()()()()⎪⎪⎩⎪⎪⎨⎧+-+-+--==01,,1,1,1max ,00,0d j i F dj i F y x s j i F j i F F j i 全局比对 (Needleman-Wunsch)局部比对(Smith-Waterman)( 改自Russ Altman BMI214)S T S - - T→相似的结构→相似的功能The “Sequence-to-Structure-to-Function Paradigm”→共同的祖先A→相似的结构→相似的功能The “Sequence-to-Structure-to-Function Paradigm”→共同的祖先序列数据库检索查询序列取一条数据库中的序列进行双序列（全局/局部）比对()1,1--j i F ()j i F ,()j i F ,1-()1,-j i F dd()j i y x s ,XY()()()()()()⎪⎩⎪⎨⎧+-+-+--==d j i F dj i F y x s j i F j i F F j i 1,,1,1,1max ,00,0x i 比对到 y j x i 比对到空位 y j 比对到空位动态规划矩阵(dynamic programming matrix)大小为n ×m查询序列 X ：长度为 m数据库序列Y ：长度为 n假定每次操作需要常数时间c ，则一次比较所需的时间为c ×m ×n●假定我们用人血红蛋白α亚基(HBA_HUMAN)作为查询序列，它的长度是142个氨基酸●检索蛋白质数据库 Swiss-Prot，其中包含 540958 条序列，总计192206270个氨基酸(AA)(即平均每条序列长192206270/540958 = 355.30 AA)●以c = 1 us = (0.000001 s)●则一次检索需要约7.8h !()1,1--j i F ()j i F ,()j i F ,1-()1,-j i F dd()j i y x s ,XY()()()()()()⎪⎩⎪⎨⎧+-+-+--==d j i F dj i F y x s j i F j i F F j i 1,,1,1,1max ,00,0x i 比对到 y j x i 比对到空位 y j 比对到空位y xXY()1,1--j i F ()j i F ,()j i F ,1-()1,-j i F d d ()j i y x s ,A GA G 00 0 0 C 40 0 0 G 0 2 2 0 A 00 0 0 G A A(改自/cours/Turin/UniProtKB_Turin.ppt)改自/cours/Turin/UniProtKB_Turin.ppt)2D PAGE 胶图 2DBase-Ecoli ANU-2DPAGE Aarhus/Ghent-2DPAGE (no server) COMPLUYEAST-2DPAGE Cornea-2DPAGE DOSAC-COBS-2DPAGE ECO2DBASE (no server) OGP PHCI-2DPAGE PMMA-2DPAGERat-heart-2DPAGEREPRODUCTION-2DPAGE Siena-2DPAGE SWISS-2DPAGE UCD-2DPAGE World-2DPAGE 蛋白功能域 Gene3D HAMAP InterPro PANTHER Pfam PIRSF PRINTS ProDom PROSITE SMART SUPFAM TIGRFAMs 模式生物数据库 AGDArachnoServer CGDConoServer CTDCYGDdictyBase EchoBASE EcoGene euHCVdb EuPathDB FlyBaseGeneCards GeneDB_Spombe GeneFarm GenoList Gramene H-InvDB HGNCHPALegioList LepromaMaizeGDB MGIMIMneXtProtOrphanet PharmGKB PseudoCAP RGDSGDTAIRTubercuList WormBase Xenbase ZFIN 蛋白家族 Allergome CAZy MEROPS PeroxiBase PptaseDB REBASE TCDB 基因组注释数据库 Ensembl EnsemblBacteria EnsemblFungi EnsemblMetazoa EnsemblPlants EnsemblProtists GeneID GenomeReviews KEGG NMPDR TIGR UCSC VectorBase 酶与代谢通路 BioCyc BRENDA Pathway_Interaction_DBReactome 生理/病理 BindingDB DrugBank NextBio PMAP-CutDB DNA/RNA 序列数据库 EMBL IPI PIR RefSeq UniGene 3维结构 DisProt HSSP PDB PDBsum ProteinModelPortal SMR 翻译后修饰 GlycoSuiteDB PhosphoSite PhosSite 蛋白组数据库 PeptideAtlas PRIDE ProMEX 蛋白互作数据库 DIP IntAct MINT STRING 分子演化数据库 eggNOG GeneTreeHOGENOM HOVERGEN InParanoid OMAOrthoDBPhylomeDB ProtClustDB 遗传多样性 dbSNP 基因表达数据库 ArrayExpress Bgee CleanEx Genevestigator GermOnline 本体(Ontology) GO （改自/cours/Turin/UniProtKB_Turin.ppt)查询序列与被搜索数据库基本情况功能域信息详细匹配信息(Hits)HBA_HUMANHBB_HUMANNeedleman-WunschSmith-WatermanBLASTyx XY确定“种子”(seeding)查询序列M V L S P A D K T N V K A A WD K T 数据库oooooo o查询序列数据库候选序列o o数据库候选序列查询序列连续片段(hit cluster)数据库候选序列查询序列()()()()()()⎪⎪⎩⎪⎪⎨⎧+-+-+--==01,,1,1,1max ,00,0dj i F dj i F y x s j i F j i F F j i (改编自: Bedell et al . 2003)延伸长度分数⎪⎪⎪⎭⎫ ⎝⎛=∏i i N n L L K !!log 1窗口长度字符集数目(核酸：4，氨基酸：20)第i 个字符出现的频率基于序列信息量，检测重复性的低复杂度区域CACACACACACACACAKLKLKLKLKLKL36.020log 61!3!*3!6log 61!0!*0!*3!*3!6log 61!!*!*!*!6log 614444==⎪⎭⎫ ⎝⎛=⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛=T G C A n n n n K 以常见微卫星序列 “CACACACACACACACA”为例设窗口长度=6× × × × × × ×DKT 16 DRT 13 DET 12 DKS 12 DQT 12EKT 12DKA 11DKN 11DKV 11DNT 11DST 11 NKT 11 DAT 10 DDT 10 DHT 10 DKC 10DKD 10DKE 10DKI 10DKK 10DKL 10DKM 10DKP 10DKQ 10DKR 10DMT 10DPT 10DTT 10QKT 10SKT 10 D K T | | 6+2+5=13 D R T(引自https:///doc /35e4a50968fd14221c11cbaa)p1=120随机匹配概率=1.56×10−8×192206270对于长为L的序列=1206=1.56×10−8检索蛋白质数据库Swiss-Prot，其中共含192206270个氨基酸(AA)p L=120LE=p×N≈3在随机情况下，获得比当前比对分数相等或更高分数的可能比对条数。

《生物信息学》PPT课件

➢ 对某一基因分析其mRNA序列和蛋白质序列特点，设计一对RT-PCR引物并说明选择这对引物的理由；写出克隆此基因编码区的研究策略和技术路线（pGEM-T 克隆载体及pcDNA3.1表达载体）。
完整版课件ppt
8
数据库
数据库格式：EMBL格式，GenBank格式， ASN.1格式，PIR/CODATA格式
生物信息学
生物信息学概述生物信息数据库及其应用
完整版课件ppt
1
生物信息学(bioinformatics)是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门学科。它通过对生物学实验数据的获得、加工、存储、检索与分析，进而达到揭示数据所蕴含的生物学意义的目的。
完整版课件ppt
2
生物信息学与生物计算
★ 各种数据库的建立和管理 ★ 数据库接口和检索工具的研制 ★ 研究新算法，发展方便适用的程序
完整版课件ppt
3
生物信息学与生物实验
★ 实验数据是生物信息学的基础 ★ 生物信息学的指导作用
完整版课件ppt
4
算法图形学图像识别人工智能数据库统计学计算机模拟信息理论语言学机器人学软件工程计算机网络
完整版课件ppt
25
重要生物信息学中心简介
NIH：National Institute of Health NCBI：National Center of Biotechnology Institute NLM：National Library of Medicine / GenBank, Unigene , Refseq, dbSNP, OMIM
完整版课件ppt
32
完整版课件ppt
33
完整版课件ppt

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

7. Human and other Vertebrate Genomes 人和其他脊椎基因组
8. Human Genes and Diseases
人基因和疾病
9. Microarray Data and other Gene Expression Databases
10. Proteomics Resources微阵列和其他基因表达数据库蛋白质组资源
6
组学数据库分类
• 一级数据库：通过收集组学数据构建的数据库
• 二级和三级数据库：对一级数据库数据进一步分析、归纳和整理，目的性和实用性
– TRANSFAC：转录因子和结合位点数据库 – SMART、pFam数据库：收录了可能的蛋白质
结构域信息，并提供了特定算法工具
7
生物信息学数据库的地位和作用
11. Other Molecular Biology Databases 其他分子生物学数据库
12. Organelle databases
细胞器数据库
13. Plant databases
植物数据库
14. Immunological databases
免疫学数据库
11
常用分类类型
• 序列数据库 • 结构数据库 • 功能数据库 • 其它专业数据库
大规模组学研究
• 上世纪90年代初启动人类基因组计划，短时间内产生海量生物学数据
• 随着基因组计划进行，多种相关高通量研究逐渐开展起来
– 基于表达序列标签（EST）和DNA微阵列的高通量转录组研究
– 基于生物质谱的蛋白质组表达谱和修饰谱研究 – 基于酵母双杂交等技术的高通量蛋白质-蛋白质
相互作用组研究 – 代谢组等相关的组学研究
4
经典生物医学研究
• 针对某较小领域开展深入研究，采集的生物学数据
• 对大量零碎的生物学数据，进一步收集、整理和利用，对推动生物医学的研究有重要意义
– 最具代表性的是KEGG数据库，该数据库整理收录了大量代谢网络（PATHWAY）的研究成果，描绘了生物体内代谢网络涉及的各种分子及关系
5
14
一、序列数据库(基因组)
• Genome Database(GDB)数据库 • Ensembl,由EMBL - EBI和Sanger研究所联合开
发,对后生动物基因组的自动注释和维护 /
– 包括人、鼠、斑马鱼和果蝇4种真核生物基因组的注释分析，主要依据已测序获得的基因组序列，定位所有已知基因，并预测未知新基因，同时为这些基因提供功能、疾病相关特征等方面的注释信息；Ensembl基因组注释的核心是基因预测，考虑到现有预测方法的限制，该系统整合了多种预测方法，并提供了各种预测方法结果的下载
将国际上生物学数据库归纳为14类 (/nar/databas e/c/)
9
10
《核酸研究》的14类数据库
1. Nucleotide Sequence Databases
核酸序列数据库
2. RNA sequence databases
RNA序列数据库
12
主要内容
• 生物信息学数据库类型
– 序列数据库 – 结构数据库 – 功能数据库 – 其它专业数据库
• 生物信息学数据库的检索
– 检索方法概述 – 检索实践和案例
13
一、组计划产生的基因组及其表达
序列，由基因组序列所推测的编码和非编码核酸和蛋白质序列，以及个别生物学实验中测序获得的核酸和蛋白质序列
• UCSC Genome Browser,加州大学圣克鲁兹分校建立,包括各种脊椎和无脊椎动物，以及主要模式生物的基因组数据 /
15
一、序列数据库(核酸)
• GenBank、EMBL、DDBJ /Genbank， /embl/， http://www.ddbj.nig.ac.jp/
经典生物医学实验大量零碎数据数据收集整理
大规模组学实验海量组学数据数据存储、注释
检索查询
数据库理论分析
生物学研究
生物医学应用 8
生物信息学数据库类型
• 核酸研究（Nucleic Acids Research）杂志 • 每年第一期为生物信息学数据库专刊,收录
最主要的生物学相关数据库 • 2010年的核酸研究杂志提供的数据库列表
• 研究目标是发展和利用先进计算技术解决生物学难题
2
生物信息学数据库
• 大量生物学数据的存储和利用离不开数据库
• 用于结构化存储生物数据，以便进一步对数据进行分析和利用
3
数据库的数据来源
• 两大主要来源
– 经典的生物医学研究：大量生物医学科研工作者根据自己的兴趣开展的个别研究
– 大规模组学研究：代表性工作是大规模人类基因组学和蛋白质组学研究
生物信息学数据库
信息检索教研室薛晓芳
2010年11月2日
1
生物信息学概念
• 生物信息学是对生物学数据进行收集、处理、存储、检索和分析的一门交叉学科
• 研究生物信息的采集、处理、存储、传布、分析和解释等各个方面，通过综合数学、计算机科学和生物学的工具与技术来揭示大量而复杂的生物数据所赋有的生物学奥秘
3. Protein sequence databases
蛋白质序列数据库
4. Structure Databases
结构数据库
5. Genomics Databases (non-vertebrate) 基因组数据库(非脊椎动物)
6. Metabolic and Signaling Pathways 代谢和信号通路
– 三个数据库每天互相交换数据 – GenBank可通过NCBI的检索系统Entrez获取， Entrez集成来自
主要DNA和蛋白序列数据库的数据，包括物种、基因组、定位、蛋白结构和结构域等信息
• 各种专业核酸数据库
– 非冗余参考序列数据库RefSeq – 密码子使用数据库Codon Usage Database CUTG – 基因可变剪接数据库ASDB – 转录因子数据库TRANSFAC

生物信息学数据库检索PPT课件

合集下载

生物信息学第三章生物信息数据库及其信息检索 ppt课件

生物信息学数据库检索

生物信息学PPT课件

pubmed生物学数据库ppt课件

生物信息学检索系统PPT课件

生物信息学数据库——文检论文检索课件PPT

生物序列的数据库信息检索74页PPT

生物信息学 NCBI数据库PPT

生物学数据库及其检索精选ppt

6生物信息学数据库-PPT精选文档

02-生物信息学算法：数据库检索--课件

《生物信息学》PPT课件

文档推荐

最新文档

生物信息学数据库检索PPT课件

合集下载

生物信息学 第三章 生物信息数据库及其信息检索 ppt课件

生物信息学数据库检索

生物信息学PPT课件

pubmed生物学数据库ppt课件

生物信息学检索系统PPT课件

生物信息学数据库——文检论文检索课件PPT

生物序列的数据库信息检索74页PPT

生物信息学 NCBI数据库PPT

生物学数据库及其检索精选ppt

6生物信息学数据库-PPT精选文档

02-生物信息学算法：数据库检索--课件

《生物信息学》PPT课件

文档推荐

最新文档

生物信息学第三章生物信息数据库及其信息检索 ppt课件