药物基因组学相关数据库
- 格式:doc
- 大小:711.50 KB
- 文档页数:10
生物信息学数据库分类整理汇总生物信息学数据库是存储和管理生物学领域的大量数据的重要工具和资源,对于生物信息学研究、基因组学、蛋白质组学、转录组学等领域的研究具有重要的意义。
本文将对生物信息学数据库进行分类整理和汇总,方便生物信息学研究者更好地使用和了解这些数据库。
1.基因组数据库:- GenBank:美国国家生物技术信息中心(NCBI)维护的基因序列数据库,包含已知基因的核酸序列。
- Ensembl:英国恩格斯尔基因组项目维护的一个综合性基因组数据库,包含多种物种的基因组数据。
- UCSC Genome Browser:加利福尼亚大学圣克鲁兹分校开发的一个基因组浏览器,提供多种物种的基因组序列和注释信息。
2.蛋白质数据库:- UniProt:一个综合性的蛋白质数据库,集成了多个蛋白质序列和注释信息资源。
- Protein Data Bank (PDB):存储大量已解析的蛋白质结构数据的数据库,提供原子级别的结构信息。
- Protein Information Resource (PIR):收集和整理蛋白质序列、结构和功能信息的数据库。
3.转录组数据库:- NCBI Gene Expression Omnibus (GEO):存储和共享大量的高通量基因表达数据的数据库。
- ArrayExpress:欧洲生物信息学研究所(EBI)开发的一个基因表达数据库,包含多种生物组织和疾病的表达数据。
4.疾病数据库:- Online Mendelian Inheritance in Man (OMIM):记录人类遗传疾病和相关基因的数据库。
- Orphanet:收集和整理罕见疾病和相关基因的数据库。
5.代谢组数据库:- Human Metabolome Database (HMDB):一个综合性的人类代谢物数据库,包括代谢产物的结构和功能信息。
- Kyoto Encyclopedia of Genes and Genomes (KEGG):包含多种生物体代谢途径的数据库。
Disgenet是一个基于网络的药物基因组学数据库,旨在提供一个集中的、综合性的工具,以研究基因在疾病发展中的作用。
在Disgenet中,疾病靶点筛选需要依据一系列标准,这些标准主要包括以下几个方面:
1.基因功能研究:通过基因敲除、转基因、基因编辑等实验方法研究基因在生
物体内的功能以及在疾病发展中的可能角色。
2.基因变异与疾病关联:研究基因变异与疾病的关联,包括变异类型、频率、
分布等,以确定与特定疾病相关的基因变异。
3.药物靶点研究:通过研究药物与基因的相互作用,确定药物的作用机制和靶
点,为药物研发提供参考。
4.基因组学和表观遗传学研究:综合利用基因组学和表观遗传学的研究方法,
全面了解基因在疾病发展中的调控机制。
总之,Disgenet的疾病靶点筛选标准综合考虑了基因功能、变异、药物靶点以及基因组学和表观遗传学等多方面的研究结果,为药物研发提供了重要的参考依据。
药物基因组学数据库1、Drugbank.drugbank.ca/2、dgidb/3、pharmGKBhttps:///4、cancercommoncancercommon./5、ChEMBLhttps:///chembldb/6、mycancergenome/7、TTD.sg/group/cjttd/8、guidetopharmcology/9、clearityfoundation/10、CIViChttps:///#/home11、DoCM/1 Drugbank药物和药物靶标资源库。
DrugBank是一个独特的生物信息学/化学信息学资源,它结合了详细的药物(例如化学制品)数据和综合的药物靶点(即:蛋白质)信息。
该数据库包含了超过4100个药物条目,包括超过800个FDA认可的小分子和生物技术药物,以及超过3200个试验性药物。
此外,超过1.4万条蛋白质或药物靶序列被到这些药物条目。
每个DrugCard条目包含超过80个数据域,其中一半信息致力于药物/化学制品数据,另一半致力于药物靶点和蛋白质数据。
许多数据域超到其他数据库(KEGG、PubChem、ChEBI、Swiss-Prot和GenBank)和各种结构查看小应用程序。
该数据库是完全可搜索的,支持大量的文本、序列、化学结构和关系查询搜索。
DrugBank的潜在应用包括模拟药物靶点发现、药物设计、药物对接或筛选、药物代谢预测、药物相互作用预测和普通药学教育。
DrugBank可以在www.drugbank.ca使用。
广泛应用于计算机辅助的药物靶标的发现、药物设计、药物分子对接或筛选、药物活性和作用预测等。
在查询中,每一种药物对应1个DrugCard,即我们所得到的检索结果。
每一个DrugCard都包含的数据信息分为药物、靶标和酶三部分。
药物信息包括了该药物的CAS号、商品名、分子式、分子量、SMILES、2D和3D结构、logP、logS、pKa、熔点、吸收性、Caco-2细胞穿透性、药物类别和临床使用、性质描述、剂型与给药途径、半衰期、体的生物转化、毒性、作用于哪些生物体、食物对服用的影响、与其它药物的相互作用、作用机理、代谢途径、药理学特征、与蛋白质的结合情况、溶解度、物质形态、同义词、关于合成的相关文献等,还与ChEBI、GenBank、PubChem等外部数据库有。
常用的生物数据库(一)引言概述:本文将介绍一些常用的生物数据库,这些数据库在生命科学研究中起到了重要的作用。
生物数据库是存储和管理生物学数据的平台,为科学家们提供了丰富的数据资源,便于他们进行进一步的研究和分析。
在本文中,我们将介绍五个常用的生物数据库,分别是A数据库、B数据库、C数据库、D数据库和E数据库。
正文:一、A数据库1. A数据库是一个广泛应用于基因组学研究的生物数据库。
2. A数据库提供了大量的基因序列和蛋白质序列,以及与这些序列相关的注释信息。
3. A数据库还提供了丰富的基因组数据和表达数据,可以帮助研究人员了解基因的功能和调控机制。
4. A数据库还提供了工具和资源,用于基因组比较和功能注释分析。
5. A数据库不仅仅适用于基础研究,也为生物技术和药物开发提供了重要的数据支持。
二、B数据库1. B数据库是一个专门用于蛋白质相关研究的生物数据库。
2. B数据库提供了大量的蛋白质序列和结构信息,以及与这些蛋白质相关的功能和互作信息。
3. B数据库还提供了工具和资源,用于预测蛋白质结构和功能,并对蛋白质相互作用网络进行分析。
4. B数据库不仅仅适用于基础研究,也为药物设计和生物工程提供了重要的数据支持。
5. B数据库的数据来源于多个实验室的研究成果,经过严格的质量控制和标准化处理。
三、C数据库1. C数据库是一个应用于植物研究的生物数据库。
2. C数据库提供了大量的植物基因组数据和表达数据,以及与这些数据相关的注释信息和功能注释分析结果。
3. C数据库还提供了工具和资源,用于植物基因功能分析和代谢途径研究。
4. C数据库不仅仅适用于基础研究,还为农业和生物能源领域的研究提供了重要的数据支持。
5. C数据库的数据来源于多个研究机构和实验室的合作项目,经过严格的数据收集和整理。
四、D数据库1. D数据库是一个广泛应用于微生物研究的生物数据库。
2. D数据库提供了大量的微生物基因组数据和表达数据,以及与这些数据相关的功能注释信息和分类信息。
kegg 解读Kegg(Kyoto Encyclopedia of Genes and Genomes)是一个广泛被应用于生物信息学领域的数据库。
它的主要目标是将基因组、化学物质和其他生物大分子有机地整合在一起,为生物学家、生物信息学家和医学研究人员提供有关代谢途径、生物网络和相关信息的详细数据。
本文将对Kegg数据库进行解读,介绍其功能和应用。
一、Kegg数据库简介Kegg数据库是由日本京都大学生物信息中心创建和维护的一个综合性数据库。
它通过整合基因组、代谢物和附加信息,提供了生物学大分子的全面知识库。
Kegg数据库的内容包括基因功能、生物化学途径、代谢物结构和化学反应等。
目前,Kegg数据库涵盖了大量的物种,包括人类、动物、植物、微生物等。
二、Kegg数据库的功能1. 基因功能注释Kegg数据库提供了基因功能注释的工具和资源,帮助研究人员从大量的基因序列中识别和注释功能。
可以通过Kegg的基因分类方式,将基因按照功能进行分类,并提供详细的注释信息和功能预测。
2. 代谢途径分析Kegg数据库中包含了大量的代谢途径信息,可以帮助研究人员理解生物体代谢的整体框架。
通过Kegg的图谱展示和路径分析工具,可以可视化地展示代谢途径,并分析其中的关键代谢步骤和相互作用。
3. 疾病相关信息Kegg数据库还提供了与疾病相关的信息,包括疾病的发病机制、相关基因和蛋白质等。
对于研究人员来说,这意味着可以通过Kegg数据库寻找潜在的药物靶点和疾病相关的代谢通路,以及潜在的治疗策略。
4. 生物网络分析Kegg数据库中的生物网络信息可用于研究基因、蛋白质和代谢物之间的相互作用。
通过分析这些生物网络,可以揭示基因调控网络、蛋白质相互作用和信号转导途径等重要生物学过程。
三、Kegg数据库的应用1. 基因组学研究Kegg数据库为基因组学研究提供了宝贵的资源和工具。
研究人员可以利用Kegg的代谢途径信息,推断基因在代谢网络中的功能和相互作用,帮助揭示生物的生理和代谢特征。
NCBI功能详介NCBI(National Center for Biotechnology Information)是美国国家生物技术信息中心,是全球最大的生物信息学数据库之一,也是生物医学研究领域最重要的资源之一、NCBI提供了广泛的生物学和医学数据库和工具,以帮助科学家们进行基因组学、蛋白质学、遗传学、药物研发等方面的研究。
NCBI的主要功能包括:1. PubMed:NCBI的PubMed是最大的生物医学文献数据库。
它收录了全球范围内的生物医学文献,并提供了非常强大的功能,以帮助科学家们找到自己感兴趣的论文。
3. BLAST:BLAST(Basic Local Alignment Search Tool)是NCBI 提供的一种重要的生物信息学工具。
它可以用来比对生物序列(如DNA、RNA或蛋白质序列),以找到相似的序列或已知的序列。
BLAST对生物学研究非常重要,可以用于序列比对、功能注释、物种分类等各种应用。
4. Entrez数据库:Entrez是NCBI提供的一种综合性数据库工具,可以用来访问和多个数据库,如PubMed、GenBank、Protein、Nucleotide等。
用户可以使用Entrez来查找和获取各种类型的生物学数据,如文献、序列、蛋白质结构等。
5. PubChem:PubChem是一个提供生物化学信息的数据库,包含大量的有关化合物的实验数据、化学结构、药物作用等信息。
它可以帮助研究人员进行药物发现、化合物筛选和毒性评估等方面的研究。
6. dbSNP:DBSNP(Single Nucleotide Polymorphism Database)是一个用于存储和查询单核苷酸多态性数据的数据库。
它收集了全球范围内各种不同物种的单核苷酸变异信息,包括单核苷酸变异的位点、变异类型、频率等。
7. GEO:GEO(Gene Expression Omnibus)是一个用于存储和共享基因表达数据的数据库。
生物学基因组学数据库的发展及其应用前景近年来,随着生物技术的快速发展,生物学基因组学数据库在生物学研究中起着越来越重要的作用。
基因组学数据库是存储和共享生物学基因组学数据的重要平台,通过整合、组织和分析大量的基因组数据,为研究者提供了研究基因功能和遗传变异的重要资源。
在本文中,我们将探讨生物学基因组学数据库的发展历程以及它们在生物学研究中的应用前景。
生物学基因组学数据库的发展可以追溯到上世纪80年代,当时人类基因组计划的启动为这一领域的快速发展奠定了基础。
自那时以来,越来越多的基因组学数据库相继建立起来。
其中最著名的数据库包括GenBank、EMBL和DDBJ等。
这些数据库收集了全球各地研究者提交的大量基因组数据,为研究人员提供了查找和共享基因组数据的重要工具。
此外,还有一些专门致力于特定物种的数据库,如Ensembl和NCBI的基因数据库,它们提供了特定物种的详细基因组信息,帮助研究者更深入地了解不同物种的基因功能和结构。
随着高通量测序技术的广泛应用,大量的基因组序列数据不断产生,这给基因组学数据库带来了巨大的挑战,即如何有效存储和处理这些大规模的数据。
为了应对这一问题,不断涌现出新的生物学基因组学数据库,包括GEO、ArrayExpress和SRA等。
这些数据库主要存储和管理生物学实验中获得的基因组数据,如基因表达数据、甲基化数据和复杂疾病的基因变异数据。
同时,还有一些数据库专门用于存储和共享人类疾病相关的基因组数据,如ClinVar和GWAS Catalog等。
这些数据库提供了研究人员进行生物学实验数据的挖掘和分析的重要资源,进一步促进了生物学研究的发展。
生物学基因组学数据库的发展不仅在基础生物学研究中发挥着重要作用,还在医学研究和临床实践中得到广泛应用。
基因组学数据库为研究人员提供了参考标准,帮助他们理解基因组中的变异,并研究它们与疾病之间的关联。
通过比较患者和正常人基因组数据的差异,研究人员可以发现特定基因变异与疾病之间的关系,从而推动精准医学的发展。
ncbi使用指导NCBI是美国国家生物技术信息中心(National Center for Biotechnology Information)的缩写,是一个提供生物医学和遗传学相关数据和信息的数据库。
NCBI提供了许多工具和资源,以帮助研究人员在基因组学、蛋白质学、遗传学和生物信息学等领域进行研究。
以下是使用NCBI的一些基本指南:1. 访问NCBI网站:使用任何现代网络浏览器,打开NCBI的主页(https://)即可开始使用。
2. 搜索文献:在NCBI主页上的搜索框中,输入你要搜索的关键词,如基因名、疾病名或其他相关的信息。
点击“搜索”按钮,即可看到与你的搜索关键词相关的论文和研究。
3. 搜索序列:如果你希望搜索某个特定基因或蛋白质的序列,可以使用“基因”或“蛋白质”选项卡下的搜索工具。
在搜索框中输入你要搜索的序列信息,点击“搜索”按钮,即可找到与该序列相关的信息和研究。
4. 访问数据库:NCBI提供了许多数据库,如GenBank(基因组数据库)、PubMed(文献数据库)和BLAST(序列比对工具)。
你可以使用NCBI的导航菜单,选择你感兴趣的数据库进行浏览和搜索。
5. 下载数据:在NCBI的数据库中,你可以找到大量的基因组序列、蛋白质序列和其他相关数据。
你可以通过点击数据记录的链接,进入详情页,然后选择下载你需要的数据文件或信息。
6. 利用NCBI工具:NCBI还提供了一些生物信息学工具,如BLAST(序列比对工具)、Primer-BLAST(引物设计工具)和Gene Expression Omnibus(基因表达数据库)。
你可以使用这些工具进行基因序列比对、引物设计和基因表达分析等。
7. 阅读文献:NCBI的PubMed数据库是一个广泛的生物医学文献数据库,你可以使用关键词搜索文献,并阅读或下载全文。
你还可以使用PubMed Central(PMC)访问免费的全文文章。
总之,NCBI是一个丰富的生物医学信息资源,提供了许多工具和数据库,以帮助研究人员进行基因组学和生物信息学研究。
基因组数据库详细解读基因组数据库(Genome databases)是存储大量基因组信息的仓库或平台,可以帮助科学家和研究人员共享、比较和分析基因组数据。
这些数据库包含了许多生物种类的基因组序列、注释信息、功能预测、基因组变异情况等相关数据。
基因组数据库对于研究人员的基因组数据的分析和比较具有重要的作用。
其中最著名的基因组数据库是国家生物技术信息中心(NCBI)的基因组数据库。
该数据库收集了大量生物种类的基因组数据,并为用户提供了一些功能强大的工具和搜索引擎,方便用户进行基因组数据的挖掘和分析。
在NCBI的基因组数据库中,又包含了许多不同的子数据库,比如基因序列数据库、蛋白质序列数据库、SNP数据库、EST数据库等等。
这些子数据库都以其特有的方式收集、注释和组织基因组数据,并提供了不同的搜索和分析工具,方便用户根据自己的需要进行查询和分析。
基因组数据库的数据来源多种多样,有些数据是科学家通过实验和测序获取的,也有些数据是由计算机程序自动生成的预测结果。
因此,在使用基因组数据库时,研究人员需要注意数据的来源和可靠性,以确保数据的正确性和实用性。
基因组数据库是存储生物体基因组序列信息的数据库,提供了对基因组数据的存储、管理、分析和共享。
以下是基因组数据库的详细解读:1. 数据存储:基因组数据库存储了各种生物的基因组序列数据,包括细菌、真菌、植物、动物等。
这些数据以染色体为单位进行存储,每个染色体包含了数千到数百万个基因。
基因组数据库还可以存储基因的注释数据,如基因的命名、位置、功能和调控信息等。
2. 数据管理:基因组数据库需要对存储的数据进行管理,包括数据格式转换、数据清洗、数据质量控制等。
数据库还需要进行数据更新和版本控制,以确保数据的准确性和完整性。
3. 数据分析:基因组数据库还提供了对存储的数据进行分析的工具和方法,可以进行基因注释、基因表达分析、蛋白质预测、基因家族分析等。
这些工具可以帮助研究人员更好地理解和研究生物的基因组信息。
gdb数据库使用记录
GDB(Global Database)是一个全球性的数据库,用于存储和检索与基因组学、生物信息学和系统生物学相关的数据。
以下是使用GDB数据库的一些常见记录:
基因组序列:GDB数据库中存储了大量基因组序列数据,包括DNA序列、蛋白质序列等。
这些数据可用于基因组学研究、基因功能分析、进化生物学等领域。
基因注释:GDB数据库中的基因注释信息包括基因名称、基因功能、基因产物等,这些信息有助于理解基因的结构和功能。
变异数据:GDB数据库中还包含大量与人类和其他物种的遗传变异相关的数据,这些数据可用于遗传疾病研究、药物发现等领域。
蛋白质结构:GDB数据库中存储了大量蛋白质的三维结构数据,这些数据有助于理解蛋白质的功能和相互作用。
系统生物学数据:GDB数据库中还包含大量与系统生物学相关的数据,包括代谢途径、信号转导通路等,这些数据有助于理解生物系统的整体行为。
使用GDB数据库通常需要进行数据库查询、数据分析、可视化等操作。
具体的使用方法取决于所使用的工具和数据类型,一般需要通过编程或使用特定的查询语言(如SQL)来完成。
对于初学者来说,可以参考GDB数据库的官方文档、教程或在线课程来学习如何使用该数据库。
KEGG使用教程KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因组和基因组百科全书)是一个涉及基因组、基因和生物化合物的综合数据库,为研究生物学、生物信息学和系统生物学提供重要的资源和工具。
本教程将介绍KEGG数据库的基本用法,帮助用户更好地利用该数据库进行研究。
一、KEGG数据库概述KEGG数据库包含了大量的关于基因组、代谢途径、疾病和药物等方面的信息。
其主要包含了以下三个数据库:1.KEGGPATHWAY:代谢途径数据库,包含了多种生物途径的详细信息,如糖代谢途径、氨基酸代谢途径等。
2.KEGGGENES:基因数据库,提供了大量的基因序列、功能注释和基因组定位等信息。
3.KEGGDRUG:药物数据库,包含了多种药物的结构信息、药物靶点和作用机制等。
二、KEGG数据库的使用方法2.基因:在栏中输入基因名或ID,然后点击按钮。
系统将返回与输入相关的基因信息,包括基因描述、序列、功能注释等。
3.代谢途径:在栏中输入感兴趣的代谢途径名或ID,然后点击按钮。
系统将返回与输入相关的代谢途径信息,包括途径图、相关基因和代谢产物等。
4.药物:在栏中输入感兴趣的药物名或ID,然后点击按钮。
系统将返回与输入相关的药物信息,包括药物结构、作用靶点和相关的疾病等。
5. 序列比对:在KEGG网站的工具栏中,选择“Sequencesimilarity search”选项,可以进入基因序列比对的页面。
用户可以将自己的序列与KEGG数据库中的序列进行比对,以查找相关基因或代谢途径。
7. 可视化分析:KEGG数据库还提供了一些用于代谢途径之间相互作用和基因表达等数据分析的工具和资源。
用户可以在KEGG网站的工具栏中选择“Analysis”选项,进入相应的页面进行数据可视化和分析。
三、使用案例以糖代谢途径为例,介绍KEGG数据库的使用方法。
1. 在KEGG网站的栏中输入“Glycolysis”(糖酵解),点击按钮。
药学专业常用网址中检所/药品审评中心/药典委员会/药品认证管理中心/国家中药品种保护审评委员会/药品评价中心/中保办/医药出版社/中国医药国际交流中心/南方经济所/中国医药科技出版社发行公司/中国医药信息网http://www.who.int/世界卫生组织/卫生部/[url=]药学[/url]信息网(pharmweb)/虚拟[url=]药学[/url]图书馆/美国食品与药物管理局/药物信息数据库(RxList)/中国医药技术与市场/在线临床[url=]药学[/url]/中国医药网/index.html国家科技图书文献中心数据库资源/ 免费医学期刊网站/美国专利商标局数据库(USPO)/中国专利信息网/合成方法数据库/医药在线/合理用药网/临床用药资讯网/临床药师/临床用药资讯网/世界医药网/香港药网/天然药物网/新药网/新药在线/新药网/[url=]药学[/url]网/wop/[url=]药学[/url]之窗/中国药物分析网/中国抗生素信息网/中国药物评价网/中国药业123/Boards.asp中国医药信息交流平台/中国医药信息学术研究网/pharmaonline/index.asp中国制药在线/PubMed/网易163邮箱/search/index.cgi医药搜索> 药品标准/欧洲药品质量管理局(EDQM)/毒性HighWire/entrez/毒性Medline/毒性elsevier/毒性toxnet/发改委/知识产权局2 药事新闻2.1 国外药/NEWDRUGS.HTM2.2 国内药3 医药机构3.1 卫生/html/weisheng.htm3.2 中国药学/tcm/chinacpa.htm 3.3 国家中药品种保护审评委员3.4中国医学科学院药物研究/cams/institue_index.html 3.5中国医学科学院医药生物技术研究/chinese/ibiotech.html3.6 中国药品生物制品检定3.7 国家医药管理局-南方医药经济研究 3.8 中国医院信3.9 传统中医药网/4 药学期刊杂志4.2 中国药师/periodical/zgys/index.htm4.3 中国医院药学杂志/periodical/zgyxzz/index.htm4.4 中国新药杂志/periodical/zgxyzz/index.htm4.5 中国药理学报/periodical/zgylxb/index.htm4.6 中国药理学与毒理杂志/periodical/...dlxzz/index.htm4.7 药物分析杂志/periodical/ywfxzz/index.htm4.8 医药导报/periodical/index.htm4.9 中国药物依赖性通报/periodical/zgywylxtb/index.htm4.10 药学学报/periodical/yxxb/index.htm5 文献资料5.1 中国医药卫生学术文库/periodi...k/yywswkzml.htm5.2 中国中医药信息系统5.3 中国生物医学文献数据库http://www.imicams.ca,cn/cbmdisc/cbmdisc.html5.4 中医药文献数据库检索系统/tcm5.5 北京中关村地区书目文献信息服务系统/apt/apt.html5.6 中国医药古籍文献全文检索系统5.7 中药有效成分数据库http://159.226.2.20:12055.8 万方数据资源系统/periodical/index.htm5.9 中国中草药大典/wlxx/yd/index.htm5.10 中国中成药数据库http://159.226.2.20:1524/cgibin/qiancgi/lz335.11 中药基本信息数据库:1524/medicine.html5.12 本草纲目数据库系统 /medicine/medicine&g ... /medicine"target="_blank">/medicine\ ... /medicine 图文介绍药物、药方。
CTD(Comparative Toxicogenomics Database)数据库是一个与毒理学和基因组学相关的数据库,用于整合和分析化合物、基因和疾病之间的关系。
在CTD数据库中,你可以使用一系列的筛选标准来定位和检索相关信息。
以下是一些常见的CTD数据库筛选标准:1. 毒性类型(Toxicity Type):可以选择特定的毒性类型,比如致癌性、发育毒性、神经毒性等,以筛选相关的毒性信息。
2. 基因或蛋白质名字(Gene/Protein Names):可以输入感兴趣的基因或蛋白质的名字,以查找与这些基因或蛋白质相关的毒性信息。
3. 化合物名字(Chemical Names):可以输入特定化合物的名字,以查找与该化合物相关的毒性信息。
4. 疾病(Diseases):可以选择特定的疾病,以查找与该疾病相关的毒性信息,或者反过来,选择特定的毒性信息来查找与之相关的疾病。
5. 物种(Species):可以选择特定的生物物种,以查找该生物物种下与毒性相关的信息。
6. 文献来源(Literature Sources):可以选择特定的文献来源,以查找来自特定文献的毒性信息。
7. 关系类型(Relationship Types):可以选择关系类型,如基因-化合物相互作用、基因-疾病关联等,以定位具体的关系信息。
8. 数据类型(Data Types):可以选择数据类型,如基因表达、蛋白质结构等,以获取特定类型的数据。
这些筛选标准可以单独使用,也可以组合使用,以更精确地定位和检索感兴趣的信息。
使用这些标准,研究人员和学者可以在CTD数据库中获取毒理学和基因组学方面的深入信息。
DataBase肿瘤药物敏感性基因组学数据库GDSChttps:///Genomics of Drug Sensitivity in Cancer (GDSC),提供免费公开的肿瘤治疗基因组数据,致⼒于发现潜在的肿瘤治疗靶点以改善肿瘤治疗,是全球最⼤的同类型公共数据库。
⾸页可见,GDSC数据库⽀持化合物(药物)、细胞系和癌基因三种检索⽅式。
化合物的相关信息由⾏业、学术合作伙伴或供应商处获取;癌基因组突变信息来⾃COSMIC数据库。
GDSC数据库基本上每年会有⼀个⼤版本的更新,年中会有不定期的⼩版本更新。
截⾄本稿,最新版本是Release 8.1 (Oct 2019) ,数据统计可见,共收录453种药物,988个细胞系,以及38万+组检测IC50值:注:数据量并⾮持续增加的,与TCGA⼀样,对于新的质控标准下,不满⾜QC阈值的数据将被移除。
GDSC⽬前提供两个数据集:GDSC1是该⽹站上可⽤的原始数据集(2009-2015年间收集)的扩展。
⽽GDSC2则基于改进的技术、设备和程序等所得的最新的数据(2015-⾄今)。
例如:GDSC1使⽤DNA染料(Syto60),⽽GDSC2使⽤代谢测定法(Resazurin / CellTiter-Glo)来确定细胞活⼒。
GDSC2中已经重复了许多来⾃GDSC1的实验,官⽅建议使⽤GDSC2!【但实际选哪个⽤,由你⾃⼰决定,实际上有些基因的数据在GDSC1中有,在GDSC2中则不存在...】注:类似于现⾏TCGA的GDC Legacy 和 GDC Portal!GDSC数据库提供在线的数据分析和可视化。
其中,⽕⼭图(Volcano Plot)⽤于展⽰基因特征和药物敏感性之间的联系(ANOVA分析):Gene specific volcano plots represent the effect of a mutated gene (e.g. BRAF) on the responses to all drugs analysed. A drug-specificvolcano plot represents how genomic changes influence response to a specific drug (e.g. BRAF inhibitor PLX4720).IC50,半抑制浓度,即凋亡细胞与全部细胞数之⽐等于50%时所对应的药物浓度。
医疗研究中的生物信息学数据库与工具在现代医疗领域,生物信息学数据库与工具的应用已经变得越来越重要。
生物信息学数据库与工具是指用于存储、管理和分析生物学数据的软件系统和工具。
这些数据库和工具能够提供生物学研究人员和医学专业人员快速访问、挖掘和分析大规模的生物学数据,以便更好地理解和治疗疾病。
一、生物信息学数据库1. 基因组数据库基因组数据库是存储各种生物体基因组序列的集合。
其中,最著名的基因组数据库是基因组浏览器,如NCBI的GenBank和Ensembl。
这些数据库提供了大量的基因组序列、注释信息和相关的研究数据,为研究人员提供了基因组水平的信息。
2. 蛋白质数据库蛋白质数据库是用于存储蛋白质序列和结构的数据库。
蛋白质序列和结构数据的积累对于理解蛋白质的功能和特性至关重要。
常见的蛋白质数据库包括UniProt和PDB(蛋白数据银行),它们提供了全球各地研究人员所提交的海量蛋白质序列和结构信息。
3. 基因调控数据库基因调控数据库主要用于存储和分析基因调控元件(如启动子、增强子等)的序列和相关信息。
这些数据库对于理解基因的调控机制和功能方面起着重要的作用。
常见的基因调控数据库包括TRANSFAC、JASPAR和UCSC。
二、生物信息学工具1. 序列分析工具序列分析工具用于对DNA、RNA和蛋白质等生物序列进行分析和比对。
其中,最常用的序列比对工具是BLAST(基本局部序列比对工具)。
BLAST可以将输入的序列与已知序列数据库中的相似序列进行比对,快速找到相似序列和亲缘关系。
此外,还有如ClustalW、MUSCLE等多序列比对工具和MEME等序列模式分析工具。
2. 结构预测工具结构预测工具用于预测蛋白质的三维结构。
根据蛋白质序列,可以使用基于比较模型或折叠预测的方法进行蛋白质结构预测。
在比较模型方法中,SWISS-MODEL和Phyre2是常用的工具;而在折叠预测方法中,Rosetta和I-TASSER等被广泛使用。
⽣物数据库介绍——NCBINCBI(National Center for Biotechnology Information,美国国家⽣物技术信息中⼼)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源。
NCBI资源包括Entrez、Entrez编程组件、MyNCBI、PubMed、PudMed Central、PubReader、Gene、the NCBI Taxonomy Browser、BLAST、Pimer-Blast、COBALT、RefSeq、UniGene、HomoloGene、ProtEST、dbMHC、dbSNP、dbVar、Epigenomics、the Genetic Testing Registry、Genome和相关⼯具、⽐对查看器、跟踪存档、Sequence Read Archive、BioProject、BioSample、ClinVar、MedGen、HIV-1/⼈类蛋⽩质相互作⽤数据库、Gene Expression Omnibus、Probe、Online Mendelian Inheritance in Animals、the Molecular Modeling Database、the Conserved Domain Database、the Conserved Domain Architecture Retrieval Tool、Biosystem、Protein Clusters and thePubChem suite of small molecule databases,所有这些资源可以在NCBI主页找到。
Databases⼀个提供有关基因组组装结构,装配名称和其他元数据,统计报告以及基因组序列数据链接等信息的数据库。
⼀个有关培养物、动植物样本和其他⾃然样本的精选元数据集。
记录显⽰样本状态,有关馆藏的机构的信息,以及NCBI中相关数据链接。
常用的生物数据库在当今的生命科学研究领域,生物数据库就如同一个个巨大的知识宝库,为科研人员提供了丰富的信息和宝贵的数据资源。
这些数据库涵盖了从基因序列到蛋白质结构,从疾病信息到生物进化等各个方面,对于推动生物科学的发展发挥着至关重要的作用。
接下来,让我们一起了解一些常用的生物数据库。
首先要提到的是 GenBank 数据库。
它是由美国国家生物技术信息中心(NCBI)建立和维护的,是全球最全面的核酸序列数据库之一。
GenBank 收录了来自各种生物的 DNA 和 RNA 序列,包括细菌、病毒、真菌、植物和动物等。
科研人员可以通过该数据库查询特定基因的序列信息,了解其结构和功能,为基因研究和基因工程提供了重要的基础。
另一个重要的数据库是 UniProt 。
它是整合了蛋白质序列、功能、分类和相互作用等信息的综合性蛋白质数据库。
UniProt 包含了大量经过人工注释和审核的数据,具有很高的准确性和可靠性。
对于研究蛋白质的结构与功能关系、蛋白质组学以及药物研发等领域来说,UniProt 是不可或缺的工具。
在疾病研究方面,OMIM(Online Mendelian Inheritance in Man)数据库是一个非常有价值的资源。
它主要聚焦于人类遗传疾病,提供了有关疾病的临床表现、遗传方式、基因定位和分子机制等详细信息。
对于医学研究人员和临床医生来说,OMIM 有助于诊断和治疗遗传疾病,以及深入了解疾病的发病机制。
PDB(Protein Data Bank)则是专门用于存储蛋白质和核酸等生物大分子三维结构的数据库。
通过 PDB ,科研人员可以直观地观察到生物大分子的空间结构,从而更好地理解其功能和作用机制。
这对于药物设计和开发具有重要的指导意义,因为药物的作用往往与靶点蛋白的结构密切相关。
KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个综合性的生物通路数据库。
药物基因组学数据库
1、Drugbank
2、dgidb
3、pharmGKB
4、cancercommon
5、ChEMBL
6、mycancergenome
7、TTD
8、guidetopharmcology
9、clearityfoundation
10、CIViC
11、DoCM
1 Drugbank
药物和药物靶标资源库。
DrugBank是一个独特的生物信息学/化学信息学资源,它结合了详细的药物(例如化学制品)数据和综合的药物靶点(即:蛋白质)信息。
该数据库包含了超过4100个药物条目,
包括超过800个FDA认可的小分子和生物技术药物,以与超过3200个试验性药物。
此外,超过1.4万条蛋白质或药物靶序列被链接到这些药物条目。
每个DrugCard条目包含超过80个数据域,其中一半信息致力于药物/化学制品数据,另一半致力于药物靶点和蛋白质数据。
许多数据域超链接到其他数据库(KEGG、PubChem、ChEBI、Swiss-Prot 和GenBank)和各种结构查看小应用程序。
该数据库是完全可搜索的,支持大量的文本、序列、化学结构和关系查询搜索。
DrugBank的潜在应用包括模拟药物靶点发现、药物设计、药物对接或筛选、药物代谢预测、药物相互作用预测和普通药学教育。
DrugBank可以在使用。
广泛应用于计算机辅助的药物靶标的发现、药物设计、药物分子对接或筛选、药物活性和作用预测等。
在查询中,每一种药物对应1个DrugCard,即我们所得到的检索结果。
每一个DrugCard都包含的数据信息分为药物、靶标和酶三部分。
药物信息包括了该药物的CAS号、商品名、分子式、分子量、SMILES、2D和3D结构、logP、logS、pKa、熔点、吸收性、Caco-2细胞穿透性、药物类别和临床使用、性质描述、剂型与给药途径、半衰期、体内的生物转化、毒性、作用于哪些生物体、食物对服用的影响、与其它药物的相互作用、作用机理、代谢途径、药理学特征、与蛋白质的结合情况、溶解度、物质形态、同义词、关于合成的相关文献等,还与ChEBI、GenBank、PubChem等外部数据库有链接。
靶标的信息包括ID、名称、靶标基因的名称、蛋白质序列、残
基数目、分子量、等电点、功能和活性、参与的代谢途径和反应、体内分布、靶标信号、跨膜区域、靶标基因序列与其在GenBank、HGNC 等外部数据库中的ID和链接、参考文献,以与在GenBank和Swiss-Prot中的链接。
酶的信息包括名称、蛋白质序列、基因名称、在Swiss-Prot 等数据库中的链接。
在DrugBank的主界面上,在Browse菜单下可以浏览数据库的内容,其中PharmaBrowse为用户提供了分类浏览的功能。
这为药剂师、医生以与寻找潜在药物的研究人员提供了方便。
在Search下拉菜单下,就是Drug Bank的4类检索方式。
ChemQuery允许用户通过绘制结构图或书写SMILES、分子式进行结构搜索。
在检索过程中还可以对搜索药物类型、分子量范围、搜索结果相似度、结果数量最大值等进行设置。
TextQuery则为文本检索功能。
文本检索支持逻辑运算符连接与在特定领域内搜索。
例如,在“dextromethorphan”中检索混合物,可以键入“mixtures:dextromethorphan”,即用分号在后面输入领域,同时可以加入逻辑运算符,例如,在“dextrome thorphan”和“doxylamine”2个领域进行检索,可以键入“mixtures:dextromethorphan AND mixtures:doxylamine”。
SeqSearch为用户提供了通过序列检索蛋白质的功能。
Data Extractor是1个组合检索工具。
用户可以对DrugCard所包含的信息进行选择性的组合检索
(1)Browse按钮:Drug Browse、Category Browse、Geno Browse、Reaction Browse、Pathway Browse、Class Browse、Target Browse;
(2)Search按钮:ChemQuery Structure Search、Interax Interaction Search、Sequence Search、Advanced Search、MS Search、MS/MS Search、GC/MS Search、1D NMR Search、2D NMR Search;(3)其他Tool按钮:HMDB、T3DB、SMPDB、FooDB、PPT-DB、CSF、Serum Metabolome、CCDB、YMDB、BMDB、ECMDB、MarkerDB、BacMap、Ref-DB。
Drug Browse:小分子药物、生物技术药物、显示药物在DrugBank 中的ID、药物名称、分子量、化学式、化学结构、药物类型、治疗症状。
Drugs:显示ID、药物名称、治疗疾病
Drugs and Targets:显示ID、药物名称、作用位点(靶标)、靶标类型
总结:可以查找药物名称、分子量、化学式、分子结构、药物所属类型、靶标、靶标类型、治疗疾病、代谢途径等,还可链接到相关网站。
(较实用)
Drug Browse:药名、分子量、化学式、化学结构、药物分类、药效
Geno Browse:药物名称,相互作用的基因/酶,SNP位点、等位基因名称、碱基变化、副作用
Pathway Browse:可查看代谢通路
Classification Browse:药物分类
Target Browse:查靶标与靶标分类和详细细节(药物分类、药理学等)
2 ChEMBL
生物活性药物类小分子数据库。
总结:输入分子结构或已知靶标描述或靶标蛋白,每条记录都包括分子的分类、名称、ChEMBI ID、功能、毒性、亚细胞定位、结构、序列、参考文献等。
(偏向于化学)
3 clearityfoundation
关于卵巢癌的公益网站。
治疗卵巢癌复发、有关肿瘤分子信息、临床试验、卵巢癌诊断和治疗分析、新型靶向制剂的临床开发、治疗结果。
(基本无用)
4 DoCM
位点突变数据库,
总结:查找染色体、基因、疾病、突变类型、氨基酸、起始位置、参考文献(稍微简单了点)
5 CIViC
Search:查找描述、疾病名称、疾病DOID、药物PubChem ID、药物名称、证据水平、基因名、PubChem ID、突变位点等查找相关信息。
总结:evidence ID、基因、氨基酸变化、描述、病名、药物、evidence level(A:经过验证的;B:临床;C:临床前;D:个体研究;E:推理的)、evidence type (predictive、diagnostic、prognostic)、evidence direction(supports、dose not support)、clinical significance(sensitivice/resistance or non-response/better outcome/poor outcome/positive/negative)、variant
origin(somatic/germline)、trust rating(1/2/3/4/5 stars),可
链接到代谢途径与下载。
(比较实用)Search:可按不同类型搜索
输入要搜索的单词,如“breast cancer”
点击一个基因/疾病
单击“View Full Detials from MyGene info”,查基因介绍、蛋白结构域、通路。