药物生物信息学常用数据库
- 格式:ppt
- 大小:2.76 MB
- 文档页数:63
肿瘤生物信息学相关数据库以下数据库按照综合性肿瘤数据库、肿瘤基因组数据库、肿瘤转录组数据库进行分类:综合性肿瘤数据库TCGA()即是综合性肿瘤数据库,关注与癌症的发生和发展相关的分子突变图谱。
肿瘤基因组数据库COSMIC网址:COSMIC是世界上最大最全面的有关肿瘤的体细胞突变以及其影响的资源。
主要提供多种肿瘤细胞基因组中的CNA、甲基化、基因融合、SNP及基因表达信息等。
主页面分为项目、数据管理、工具、帮助、搜索框等几大块,简洁清晰。
cBioPortal网址:cBioPortal网站整合了126个肿瘤基因组研究的数据,包括TCGA 和ICGC等大型的肿瘤研究项目,涵盖了两万八千例标本的数据,此外部分样品还包括了临床预后等表型的信息。
cBioPortal无需注册就能直接使用,而且提供一些小工具方便用户生成文章级别的图表,非常贴近用户的需求。
UCSC Cancer Genomics Browser网址:UCSC Cancer Genomics Browser是一个整合、可视化、分析癌症基因组学和临床数据的网络分析工具。
该平台目前共有355个数据集,包括了来自71870例样本的全基因组数据。
用户可以通过它浏览基因组的任何一部分,并且同时可以得到与该部分有关的基因组注释信息,如已知基因、预测基因、表达序列标签、mRNA、CpG岛,克隆组装间隙和重叠、染色体带型、小鼠同源性等。
ArrayMap网址:ArrayMap是由苏黎世大学分子生命科学研究所构建的,提供预处理过的肿瘤基因组芯片数据以及CNA 图谱。
arrayMap数据库为高分辨率致癌基因组CNA数据的meta分析和系统级数据集成提供了切入点。
用户可通过关键字搜索自己感兴趣的样本或者搜索特定文献中的样本,并在此基础上分析感兴趣的基因或基因组片段上的CNA 。
用户还可以选择两个样本来比较二者的CNA 的差异。
Cancer Hotspots网址:Cancer Hotspots数据库由Memorial Sloan Kettering癌症中心的Kravis分子肿瘤学中心维护,提供大规模癌症基因组学数据中发现的在统计学上有显著复发突变的信息。
KEGG数据库KEGG数据库作为生物信息学领域中的重要资源,扮演着至关重要的角色。
K—Kyoto,E—Encyclopedia,GG—of Genes and Genomes,即基因和基因组百科全书,是一个集成了基因组、化学物质以及其他生物学信息的数据库资源,为研究者提供了丰富的数据与工具。
本文将介绍KEGG数据库的内容、特点以及在生物信息学研究中的应用。
KEGG数据库的内容KEGG数据库包含了多个相关数据库,主要包括以下几个方面的内容:1.路径通路数据库(Pathway Database): 提供了多种生物通路的信息,包括代谢通路、信号传导通路等。
通过KEGG Pathway,我们可以探索不同生物过程中的分子相互作用和信号传递机制。
2.基因数据库(Gene Database): 提供了多种生物种类的基因信息,包括基因序列、功能注释等。
研究者可以通过KEGG Gene寻找感兴趣的基因,并了解其在生物学过程中的功能和调控机制。
3.化学物质数据库(Compound Database): 包含了大量的化合物信息,如代谢产物、药物等。
通过KEGG Compound,研究者可以了解不同化合物在生物过程中的作用机制和相互关系。
KEGG数据库的特点KEGG数据库具有如下特点:•综合性: KEGG整合了多种生物学数据,涵盖了基因组学、蛋白质组学、代谢组学等多个领域的信息,为研究者提供了全方位的数据支持。
•易用性: KEGG的界面简洁清晰,用户可以通过直观的方式查找和浏览感兴趣的信息,无需专业的生物信息学背景也能够方便地获取数据。
•更新及时: KEGG团队会定期更新数据库内容,保证数据的准确性和完整性,为研究者提供最新的信息资源。
KEGG数据库在生物信息学研究中的应用KEGG数据库在生物信息学研究中有着广泛的应用,主要体现在以下几个方面:•生物途径研究: 研究者可以通过KEGG Pathway数据库探索生物代谢途径、信号传导途径等生物过程的详细机制,为理解疾病发生、药物作用等提供参考。
生物大数据技术在生物信息学研究中的重要数据库介绍生物信息学是利用生物学、计算机科学和统计学等多个学科的知识和技术研究生物信息的一门交叉学科。
近年来,随着高通量测序技术和大规模实验方法的发展,大量的生物信息数据积累起来,对于科学家来说,如何有效地管理和分析这些生物信息数据成为一项重要的任务。
生物大数据技术应运而生,成为解决这一问题的重要工具之一。
在生物大数据技术的支持下,科学家们逐渐构建了许多重要的数据库,为生物信息学研究提供了丰富的资源。
本文将介绍一些在生物信息学研究中起重要作用的数据库。
1. 基因组数据库基因组数据库是存储各种生物的基因组序列和相关信息的数据库。
其中,NCBI GenBank和ENSEMBL是两个非常重要的基因组数据库。
NCBI GenBank是一个庞大的公共数据库,存储了全球各种生物的基因组序列和其他关联信息。
ENSEMBL则是一个整合了多个数据库的资源,提供了全面的基因组序列和功能注释信息。
这些基因组数据库不仅为科学家们提供了基因组资源和注释信息,还为进一步的基因功能研究提供了重要的支持。
2. 蛋白质数据库蛋白质数据库是存储蛋白质序列和相关信息的数据库。
UniProt是最为知名和广泛使用的蛋白质数据库之一,它整合了多个已知蛋白质数据库的信息,包含了对蛋白质的功能、结构和相互作用等方面的注释。
此外,PDB是存储蛋白质三维结构信息的重要数据库,为研究蛋白质结构和功能提供了宝贵的资源。
蛋白质数据库的建立和维护为研究人员提供了更准确和全面的蛋白质信息,促进了蛋白质研究的深入开展。
3. 转录组数据库转录组数据库存储了各种生物体在特定条件下的转录组信息,包括基因的表达水平、调控网络和功能注释信息等。
GEO和EBI ArrayExpress是两个重要的转录组数据库。
GEO是一个公共数据库,包含了从全基因组水平到单基因水平的转录组数据,研究人员可以通过GEO访问到大量已发布的转录组数据。
EBI ArrayExpress是一个整合了全球转录组数据的资源,为用户提供了数据访问、分析和比较的功能。
医学院常用数据库文摘库:外文文摘库:MEDLINE, EMBASE, BIOSIS Preview, SciFinder, 中文文摘库:CBM, CBA。
全文库:外文全文库:OVID, Springer Link, PML, Blackwell, Elsevier, Wiley, EBSCO。
中文全文库:cqvip, CNKI, 万方循证医学库:Ovid 循证医学数据库药物数据库:Micromedex临床暨医药学数据库学位论文库:外文PQDD, 中文万方博硕论文库综合性数据库:Web of Knowledge评价:本讲座从实用的角度,着重讲解了医学常用的数据库,包括数据库的收录学科范围,期刊数目,收录年份,核心期刊比例等。
特别值得推荐的是,每种类型的数据库都有一个小结,用表格对比了不同数据库的收录年份,期刊数等重要指标。
看了这个讲座,您对医学文献检索会有一个整体的认识,文献检索的千里之行,将由此展开。
常用的医学数据库按照内容揭示程度分为:文摘数据库电子全文数据库引文数据库事实型数据库2.1.1 中文文摘数据库CBMdisc收录年限比CMCC要长,收录的期刊范围更广,而且有规范的主题词标引,是文献查新的主要中文检索工具。
主要缺点是时滞长,一般在3~4月。
相比而言,CMCC更新快,这一点是突出于CMBdisc的最大优势。
2.1.2 外文文摘数据库比较:MEDLINE偏重于生物医学,EMBASE偏重于生物医学与药理学,在药理上比MEDLINE 收录的更全面。
MEDLINE和EMBASE收录的期刊中,有50%以上是重复的。
BIOSIS Preview 偏重于生物学。
CA偏重于化学。
目前,文摘数据库一般都实现了与全文数据库的全文链接。
如果您的单位订购了这些全文库,那么在文摘数据库中检索到特定的文献后,能直接链接到全文数据库,打开该全文2.1.3 中文全文数据库比较:CNKI是目前国内最好、使用最多的中文全文数据库,CNKI旗下的CHKD面向医学专业,做得比较专业,在国内很多医院购买。
生物信息学常用数据资源介绍生物信息学是一门将大量数据和信息与生命科学相结合的学科,随着技术的不断发展,越来越多的生物信息学数据资源得到了广泛应用,使得生物信息学研究呈现出爆发式增长的态势。
在接下来的文章中,我将介绍一些常用的生物信息学数据资源。
1. 基因组浏览器基因组浏览器是生物信息学研究中非常常见的一种工具,在基因组浏览器中,用户可以利用多种查询方式快速定位以及查找基因序列、变异位点、基因表达等数据,具体的使用方法可以参考NCBI、UCSC和ENSEMBL等公共数据库。
2. 数据库公共数据库是生物信息学在数据共享和协作方面发挥重要作用的平台之一,NCBI、ENSEMBL、UniProt和GenBank等是生物信息学具有代表性的公共数据库,这些数据库为用户提供了一系列的基因组、转录组、蛋白质、代谢物等多种数据资源,这些数据可以帮助研究者进行基因预测及分析,杂交研究、协同研究等多种生物信息学研究。
3. 软件工具与数据库不同的是,软件工具主要起到数据分析与处理的作用。
对于不同的数据分析任务,不同的软件工具适应程度也不同,因此在生物信息学研究过程中需要不断尝试和探索,比如在转录组分析中,DESeq2和edgeR是非常常用的工具。
4. 人类基因组计划人类基因组计划是一项耗时多年,费用庞大的生命科学研究计划,目的是把人类的基因组解码,并制定新的医学治疗方案等。
在该项目结束后,因为庞大的数据量,成千上万名的研究者可以在其基础上继续开展基因组学研究,这进一步推动了生命科学领域的发展。
5. 元分析数据集随着生物信息学领域的快速发展,元分析数据集作为新工具出现了。
它是由几个相对独立的研究组合而成,旨在研究特定生物过程的数据,比如癌症发病的前因后果,它们包括多个数据来源和测序仪,提供了更全面、多元化的基因数据,为进一步研究确定新的生物标志物和治疗方法提供了更加可靠的基础。
综上,以上我们介绍了一些生物信息学研究中使用频率较高的数据资源,它们共同构成了生物信息学领域的基础设施,在加速科研发展、优化研究流程、减少人力物力成本等方面发挥重要作用,一方面可以帮助科研工作者得到更准确的结果,另一方面又能为更广泛的生命科学研究打开更广的视野。