生物信息学 生物信息数据库及其信息检索
- 格式:pptx
- 大小:3.30 MB
- 文档页数:61
生物信息学网站分子生物学数据库综合目录1. SRS序列查询系统(分子生物学数据库网络浏览器) http://www.embl-heidelberg.ed/srs5/2. 分子生物学数据库及服务器概览/people/pkarp/mimbd/rsmith.html3. BioMedNet图书馆4. DBGET数据库链接http://www.genome.ad.jp/dbget/dbget.links.html5. 哈佛基因组研究数据库与精选服务器6. 约翰. 霍普金斯大学(Johns Hopkins University) OWL网络服器/Dan/proteins/owl.html7. 生物网络服务器索引,USCS /network/science/biology/index.html8. 分子生物学数据库列表(LiMB) gopher:///11/molbio/other9. 病毒学的WWW服务器,UW-Madison /Welcome.html10. UK MRC 人类基组图谱计划研究中心/11. 生物学家和生物化学家的WWW资源http://www.yk.rim.pr.jp/~aisoai/index.html12. 其他生物网络服务器的链接/biolinks.html13. 分子模型服务器与数据库/lap/rsccom/dab/ind006links.html14. EMBO实际结构数据库http://xray.bmc.uu.se/embo/structdb/links.html15. 蛋白质科学家的网络资源/protein/ProSciDocs/WWWResources.html16. ExPASy分子生物学服务器http://expasy.hcuge.ch/cgi-bin/listdoc17. 抗体研究网页18. 生物信息网址http://biochem.kaist.ac.kr/bioinformatics.html19. 乔治.梅森大学(George Mason University)的生物信息学与计算分子生物学专业/~michaels/Bioinformatics/20. INFOBIOGEN数据库目录biogen.fr/services/dbcat/21. 国家生物技术信息研究室/data/data.html22. 人类基因组计划情报/TechResources/Human_Genome23. 生物学软件及数据库档案/Dan/software/biol-links.html24. 蛋白质组研究:功能基因组学的新前沿(著作目录) http://expasy.hcuge.ch/ch2d/LivreTOC.html序列与结构数据库一.主要的公共序列数据库1. EMBL WWW服务器http://www.EMBL-heidelberg.ed/Services/index.html2. Genbank 数据库查询形式(得到Genbank的一个记录) /genbank/query_form.html3. 蛋白质结构数据库WWW服务器(得到一PDB结构) 4. 欧洲生物信息学研究中心(EBI) /5. EBI产业支持/6. SWISS-PROT(蛋白质序列库) http://www.expasy.ch/sprot/sprot-top.html7. 大分子结构数据库/cgi-bin/membersl/shwtoc.pl?J:mms8. Molecules R Us(搜索及观察一蛋白质分子) /modeling/net_services.html9. PIR国际蛋白质序列数据库/Dan/proteins/pir.html10. SCOP(蛋白质的结构分类),MRC /scop/data/scop.l.html11. 洛斯阿拉莫斯的HIV分子免疫数据库/immuno/index.html12. TIGR数据库/tdb/tdb.html13. NCBI WWW Entrez浏览器/Entrez/index.html14. 剑桥结构数据库(小分子有机的及有机金属的结晶结构) 15. 基因本体论坛/GO/二. 专业数据库1. ANU生物信息学超媒体服务(病毒数据库、分类及病毒的命名法) .au/2. O-GL YCBASE(O联糖基化蛋白质的修订数据库) http://www.cbs.dtu.dk/OGLYCBASE/cbsoglycbase.html3. 基因组序列数据序(GSDB)(已注释的DNA序列的关系数据序) 4. EBI蛋白质拓扑图/tops/Serverintermed.html5. 酶及新陈代谢途径数据库(EMP) /6. 大肠杆菌数据库收集(ECDC)(大肠杆菌K12的DNA序列汇编) http://susi.bio.uni-giessen.de/ecdc.html7. EcoCyc(大肠杆菌基因及其新陈代谢的百科全书) /ecocyc/ecocyc.html8. Eddy实验室的snoRNA数据库/snoRNAdb/9. GenproEc(大肠杆菌基因及蛋白质) /html/ecoli.html10. NRSub(枯草芽胞杆菌的非冗余数据库) http://pbil.univ-lyonl.fr/nrsub/nrsub.html11. YPD(酿酒酵母蛋白质) /YPDhome.html12. 酵母基因组数据库/Saccharomyces/13. LISTA、LISTA-HOP及LISTA-HON(酵母同源数据库汇编) /14. MPDB(分子探针数据库) http://www.biotech.est.unige.it/interlab/mpdb.html15. tRNA序列及tRNA基因序列汇编http://www.uni-bayreuth.de/departments/biochemie/trna/index/html16. 贝勒医学院(Baylor College of Medicine)的小RNA数据库/dbs/SRPDB/SRPDB.html17. SRPDB(信号识别粒子数据库) /dbs/SRPDB/SRPDB.html18. RDP(核糖体数据库计划) /19. 小核糖体亚蛋白RNA结构http://rrna.uia.ac.be/ssu/index.html20. 大核糖体亚蛋白RNA结构http://rrna.uia.ac.be/lsu/index.html21. RNA修饰数据库/RNAmods/22. 16SMDB及23SMDB(16S和23S核糖体RNA突变数据库)/Departments/Biology/Databases/RNA.html23. SWISS-2DPAGE(二维凝胶电泳数据库) http://expasy.hcuge.ch/ch2d/ch2d-top.html24. PRINTS /bsm/dbbrowser/PRINTS/PRINTS.html25. KabatMan(抗体结构及序列信息数据库) /abs26. ALIGN(蛋白质序列比对一览) /bsm/dbbrowser/ALIGN/ALIGN.html27. CATH(蛋白质结构分类系统) /bsm/cath28. ProDom(蛋白质域数据库) http://protein.toulouse.inra.fr/29. Blocks数据库(蛋白质分类系统) /30. HSSP(按同源性导出的蛋白质二级结构数据库) http://www.sander.embl-heidelberg.de/hssp/31. FSSP(基于结构比对的蛋白质折叠分类) /dali/fssp/fssp.html32. SBASE蛋白质域(已注释的蛋白质序列片断) http://www.icgeb.trieste.it/~sbasessrv/33. TransTerm(翻译控制信号数据库) /Transterm.html34. GRBase(参与基因调控的蛋白质的相关信息数据库) /~regulate/trevgrb.html35. REBASE(限制性内切酶和甲基化酶数据库) /rebase/36. RNaseP数据库/RNaseP/home.html37. REGULONDB(大肠杆菌转录调控数据库) http://www.cifn.unam.mx/Computational_Biology/regulondb/38. TRANSFAC(转录因子及其DNA结合位点数据库) http://transfac.gbf.de/39. MHCPEP(MHC结合肽数据库) .au/mhcpep/40. ATCC(美国菌种保藏中心) /41. 高度保守的核蛋白序列的组蛋白序列数据库/Baxevani/HISTONES42. 3Dee(蛋白质结构域定义数据库) /servers/3Dee.html43. InterPro(蛋白质域以及功能位点的完整资源) /interpro/序列相似性搜索1. EBI序列相似性研究网页/searches/searches.html2. NCBI: BLAST注释/BLAST3. EMBL的BLITZ ULTRA快速搜索/searches/blitz_input.html4. EMBL WWW服务器http://www.embl-heidelberg.de/Services/index.html#55. 蛋白质或核苷酸的模式浏览/compbio/PatScan/HTML/patscan.html6. MEME(蛋白质超二级结构模体发现与研究) /meme/website7. CoreSearch(DNA序列保守元件的识别) http://www.gsf.de/biodv/coresearch.html8. PRINTS/PROSIT浏览(搜索motif数据库) /cgi-bin/attwood/SearchprintsForm.pl9. 苏黎世ETH服务器的DARWIN系统http://cbrg.inf.ethz.ch/10. 利用动态规划找出序列相似性的Pima IIhttp://bmerc-www.bu.ede/protein-seq/pimaII-new.html11. 利用与模式库进行哈希码(hashcode)比较找到序列相似性的DashPat /protein-seq/dashPat-new.html12. PROPSEARCH(基于氨基酸组成的搜索) http://www.embl-heidelberg.de/aaa.html13. 序列搜索协议(集成模式搜索) /bsm/dbbrowser/protocol.html14. ProtoMap(SEISS-PROT中所有蛋白质的自动层次分类) http://www.protomap.cs.huji.ac.il/15. GenQuest(利用Fasta、Blast、Smith-Waterman方法在任意数据库中搜索) http://www.gdb.rog/Dan/gq/gq.form.html16. SSearch(对特定数据库的搜索) http://watson.genes.nig.ac.jp/homology/ssearch-e_help.html17. Peer Bork搜索列表(motif/模式序列谱搜索) http://www.embl-heidelberg.de/~bork/pattern.html18. PROSITE数据库搜索(搜索序列的功能位点) /searches/prosite.html19. PROWL(Skirball研究中心的蛋白质信息检索) /index.html序列和结构的两两比对1. 蛋白质两两比对(SIM) http://expasy.hcuge.ch/sprot/sim-prot.html2. LALNVIEW比对可视化观察程序ftp://expasy.hcuge.ch/pub/lalnview3. BCM搜索装置(两两序列比对) /seq-search/alignment.html4. DALI蛋白质三维结构比较/dali/5. DIALIGN(无间隙罚分的比对程序) http://www.gsf.de/biodv/dialign/html多重序列比对及系统进行树1. ClustalW(BCM的多重序列比对) /multi-align/multi-align.html2. PHYLIP(推测系统进行树的程序) /phylip.html3. 其它系统进行树程序,PHYLIP文档的汇编http://expasy.hcuge.ch/info/phylogeny.html4. 系统进行树分析程序(生命树列表) /tree/programs/programs.html5. 遗传分类学软件(Willi hennig协会提供的列表) /education.html6. 用于多重序列比对的BCM搜索装置/multi-align/multi-align.html7. AMAS(分析多重序列比对中的序列) /servers/amas_server.html8. 维也纳RNA二级结构软件包http://www.tbi.univie.ac.at/~ivo/RNA/四. 有代表性的预测服务器1. PHD蛋白质预测服务器,用于二级结构、水溶性以及跨膜片断的预测http://www.embl-heidelberg.de/predictprotein/predictprotein.html2. PhdThreader(利用逆折叠方法预测、识别折叠类) http://www.embl-heidelberg.de/predictprotein/phd_help.html3. PSIpred(蛋白质结构预测服务器) /psipred4. THREADER(戴维. 琼斯) /~jones/threader.html5. TMHMM(跨膜螺旋蛋白的预测) http://www.cbs.dtu.dk/services/TMHMM/6. 蛋白质结构分析,BMERC /protein-seq/protein-struct.html7. 蛋白质域和折叠预测的提交表http://genome.dkfz-heidelberg.de/nnga/def-query.html8. NNSSP(利用最近相邻法预测蛋白质的二级结构) /pss/pss.html9. Swiss-Model(基于知识的蛋白质自动同源建模服务器) http://www.expasy.ch/swissmod/SWISS-MODEL.html10. SSPRED(用多重序列比对进行二级结构预测) /jong/predict/sspred.html11. 法国IBCP的SOPM(自寻优化预测方法、二级结构) http://pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopm.html12. TMAP(蛋白质跨膜片断的预测服务) http://www.embl-heidelberg.de/tmap/tmap_info.html13. TMpred(跨膜区域和方向的预测) /software/TMPRED_form.html14. MultPredict(多重序列比对的序列的二级结构) /zpred.html15. BCM搜索装置(蛋白质二级结构预测) /seq-search/struc-predict.html16. COILS(蛋白质的卷曲螺旋区域预测) /software/coils/COILS_doc.html17. Coiled Coils(卷曲螺旋) /depts/biol/units/coils/coilcoil.html18. Paircoil(氨基酸序列中的卷曲螺旋定位) /bab/webcoil.html19. PREDATOR(由单序列预测蛋白质二级结构) http://www.embl-heidelberg.de/argos/predator/predator_info.html20. EV A(蛋白质结构预测服务器的自动评估) /eva/五. 其他预测服务器1. SignalP (革兰氏阳性菌、革兰氏阴性菌和真核生物蛋白质的信号肽及剪切位点) http://www.cbs.dtu.dk/services/SignalP/2. PEDANT(蛋白质提取、描述及分析工具) http://pedant.mips.biochem.mpg.de/六. 分子生物学软件链接1. 生物信息学可视化工具/alan/VisSupp/2. EBI分子生物学软件档案/software/software.html3. BioCatalog /biocat/e-mail_Server_ANAL YSIS.html4. 生物学软件和数据库档案/Dan/softsearch/biol-links.html5. UC Santa Cruz的序列保守性HMM的SAM软件/research/compbio/sam.html七. 网上博士课程1. 生物计算课程资源列表:课程大纲http://www.techfak.uni-bielefeld.de/bcd/Curric/syllabi.html2. 生物序列分析和蛋白质建模的Ph.D课程http://www.cbs.dtu.dk/phdcourse/programme.html3. 分子科学虚拟学校/vsms/sbdd/4. EMBnet 生物计算指南http://biobase.dk/Embnetut/Universl/embnettu.html5. 蛋白质结构的合作课程/PPS/index.html6. 自然科学GNA虚拟学校http://www.techfak.uni-bielefeld.de/bcd/Vsns/index.html7. 分子生物学算法/education/courses/590bi。
生物信息学与生物数据库生物信息学在现代生物科学研究中扮演着至关重要的角色。
随着技术的进步和数据的爆发性增长,生物数据库成为了整合、存储和检索海量生物信息的重要工具。
本文将介绍生物信息学的基本概念、生物数据库的种类和应用,以及未来生物信息学的发展趋势。
一、生物信息学的基本概念生物信息学是一门跨学科的科学,结合了生物学、计算机科学和统计学的理论与方法,旨在研究生物学中的大规模数据和复杂信息。
生物信息学的主要任务包括序列分析、结构预测、功能注释、系统生物学等。
通过分析和挖掘生物大数据,生物信息学可以帮助我们深入理解生物系统的组成、功能和演化。
二、生物数据库的种类和应用1. 基因组数据库基因组数据库存储了许多物种的基因组序列信息,例如人类基因组数据库、小鼠基因组数据库和植物基因组数据库等。
这些数据库不仅包含了基因序列,还提供了丰富的注释信息,如基因功能、结构特征和遗传变异等。
基因组数据库的应用范围广泛,从基础研究到医学诊断都发挥着重要作用。
2. 蛋白质数据库蛋白质数据库收集了各种物种的蛋白质序列和结构信息,如Uniprot和PDB等。
蛋白质数据库不仅提供了蛋白质序列和结构的详细描述,还包括相关的功能注释、亚细胞定位和相互作用等信息。
蛋白质数据库的应用非常广泛,包括药物设计、蛋白质功能预测和疾病研究等领域。
3. 代谢组数据库代谢组数据库存储了生物体内代谢产物的信息,如HMDB和KEGG等。
代谢组数据库提供了广泛的代谢产物和代谢通路的注释信息,可以帮助研究人员理解代谢网络的结构和功能。
代谢组数据库在代谢研究、药物开发和植物生物学等领域有重要的应用价值。
4. 基因调控数据库基因调控数据库存储了基因的调控关系和表达数据,如Gene Expression Omnibus和ENCODE等。
基因调控数据库提供了基因表达的时间、空间和条件特异性信息,可以帮助研究人员理解基因调控的机制和模式。
基因调控数据库在基因表达调控和疾病研究中起着关键作用。
生物信息学常用数据资源介绍生物信息学是一门将大量数据和信息与生命科学相结合的学科,随着技术的不断发展,越来越多的生物信息学数据资源得到了广泛应用,使得生物信息学研究呈现出爆发式增长的态势。
在接下来的文章中,我将介绍一些常用的生物信息学数据资源。
1. 基因组浏览器基因组浏览器是生物信息学研究中非常常见的一种工具,在基因组浏览器中,用户可以利用多种查询方式快速定位以及查找基因序列、变异位点、基因表达等数据,具体的使用方法可以参考NCBI、UCSC和ENSEMBL等公共数据库。
2. 数据库公共数据库是生物信息学在数据共享和协作方面发挥重要作用的平台之一,NCBI、ENSEMBL、UniProt和GenBank等是生物信息学具有代表性的公共数据库,这些数据库为用户提供了一系列的基因组、转录组、蛋白质、代谢物等多种数据资源,这些数据可以帮助研究者进行基因预测及分析,杂交研究、协同研究等多种生物信息学研究。
3. 软件工具与数据库不同的是,软件工具主要起到数据分析与处理的作用。
对于不同的数据分析任务,不同的软件工具适应程度也不同,因此在生物信息学研究过程中需要不断尝试和探索,比如在转录组分析中,DESeq2和edgeR是非常常用的工具。
4. 人类基因组计划人类基因组计划是一项耗时多年,费用庞大的生命科学研究计划,目的是把人类的基因组解码,并制定新的医学治疗方案等。
在该项目结束后,因为庞大的数据量,成千上万名的研究者可以在其基础上继续开展基因组学研究,这进一步推动了生命科学领域的发展。
5. 元分析数据集随着生物信息学领域的快速发展,元分析数据集作为新工具出现了。
它是由几个相对独立的研究组合而成,旨在研究特定生物过程的数据,比如癌症发病的前因后果,它们包括多个数据来源和测序仪,提供了更全面、多元化的基因数据,为进一步研究确定新的生物标志物和治疗方法提供了更加可靠的基础。
综上,以上我们介绍了一些生物信息学研究中使用频率较高的数据资源,它们共同构成了生物信息学领域的基础设施,在加速科研发展、优化研究流程、减少人力物力成本等方面发挥重要作用,一方面可以帮助科研工作者得到更准确的结果,另一方面又能为更广泛的生命科学研究打开更广的视野。
什么是生物信息学数据库
生物信息学数据库是指存储生物学和生物信息学数据的计算机化系统。
这些数据库包含了各种生物学数据,如基因组序列、蛋白质序列、代谢通路、基因表达数据、蛋白质结构、生物图像等。
这些数据可以通过计算机程序进行访问、搜索和分析,以帮助生物学家和生物信息学家进行研究和发现。
生物信息学数据库通常由多个子数据库组成,每个子数据库都包含特定类型的数据。
例如,基因组数据库包含各种生物的基因组序列,蛋白质数据库包含蛋白质序列和结构信息,代谢通路数据库包含代谢通路和代谢产物信息等。
此外,生物信息学数据库还可以用于对生物信息的收集、存储和管理的研究,包括国际基本的生物信息库和生物信息传输国际物联网系统的建立,生物信息数据库质量的评估与检测系统的建立,以及生物可视化系统和专家系统的建立等。
以上信息仅供参考,如有需要,建议查阅相关网站。
生物大数据技术的生物信息学数据库查询方法生物大数据技术的快速发展为生物信息学领域带来了巨大的变革。
生物信息学数据库作为存储和管理生物学数据的重要工具,被广泛应用于生物大数据的分析和挖掘。
在这篇文章中,我将介绍几种常用的生物信息学数据库查询方法,帮助读者利用生物大数据技术更好地进行生物学研究。
首先,我们来讨论最常用的生物信息学数据库之一,基因组数据库。
基因组数据库包含了各种生物的基因组序列信息,如人类、小鼠、果蝇等。
要查询一个特定基因组的序列信息,最简单的方法是利用基因名或基因符号进行搜索。
将目标基因的名称或符号输入数据库的搜索栏,即可获得与该基因相关的详细信息,例如基因的序列、结构、功能等。
另一个常用的生物信息学数据库是序列数据库。
序列数据库存储了各种生物分子序列的信息,如DNA、RNA和蛋白质序列。
在进行DNA或蛋白质序列的查询时,一种常见的方法是使用序列相似性搜索工具,如BLAST(Basic Local Alignment Search Tool)。
BLAST可以比对查询序列与数据库中的序列,找出最相似的序列并计算相似度。
通过BLAST的结果,我们可以了解到查询序列在数据库中的分布情况、物种来源以及与其他序列的相似性。
另外,功能注释数据库也是生物信息学研究中重要的查询工具。
功能注释数据库存储了各种生物分子的功能和特征信息,如基因的功能、通路信息、蛋白质的结构、功能域等。
要查询一个基因或蛋白质的功能信息,可以使用功能注释数据库提供的工具和接口。
输入目标基因或蛋白质的名称或序列,即可获得与该生物分子相关的功能注释信息,例如其参与的通路、功能域和蛋白质结构等。
此外,还有一些特定领域的生物信息学数据库,如药物数据库、代谢通路数据库等。
这些数据库针对特定的生物学问题提供了更加专门化的查询方法和功能。
例如,药物数据库可以用于查询了解药物的化学结构、药理学特性以及在人体中的作用。
代谢通路数据库则可以帮助研究人员深入了解生物体内代谢通路的结构和功能。
J.SHANXI AGRIC.UNIV.(Natural Science Edition)学报(自然科学版)2013,33(6)003081收稿日期:2013-07-02 修回日期:2013-07-20作者简介:贾栋(1980-),男(汉),山西朔州人,讲师,在读博士,研究方向:生物信息学。
通讯作者:马瑞燕,教授,博士生导师。
Tel:0354-6289555;E-mail:maruiyan2004@163.com基金项目:教育部博导类项目(20111403110004)生物信息学数据库及查询贾栋1,贾小云2,马瑞燕1(1.山西农业大学农学院,山西太谷030801;2.山西农业大学生命科学院,山西太谷030801)摘 要:随着生物分子数据的指数增长,生物信息学相关数据库也有了空前的发展。
介绍了生物信息学数据库的最新研究进展,并分别对核酸和蛋白质序列数据库、生物大分子结构数据库及基因组数据库的主要站点资源进行了评价,以大的生物信息中心NCBI开发的Entrez系统和EBI开发的SRS系统为例,介绍了数据库查询的基本方法。
关键词:生物信息学;数据库;查询中图分类号:Q811.4 文献标识码:A 文章编号:1671-8151(2013)06-0520-06Overview in Bioinformatics Database and the Introduction of InquiryJia Dong1,Jia Xiaoyun2,Ma Ruiyan1(1.College of Agriculture,Shanxi Agricultural University,Taigu Shanxi 030801,China;2.College of Life Sci-ence,Shanxi Agricultural University,Taigu Shanxi 030801,China)Abstract:With the exponential growth of biomolecular data,bioinformatics databases have increased rapidly.The pres-ent study introduced the latest developments of bioinformatics databases,meanwhile,main site resources of nucleic acidand protein sequence databases,biological macromolecular structure database,and genomic databases were evaluatedindependently.The major inquiry methods of databases were described using the Entrez system developed by NCBI andSRS system developed by EBI as examples.Key words:Bioinfomatics;Database;Query 生物信息学(Bioinformatics)是一门交叉学科,包含生物信息的获取、加工、存储、分配、分析、解释等诸多方面,它综合运用数学、计算机科学和生物学的各种工具来阐明和理解大量数据所包含的生物学意义[1]。