基因本体论(Gene_Ontology)概览
- 格式:ppt
- 大小:2.35 MB
- 文档页数:27
GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,堆积因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准.GO是多种生物本体语言中的一种,提供了三层结构的系统定义方式,用于描述基因产物的功能.基因本体论(gene ontology)的建立现今的生物学家们浪费了太多的时间和精力在搜寻生物信息上。
这种情况归结为生物学上定义混乱的原因:不光是精确的计算机难以搜寻到这些随时间和人为多重因素而随机改变的定义,即使是完全由人手动处理也无法完成。
举个例子来说,如果需要找到一个用于制抗生素的药物靶点,你可能想找到所有的和细菌蛋白质合成相关的基因产物,特别是那些和人中蛋白质合成组分显著不同的。
但如果一个数据库描述这些基因产物为“翻译类”,而另一个描述其为“蛋白质合成类”,那么这无疑对于计算机来说是难以区分这两个在字面上相差甚远却在功能上相一致的定义。
Gene Ontology (GO)项目正是为了能够使对各种数据库中基因产物功能描述相一致的努力结果。
这个项目最初是由1988年对三个模式生物数据库的整合开始:: FlyBase (果蝇数据库Drosophila),t Saccharomyces Genome Database (酵母基因组数据库SGD) and the Mouse Genome Database(小鼠基因组数据库MGD)。
从那开始,GO不断发展扩大,现在已包含数十个动物、植物、微生物的数据库。
GO的定义法则已经在多个合作的数据库中使用,这使在这些数据库中的查询具有极高的一致性。
这种定义语言具有多重结构,因此在各种程度上都能进行查询。
举例来说,GO可以被用来在小鼠基因组中查询和信号转导相关的基因产物,也可以进一步找到各种生物地受体酪氨酸激酶。
这种结构允许在各种水平添加对此基因产物特性的认识。
基因本体论(Gene Ontology,简称GO)是一个标准化的功能分类体系,用于描述基因和基因产物的属性。
GO注释是将基因或基因产物的功能与GO术语相关联的过程。
在GO注释中,基因或基因产物的功能被归类到三个主要的本体论分支中:生物过程(Biological Process)、细胞组分(Cellular Component)和分子功能(Molecular Function)。
每个分支都包含一系列定义明确的术语,这些术语描述了基因或基因产物在细胞中的不同角色和活动。
生物过程分支涵盖了基因或基因产物参与的生物学过程,例如代谢、细胞周期、信号传导等。
细胞组分分支描述了基因或基因产物在细胞内的位置,如细胞核、细胞膜、细胞器等。
分子功能分支则描述了基因或基因产物在分子水平上的活动,如催化活性、结合活性等。
GO注释是基于实验证据和计算预测进行的。
实验方法包括基因突变分析、基因表达研究、蛋白质互作分析等,而计算预测则利用生物信息学工具和算法对基因或基因产物的功能进行预测。
通过GO注释,我们可以更深入地理解基因和基因产物的功能,以及它们在生物体中的相互作用和调控机制。
这些信息对于研究疾病的发病机理、药物设计和基因治疗等领域具有重要意义。
gene Ontology (基因本体论)gene ontology为了查找某个研究领域的相关信息,生物学家往往要花费大量的时间,更糟糕的是,不同的生物学数据库可能会使用不同的术语,好比是一些方言一样,这让信息查找更加麻烦,尤其是使得机器查找无章可循。
Gene Ontology就是为了解决这种问题而发起的一个项目。
Gene Ontology中最基本的概念是term。
GO里面的每一个entry都有一个唯一的数字标记,形如GO:nnnnnnn,还有一个term 名,比如"cell", "fibroblast growth factor receptor binding",或者"signal transduction"。
每个term都属于一个ontology,总共有三个ontology,它们分别是molecular function, cellular component 和biological process。
一个基因product可能会出现在不止一个cellular component里面,也可能会在很多biological process里面起作用,并且在其中发挥不同的molecular function。
比如,基因product "cytochrome c" 用molecular function term描述是"oxidoreductase activity",而用biological process term描述就是"oxidative phosphorylation"和"induction of cell death",最后,它的celluar component term是"mitochondrial matrix"和"mitochondrial inner membrane"。
gene ontology衰老相关基因
遗传本体论 (Gene Ontology) 是一种用于描述基因和蛋白质功能的分类体系。
在衰老研究中,许多基因与衰老相关,通过分析这些基因的功能,我们可以更好地理解衰老过程中的分子机制。
衰老是生物体逐渐失去功能和适应能力的过程,是一个复杂的生物学现象。
通过研究衰老相关基因,我们可以揭示衰老的分子机制,为延缓衰老和预防相关疾病提供新的思路和方法。
在遗传本体论中,衰老相关基因可以被归类为不同的功能类别。
例如,一些基因参与细胞增殖和修复,如细胞周期调控基因和DNA 损伤修复基因。
另一些基因参与细胞死亡和凋亡过程,如凋亡调控基因和细胞死亡信号转导基因。
还有一些基因参与氧化应激和抗氧化反应,如抗氧化酶基因和氧化损伤修复基因。
衰老相关基因的研究不仅可以揭示衰老的分子机制,还可以为寻找延缓衰老和预防相关疾病的药物靶点提供线索。
通过了解这些基因的功能,我们可以寻找干预衰老过程的新策略,并开发出更有效的抗衰老药物。
除了基因本身的功能,基因调控网络也在衰老过程中起着重要的作用。
通过研究衰老相关基因的调控网络,我们可以了解基因之间的相互作用和调控关系,进一步揭示衰老的分子调控机制。
通过遗传本体论和衰老相关基因的研究,我们可以更深入地了解衰
老的分子机制,为延缓衰老和预防相关疾病提供新的思路和方法。
这项研究不仅对于人类的健康和长寿具有重要意义,也为生物学研究领域提供了新的突破口。
希望未来的研究能够在这一领域取得更多的进展,为人类的健康和长寿贡献更多的知识和技术。
基因测序数据的分析与解释方法近年来,随着技术的进步和成本的降低,基因测序已经逐渐成为了一种常规的检测手段,被广泛应用于生物医学研究、临床诊断和个性化医疗等领域。
但是,仅仅得到一组基因测序数据并不意味着研究成功,更重要的是对这些数据进行分析和解释,从而得到有意义的结论。
本文将介绍基因测序数据的分析和解释方法,帮助读者理解这个领域的基本知识和方法。
一、拼接和比对基因测序的第一步是将原始碱基序列数据进行处理,得到完整的基因序列,这需要使用一种称为“拼接(assembly)”的方法。
简单来说,拼接就是将不同的短序列拼接成一个完整的序列,这需要使用一些特定的软件来实现。
比如,SPAdes和MIRA是比较常用的拼接软件,它们可以根据不同的序列相似性、覆盖度和质量等信息,将原始序列拼接成一个完整的序列。
接下来,得到的序列需要进行“比对(alignment)”来确定其中的基因区域,这需要使用比对软件。
比对是指将测序序列与一个参考序列进行比较,找到它们的相似之处。
通常情况下,我们可以选择BLAST、Bowtie和BWA等软件,它们可以根据不同的匹配算法、罚分标准和效率等因素,对测序序列进行精确的定位。
二、注释和表达分析得到了比对的结果和基因序列信息之后,我们就需要对这些基因进行“注释(annotation)”,即对一个基因序列进行功能和结构等方面的描述,这有助于我们进一步理解基因的生物学作用。
常用的注释方法包括基因本体论(Gene Ontology)、Kyoto大学基因和通路数据库(KEGG)等。
除此之外,我们还需要进行基因的表达分析,即测序数据中不同基因的表达水平分析。
这需要对基因转录本进行分析,找出不同基因的不同转录本,并计算它们的表达量。
通常情况下,我们可以使用Cufflinks、HTSeq和DESeq等分析工具,对测序数据进行表达分析并绘制相关的图形。
三、变异分析和功能预测基因测序数据还可以用于研究基因的遗传变异,如外显子、内含子、剪切位点等的变异。
DAVID进行GOKEGG功能富集分析GOKEGG(Gene Ontology Knowledge-based Functional Enrichment Analysis)是一种常见的功能富集分析方法,用于研究蛋白质和基因的功能以及它们在生物学过程中的作用。
本文将介绍DAVID(Database for Annotation, Visualization and Integrated Discovery)进行GOKEGG功能富集分析的步骤以及其应用。
首先,进行GOKEGG功能富集分析的第一步是准备输入数据。
通常,这些数据是一组感兴趣的基因或蛋白质的标识符,例如Ensembl ID或基因符号。
这些标识符应该是已经过显著差异表达或其他相关分析的基因集。
第二步是将输入数据导入DAVID分析平台。
DAVID是一个广泛使用的在线功能注释和富集分析工具,可以免费获得并支持大量物种的功能注释分析。
在DAVID中,用户可以选择从多种数据库中查询感兴趣的基因集。
对于GOKEGG功能富集分析,用户可以选择进行基因本体(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析。
基因本体提供了一组用于描述基因和蛋白质功能的分类术语,而KEGG提供了关于生物化学通路和代谢途径的信息。
选择GOKEGG分析后,用户需要将输入数据上传至DAVID平台。
上传后,DAVID将返回一个富集分析结果页面,其中包含针对输入数据的功能富集分析结果。
富集分析结果包括三个主要部分:富集表、KEGG通路和GO分析图。
KEGG通路提供了与输入基因集相关的KEGG通路富集分析结果。
用户可以查看每个通路的富集得分和修正的P值,以及输入基因集中显著富集的基因列表。
通过查看KEGG通路,用户可以了解输入基因集中的基因在不同的代谢途径和生物化学通路中的参与程度。
综上所述,GOKEGG功能富集分析是一种有效的方法,可以帮助研究人员更好地理解基因和蛋白质的功能及其在生物学过程中的作用。
几种常用的基因功能分析方法和工具(转自新浪博客)一、GO分类法最先出现的芯片数据基因功能分析法是GO分类法。
Gene Ontology(GO,即基因本体论)数据库是一个较大的公开的生物分类学网络资源的一部分,它包含38675 个Entrez Gene 注释基因中的17348个,并把它们的功能分为三类:分子功能,生物学过程和细胞组分。
在每一个分类中,都提供一个描述功能信息的分级结构。
这样,GO中每一个分类术语都以一种被称为定向非循环图表(DAGs)的结构组织起来。
研究者可以通过GO分类号和各种GO 数据库相关分析工具将分类与具体基因联系起来,从而对这个基因的功能进行描述。
在芯片的数据分析中,研究者可以找出哪些变化基因属于一个共同的GO功能分支,并用统计学方法检定结果是否具有统计学意义,从而得出变化基因主要参与了哪些生物功能。
EASE(Expressing Analysis Systematic Explorer)是比较早的用于芯片功能分析的网络平台。
由美国国立卫生研究院(NIH)的研究人员开发。
研究者可以用多种不同的格式将芯片中得到的基因导入EASE 进行分析,EASE会找出这一系列的基因都存在于哪些GO分类中。
其最主要特点是提供了一些统计学选项以判断得到的GO分类是否符合统计学标准。
EASE能进行的统计学检验主要包括Fisher 精确概率检验,或是对Fisher精确概率检验进行了修饰的EASE 得分(EASE score)。
由于进行统计学检验的GO分类的数量很多,所以EASE采取了一系列方法对“多重检验”的结果进行校正。
这些方法包括弗朗尼校正法(Bonferroni),本杰明假阳性率法(Benjamini falsediscovery rate)和靴带法(bootstraping)。
同年出现的基于GO分类的芯片基因功能分析平台还有底特律韦恩大学开发的Onto-Express。
2002年,挪威大学和乌普萨拉大学联合推出的Rosetta 系统将GO分类与基因表达数据相联系,引入了“最小决定法则”(minimal decision rules)的概念。
Ontology与Gene Ontology1什么是Ontology?1.1哲学上的Ontology在哲学上,Ontology是指存在论,或称为本体论。
指世界万物都是客观存在,事物运行的规律本身也是一种客观存在。
就是说客观事物是按照一定客观存在的规律运行的。
1.2自然科学中的Ontology在自然科学中,我们研究事物运行的规律,实际上实在一定程度和意义上通过某一个角度来反映客观存在的规律。
广义的说,我们通过某种科学的方法发现的具有一定规律的现象,必然是客观规律在某一个方向的反映,不管它是正确的反映,或是错误的、歪曲的反映。
更一般的说,只要我们的研究结果不是随机的,它就能在一个侧面和角度反映客观事物运行的规律。
1.3狭义的OntologyPeter Karp指出存在论是为了现有知识体系的规范化和再利用而设计的规范化的概念,即在领域内一套概念与关系的形式化的描述。
2Gene Ontology的建立与发展2.1Gene Ontology的建立及目的Gene Ontology是由Gene Ontology Consortium创建的关于基因和蛋白质在细胞中的规则的知识的动态的控制性的词汇的集合以及其中各种关系的语法。
其目的是建立一套完善的词汇、词典及语法的知识体系,可以用于所有的有机体,用一种规范的方式描述它们的已知的客观规律,方便知识的再利用和再开发。
2.2Gene Ontology的知识体系结构目前,GO包括分子功能、生物过程和细胞组成三个体系。
分子功能包括转录因子、DNA解螺旋等;生物过程包括有丝分裂、嘌呤代谢等;细胞组成包括细胞核、端粒等。
GO收录的生物体包括酵母菌属、果蝇、家鼠、霍乱弧菌、人等17种生物。
所有以上的知识通过有向无环图组织起来,建立了GO数据库,并开发了一系列软件提供给用户,对数据库进行查询、编辑、知识发现等操作。
GO还可以与其他现有的数据库建立联系,例如:SWISS-PROT、EnzymeCommission、EGAD、GenProtEC、TIGR role、InterPro、MIPS Funcat等。
笛卡尔本体论本体论(Ontology),是探究世界的本原或基质的哲学理论。
“本体论”一词是由17世纪的德国经院学者P·戈科列尼乌斯首先使用的。
哲学概念对本体论这个词的定义虽有各种不同,但一般对它还是有一定的理解。
大体上说,马克思主义以前的哲学所用的本体论有广义和狭义之别,马克思主义之后哲学融入实践。
从广义说,它指一切实在的最终本性,这种本性需要通过认识论而得到认识,因而研究一切实在最终本性为本体论,研究如何认识则为认识论,这是以本体论与认识论相对称。
从狭义说,则在广义的本体论中又有宇宙的起源与结构的研究和宇宙本性的研究之分,前者为宇宙论,后者为本体论,这是以本体论与宇宙论相对称。
马克思主义哲学不采取本体论与认识论相对立、或本体论与宇宙论相对立的方法,而以辩证唯物主义说明哲学的整个问题。
(来源于冯契主编《外国哲学大辞典》)研究历程“本体”的研究,在希腊哲学史上有其渊源。
从米利都学派开始,希腊早期哲学家就致力于探索组成万物的最基本元素——“本原”(希腊文arche,旧译为“始基”)。
对此“本原”的研究即成为本体论的先声,而且逐步逼近于对being 的探讨。
之后的巴门尼德深刻地提出,“是以外便无非是,存在之为存在者必一,这就不会有不存在者存在”。
并且认为存在永存不变,仅有思维与之同一,亦仅有思维可以获致此真理;而从感觉得来者仅为意见,从意见的观点看,则有存在和非存在,存在既非一从而有变灭。
巴门尼德对being(是,存在)的探讨,建立了本体论研究的基本方向:对于被“是者”所分有的“是”,仅只能由思维向超验之域探寻,而不能由感觉从经验之中获取;此在超验之域中寻得之“是”,因其绝对的普遍性和本原性,必然只能是一。
不过,这一点只有苏格拉底和柏拉图才能真有领会,与他同时的希腊哲人或多或少地有所忽略。
因而,如原子论者虽然也区分了真理认识和暗昧认识,认识到思维与感觉的不同,但是其探寻的“本原”可否由经验获致却极模糊,因而实际上并未能区分超验和经验。
gene ontology analysis基因本体分析(GeneOntologyanalysis)是一种生物信息学方法,用于概括和比较基因组的基因产物的功能,进而发现研究和揭示疾病与基因组间的联系。
注释基因本体是将生物学概念与基因表达资料或基因产物相关联起来进行基因功能和表型分析的一种常用手段。
基因本体分析旨在更好地理解和揭示基因,以研究基因与生物表达及对该物种功能和表型的影响,因此对研究生物学有重要价值。
基因本体分析方法是生物信息学中一种重要的方法,它是从整个基因组的角度进行基因功能研究的方法。
基因本体分析的主要作用是通过比较和集成多种基因产物的特征,如基因序列、结构、功能及表达模式等,以支持和确定一种基因功能和表型的影响,以期为基因功能和表型的研究提供一致的框架。
基因本体分析的主要步骤包括获取基因序列、分析基因序列、建立基因本体模型、计算基因本体模型参数和运行基因本体分析算法等步骤。
首先,要获取一系列的基因序列,其次,对每个基因产物的序列进行分析,找出其在基因本体模型中的位置,然后建立基因本体模型,模型中明确了每个基因产物之间的关系,接着,通过计算模型参数,例如基因产物之间的联系和功能上的差异来推断基因功能,最后,通过基因本体分析算法对基因功能进行比较和聚类分析。
基因本体分析的发展和应用表明,该方法在基因组功能分析方面有着重要的价值。
基因本体分析的结果不仅可以用来比较基因组的差异,还可以用来研究基因表达与疾病发病的关联,推断基因组物种的生物学功能。
基因本体的多样性对基因表达的影响,以及基因与疾病之间的联系,可以帮助我们更加有效地探索基因组的功能,为研究基因物种和疾病之间的关系提供重要线索,从而有助于人们应对和解决多种疾病。
基因本体分析的发展和应用是一个复杂的过程,有许多技术和方法的发展和改进。
比如基于基因本体的转录组表达分析,以及基于基因本体的分子模型建立,这些方法都可以使基因本体分析发挥更强大的作用。
GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,堆积因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准.GO是多种生物本体语言中的一种,提供了三层结构的系统定义方式,用于描述基因产物的功能.基因本体论(gene ontology)的建立现今的生物学家们浪费了太多的时间和精力在搜寻生物信息上。
这种情况归结为生物学上定义混乱的原因:不光是精确的计算机难以搜寻到这些随时间和人为多重因素而随机改变的定义,即使是完全由人手动处理也无法完成。
举个例子来说,如果需要找到一个用于制抗生素的药物靶点,你可能想找到所有的和细菌蛋白质合成相关的基因产物,特别是那些和人中蛋白质合成组分显著不同的。
但如果一个数据库描述这些基因产物为“翻译类”,而另一个描述其为“蛋白质合成类”,那么这无疑对于计算机来说是难以区分这两个在字面上相差甚远却在功能上相一致的定义。
Gene Ontology (GO)项目正是为了能够使对各种数据库中基因产物功能描述相一致的努力结果。
这个项目最初是由1988年对三个模式生物数据库的整合开始:: FlyBase (果蝇数据库Drosophila),t Saccharomyces Genome Database (酵母基因组数据库SGD) and the Mouse Genome Database(小鼠基因组数据库MGD)。
从那开始,GO不断发展扩大,现在已包含数十个动物、植物、微生物的数据库。
GO的定义法则已经在多个合作的数据库中使用,这使在这些数据库中的查询具有极高的一致性。
这种定义语言具有多重结构,因此在各种程度上都能进行查询。
举例来说,GO可以被用来在小鼠基因组中查询和信号转导相关的基因产物,也可以进一步找到各种生物地受体酪氨酸激酶。
这种结构允许在各种水平添加对此基因产物特性的认识。
基因组学数据分析中表观遗传修饰的使用方法表观遗传修饰是指通过对基因组中的DNA修饰来调节基因的表达水平而不改变DNA的序列。
在基因组学研究中,表观遗传修饰的分析方法成为了揭示细胞命运决定和疾病发生发展机制的关键。
本文将介绍基因组学数据分析中表观遗传修饰的使用方法,包括常见分析技术、数据处理流程和常见软件工具。
1. 表观遗传修饰的常见分析技术表观遗传修饰的分析技术多种多样,其中最常用的包括DNA 甲基化分析、组蛋白修饰分析和非编码RNA分析。
DNA甲基化分析是最早也是最常见的表观遗传修饰分析技术,通过测量DNA 上的甲基化位点来探究基因调控过程中的表观遗传变化。
组蛋白修饰分析则是通过测量染色质上的不同化学修饰来研究基因表达和染色质状态之间的关系。
非编码RNA分析则主要关注非编码RNA的表达模式和功能,如长链非编码RNA(lncRNA)和微小RNA(miRNA)的作用机制等。
2. 基因组学数据分析中表观遗传修饰的数据处理流程基因组学数据分析中表观遗传修饰的数据处理流程一般分为数据预处理、差异分析和富集分析三个主要步骤。
(1)数据预处理:数据预处理是指对原始数据进行质量控制和过滤,以确保后续分析的准确性和可靠性。
在DNA甲基化测序数据处理中,需要对测序 reads 进行质量控制、去除低质量 reads 和接头序列,并利用软件工具将唯一比对的 reads 保存为 BAM 或者 BED 文件。
组蛋白修饰和非编码RNA测序数据的预处理过程类似,也需要进行质量控制和去除低质量 reads。
(2)差异分析:差异分析是表观遗传修饰研究的关键步骤,通过比较不同样本间表观遗传修饰的水平来筛选差异修饰位点或差异表达基因。
在DNA甲基化测序数据的差异分析中,可以利用统计方法如Fisher精确检验、Student's t 检验或Wilcoxon秩和检验来计算不同组间的甲基化位点的显著差异,统计显著的结果可以进行多重检验校正,如Benjamini-Hochberg 校正。
8基因功能注释范文基因功能注释是对基因序列及其产物的功能进行研究和解释的过程。
在生物学研究中,了解基因的功能对于理解生物体的发育、生长和疾病的发生具有重要意义。
下面将介绍8种常见的基因功能注释方法。
1. 基因表达定量分析:通过测量基因在不同组织、发育阶段或条件下的表达水平,了解基因在生物过程中的调控和功能。
常用的方法包括实时定量PCR、RNA测序(RNA-seq)和芯片技术。
2.蛋白质互作网络分析:解析蛋白质间的相互作用关系,揭示蛋白质在细胞过程中的功能。
可以通过蛋白质互作数据的整合和分析,构建蛋白质互作网络图,识别关键蛋白质和调控模块。
3. 基因功能富集分析:将感兴趣的基因列表与已知的基因功能注释数据进行比对,确定是否富集一些功能或通路。
常用的分析工具有DAVID、GO enrichment和KEGG pathway分析等。
4. 基因本体注释:基因本体(Gene Ontology,GO)是一种用于统一描述基因和基因产物功能的资源。
基因本体注释将基因与特定的功能术语关联,可以帮助研究者了解基因的功能特点。
5.疾病关联分析:将基因与疾病的关联进行研究,揭示基因在疾病中的功能和作用机制。
常用的方法包括GWAS(基因组关联分析)、疾病关联数据库的查询与分析等。
6. 基因表达调控分析:研究基因的转录调控机制,揭示转录因子和其他调控元件在基因表达调控中的功能。
常用的方法包括Chip-seq、ATAC-seq和TRAP-seq等。
7.基因变异注释:分析基因组DNA序列的变异信息,包括单核苷酸多态性(SNP)、插入/缺失变异和结构变异等。
通过将变异与已知的基因功能注释数据进行关联,确定变异对基因功能的影响。
8.比较基因组学分析:通过比较不同物种、同一物种不同个体或不同组织的基因组序列和基因表达数据,研究基因的保守性、演化和功能差异。
常用的方法有进化分析、序列比对和dN/dS比值等。
综上所述,基因功能注释是通过多种方法对基因的序列、表达和功能进行分析,以揭示基因在生物过程中的调控机制和功能。
内部资料仅供参考基因本体论(Gene Ontology)数据库基本介绍Version No.2010.10.03西安电子科技大学计算机学院作者:孔垂亮电邮:morrain1987@导师:高琳目录目录第一部分GO是什么? (2)1.1基因本体论(gene ontology)的建立 (2)1.2本体论(The ontologies)简介 (3)1.3本体论语义之间的关系及其组织结构 (4)1.3.1语义之间关系的基本理解 (4)1.3.2关系之间的推导 (5)1.3.3调节控制关系(the regulates relation)及其推导 (6)1.3.4本体论的组织结构 (7)1.4GO的注释(Annotation) (8)第二部分GO怎么用? (10)2.1下载本体论文件和注释文件 (10)2.2GO语义及其相关注释的浏览与搜索 (17)2.2.1AmiGO的基本使用说明 (17)2.2.2语义关系的图形化描述 (20)2.2.3根据语义检索 (22)2.2.4根据基因产物检索 (25)第一部分GO是什么?GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。
GO是多种生物本体语言中的一种,提供了三层结构的系统定义方式,用于描述基因产物的功能.ontology))的建立1.1基因本体论(gene ontology现今的生物学家们浪费了太多的时间和精力在搜寻生物信息上。
这种情况归结为生物学上定义混乱的原因,不同的生物学数据库可能会使用不同的术语,好比是一些方言一样。
不光是精确的计算机难以搜寻到这些随时间和人为多重因素而随机改变的定义,即使是完全由人手动处理也无法完成。
举个例子来说,如果需要找到一个用于制抗生素的药物靶点,你可能想找到所有的和细菌蛋白质合成相关的基因产物,特别是那些和人体中蛋白质合成组分显著不同的。