3序列比对原理
- 格式:ppt
- 大小:8.19 MB
- 文档页数:71
3.序列比对和数据库搜索(生物信...文章目录• 3.1 序列两两比对• 3.2 多序列比对生物信息学教程系列第三章3 序列比对和数据库搜索比较是科学研究中最常见的方法,通过将研究对象相互比较来寻找对象可能具备的特性。
在生物信息学研究中,比对是最常用和最经典的研究手段。
最常见的比对是蛋白质序列之间或核酸序列之间的两两比对,通过比较两个序列之间的相似区域和保守性位点,寻找二者可能的分子进化关系。
进一步的比对是将多个蛋白质或核酸同时进行比较,寻找这些有进化关系的序列之间共同的保守区域、位点和profile,从而探索导致它们产生共同功能的序列模式。
此外,还可以把蛋白质序列与核酸序列相比来探索核酸序列可能的表达框架;把蛋白质序列与具有三维结构信息的蛋白质相比,从而获得蛋白质折叠类型的信息。
比对还是数据库搜索算法的基础,将查询序列与整个数据库]的所有序列进行比对,从数据库中获得与其最相似序列的已有的数据,能最快速的获得有关查询序列的大量有价值的参考信息,对于进一步分析其结构和功能都会有很大的帮助。
近年来随着生物信息学数据大量积累和生物学知识的整理,通过比对方法可以有效地分析和预测一些新发现基因的功能。
3.1 序列两两比对序列比对的理论基础是进化学说,如果两个序列之间具有足够的相似性,就推测二者可能有共同的进化祖先,经过序列内残基的替换、残基或序列片段的缺失、以及序列重组等遗传变异过程分别演化而来。
序列相似和序列同源是不同的概念,序列之间的相似程度是可以量化的参数,而序列是否同源需要有进化事实的验证。
在残基-残基比对中,可以明显看到序列中某些氨基酸残基比其它位置上的残基更保守,这些信息揭示了这些保守位点上的残基对蛋白质的结构和功能是至关重要的,例如它们可能是酶的活性位点残基,形成二硫键的半胱氨酸残基,与配体结合部位的残基,与金属离子结合的残基,形成特定结构motif的残基等等。
但并不是所有保守的残基都一定是结构功能重要的,可能它们只是由于历史的原因被保留下来,而不是由于进化压力而保留下来。
第二节序列比对1引言序列比对是生物信息学的基本组成和重要基础。
序列比对的基本思想是,基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,检测序列之间的相似性,发现生物序列中的功能、结构和进化的信息。
序列比对包括双序列比对(pair alignment)和多序列比对(multiple alignment),主要有三个方面的应用。
1.序列功能预测:了解未知序列和已知序列的相同和不同点,可以推测未知序列的结构和功能。
2.分子进化分析:通过多序列比对,分析序列的相似性,判别序列之间的同源性,推测不同序列在结构、功能以及进化上的联系,进行分子进化上的研究。
3.搜索序列数据库,找到已发布的相似性和同源性序列。
值得注意的是,在分子生物学中,DNA或蛋白质的相似性是多方面的,可能是核酸或氨基酸序列的相似,可能是结构的相似,也可能是功能的相似。
一级结构序列相似的分子在高级结构和功能上并不必然有相似性,反之,序列不相似的分子,可能折叠成相同的空间形状,并具有相同的功能。
一般的序列比对主要是针对一级结构序列上的比较。
序列和结构之间的比对方面也已经有不少研究,有兴趣的读者可以参考“文献“中的”序列和结构之间的比对“部分。
1部分内容取自Weir B.S.Genetic Data AnalysisⅡ—Methods for Discrete Population Genetic Data, Sunderland:Sinauer Associates Inc.Publishes,1996双序列比对双序列比对的算法主要分为两类:1.整体比对(global alignment)从全长序列出发,考虑序列的整体相似性,即。
Needleman-Wunsch算法是一种经典的基于动态规划的整体比对算法,其最佳比对中包括了全部的最短匹配序列。
2.局部比对(Local alignment)考虑序列部分区域的相似性,即有时两个序列总体并不很相似,但某些局部片断相似性很高。