第三章序列比对共46页
- 格式:ppt
- 大小:1.81 MB
- 文档页数:46
第三章序列比对1 序列比对的概念序列比对的定义是:根据特定的计分规则,两个或多个符号序列按位置比较后排列,尽可能反映序列间的相似性,这一过程称为序列比对。
2 序列比对的意义生物信息学形成早期的主要研究内容就是序列比对,而当时序列比对研究的课题主要是生物大分子的进化。
核酸序列与蛋白质序列的突变是经实验证明的生物学现象,而现代生物学认为正是这种生物大分子序列的不断变化形成了生物进化的分子基础。
即在地质年代早期的地球生物中的核酸、蛋白质等序列经过几十亿年的演变后,成为了现今极其多样化的生物大分子序列。
我们并不知道这些分子序列祖先演化的实际过程,但可以找到现存序列的相似性,根据相似性去推导演化的过程。
正是通过序列比对找出序列之间的相似性。
序列比对找到的是相似性,可用这相似性去进行同源性分析。
后文所讲到的分子系统发育分析,就是通过序列比对,再进行聚类分析,然后依据所得结果确定被测分子序列的亲缘关系,构建进化树。
序列比对的一个用途就是用于搜索相似序列。
当你获得一段DNA序列或氨基酸序列后,发现对它一无所知时,可以在核酸序列数据库中搜索关于这一序列的信息,一个有效的方法是采用比对算法在数据库中找到一系列与该序列有相似性的序列,并按相似程度由高到低排列。
现在应用的多个序列搜索软件的本质差异基本上是比对算法的差异,随着数据库规模的扩大,对快速搜索的要求越来越高,而优化比对算法是解决问题的方案之一。
在基因组测序中,序列比对更是有重要作用。
基因组测序一般要将若干个拷贝的长核酸序列打断成有重叠区域的许多小片断,测序仪对小片断进行测序,然后把已知碱基排列顺序的小片断用比对算法找到有重叠区的另外的片断,把它们边接起来还原成原来的长核酸序列,得到长核酸序列的碱基排列顺序。
序列比对还可以寻找序列中的特定位点。
当一个基因的某一位点发生突变时,它与原基因进行比对时就能发现这个位点,这在寻找致病基因时尤为重要。
同时,通过比对,可找出不同序列间一些保守性的区域,它们可能行使重要的功能。
序列比对定义
序列比对是一种对两个或多个基因序列、蛋白质序列或其他生物学序列进行比较和分析的方法。
序列比对可以帮助我们识别出物种之间的相似性和差异性,以及研究生物分子进化和功能的关系。
在序列比对中,我们通常使用一种叫做“算法”的数学方法来对比较的序列进行配对。
这些算法可以根据序列中的相同字母、相近字母、缺失字母和插入字母来进行匹配和比对。
一般来说,序列比对时我们采用的算法包括全局比对、局部比对和相似性比对。
全局比对是一种将两个序列的整个长度进行比较的方法。
这种方法可以有效地找出两个序列在结构上的相同之处,但是也会忽略掉一些位于序列中的局部变异。
局部比对不同于全局比对,他将两个序列中相似的局部片段进行匹配和比对,忽略掉其中的不同之处。
这种方法常用于检测蛋白质序列中的保守结构域或一些重要的氨基酸。
相似性比对则是一种将两个或多个序列中相似的地方进行比较的方法。
这种方法可以检测到序列中的不同速率区域发生的进化过程,并识别物种之间的关系。
通过序列比对,我们可以揭示基因、蛋白质或者其他生物分子之间的演化规律,并进一步研究它们的功能和作用。
因此,序列比对已经成为现代生物学研究中必不可少的工具。