上海交大 中文翻译 生物化学课本:第6章 生物信息学和进化的研究方法
- 格式:doc
- 大小:4.30 MB
- 文档页数:31
第一章绪论一、生物化学的的概念:生物化学(biochemistry)是利用化学的原理与方法去探讨生命的一门科学,它是介于化学、生物学及物理学之间的一门边缘学科。
二、生物化学的发展:1.叙述生物化学阶段:是生物化学发展的萌芽阶段,其主要的工作是分析和研究生物体的组成成分以及生物体的分泌物和排泄物。
2.动态生物化学阶段:是生物化学蓬勃发展的时期。
就在这一时期,人们基本上弄清了生物体内各种主要化学物质的代谢途径。
3.分子生物学阶段:这一阶段的主要研究工作就是探讨各种生物大分子的结构与其功能之间的关系。
三、生物化学研究的主要方面:1.生物体的物质组成:高等生物体主要由蛋白质、核酸、糖类、脂类以及水、无机盐等组成,此外还含有一些低分子物质。
2.物质代谢:物质代谢的基本过程主要包括三大步骤:消化、吸收→中间代谢→排泄。
其中,中间代谢过程是在细胞内进行的,最为复杂的化学变化过程,它包括合成代谢,分解代谢,物质互变,代谢调控,能量代谢几方面的内容。
3.细胞信号转导:细胞内存在多条信号转导途径,而这些途径之间通过一定的方式方式相互交织在一起,从而构成了非常复杂的信号转导网络,调控细胞的代谢、生理活动及生长分化。
4.生物分子的结构与功能:通过对生物大分子结构的理解,揭示结构与功能之间的关系。
5.遗传与繁殖:对生物体遗传与繁殖的分子机制的研究,也是现代生物化学与分子生物学研究的一个重要内容。
第二章蛋白质的结构与功能一、氨基酸:1.结构特点:氨基酸(amino acid)是蛋白质分子的基本组成单位。
构成天然蛋白质分子的氨基酸约有20种,除脯氨酸为α-亚氨基酸、甘氨酸不含手性碳原子外,其余氨基酸均为L-α-氨基酸。
2.分类:根据氨基酸的R基团的极性大小可将氨基酸分为四类:①非极性中性氨基酸(8种);②极性中性氨基酸(7种);③酸性氨基酸(Glu和Asp);④碱性氨基酸(Lys、Arg和His)。
二、肽键与肽链:肽键(peptide bond)是指由一分子氨基酸的α-羧基与另一分子氨基酸的α-氨基经脱水而形成的共价键(-CO -NH-)。
生物化学电子版教材第九版生物化学(九版)是美国科学院教授等精心编制的,收集自全球最新的研究成果的权威生物学教材。
它着重在介绍有机物的结构和功能,帮助读者更准确地表达生物过程,更深入地构建生物机理和动态过程。
一、概述1. 介绍:本书聚焦于介绍有机物的结构和功能,重点讨论有机分子的结构及其功能之前的机制。
2. 结构活性相关:结合分子结构和功能性能的机制,关注有机物的动态变化和活性关系,完成不同有机系统的研究。
3. 重点设计:该教材设计的重点是增加读者的认知和理解能力,使之能够更好地理解关于有机物的蕴藏知识。
二、论文1. 化学演化:本书对化学演化的轨迹进行了介绍,以及氨基酸与聚糖的构建方式。
2. 氨基酸分子结构:介绍了氨基酸分子的基本结构,包括氨基酸成分、羟基酸及缩合酶循环等。
3. 无机物及有机物分子结构:介绍无机物及有机物分子的基本结构,主要包括可氧化碳(糖类和酯)、脂肪酸以及脂质的结构特征。
4. 酶的动力学:本书介绍了酶的反应机制,以及其与调节酶活性之间的关系。
三、化学生物学1. 生物大小分子结构:介绍相关大小分子结构特征,特别是蛋白质,核酸,糖醇及其他有机分子等参差不齐的物质结构。
2. 生物技术:对于生物技术,本书包含细胞转录调控,次级代谢经验剖析及系统分析等术语,并着重探究调控体系的化学机制。
3. 复合物分析:本书及其介绍的复合物分析术语涉及无机物的缓冲,以及有机物的泰勒实验等实验技术。
四、生物体系1. 元素形成:介绍了地球中元素的组成,以及它们如何影响生物体系。
2. 水机理:通过潜水技术,全面揭示水的机制,特别是淡水的原理,以及水分子的影响。
3. 能量转化:详细介绍了不同类型的能量的转化及相应的物质的变化。
五、生物进化1. 进化基础:比较研究古生物和当代生物,以及洞察演化的作用。
2. 生物护理:聚焦生物受到的威胁及其防护措施,以及通过遗传改良来改善生物体系。
3. 生态多样性:通过认识不同环境下流失多样性的原因,以及保护生态系统所需考虑的因素,应对环境变化。
红河学院《生物信息学》课程教学大纲一、课程基本情况与说明(一)课程代码:(二)课程英文名称:bioinformatics(三)课程中文名称:生物信息学(四)授课对象:生物科学和生物技术专业本科生(五)开课单位:生命科学与技术学院(六)教材:1、生物技术专业:《生物信息学应用技术》,王禄山、高培基编,化学工业出版社,2008年2、生物科学专业:《生物信息学基础》,孙啸、陆祖宏、谢建明编,清华大学出版社,2005年(七)参考书目[1]《生物信息学》,DavidW.Mount著,钟扬等译,高等教育出版社,2003年[2]《基因组数据分析手册》,胡松年、薛庆中编,浙江大学出版社,2003年[3]《生物信息学中的计算机技术(Developing Bioinformatics Computer Skills)》,CynthiaGibas,Per Jambeck著,孙超等译,中国电力出版社,2002年[4]《生物信息学:基因和蛋白质分析的实用指南》,Andreas D. Baxevanis,Francis OuelletteB F著,李衍达、孙之荣等译,清华大学出版社,2000年[5]《生物信息学算法导论(An Introduction to Bioinformatics Algorithms )》,琼斯,帕夫纳著,王翼飞等译,化学工业出版社,2007年(八)课程性质(五号宋体加粗)生物信息学是生命科学领域一门新兴的边缘学科,综合了生物学、计算机学、信息学、统计学等方面的知识。
该学科在学生掌握生物化学、遗传学、分子生物学以及计算机应用、高等数学等相关知识的基础上开设,属于生物类专业的专业课程(必修或选修)。
通过学习,学生能够加深对分子生物学和基因工程等课程的理解,并为进一步学习基因组学(genomics)和蛋白质组学(protemics) 奠定基础。
(九)教学目的1、给学生介绍生物信息学的主要内容以及未来可能的发展方向,为学生构建相关知识体系,开阔学生的视野,为将来进一步学习、科研打下基础。
sjtu086000生物与医药大纲生物与医药学是现代生命科学的重要组成部分,它研究生物体的结构、功能、发育和进化,以及与生物相关的医学基础知识和技能。
本文将介绍生物与医药学的大纲内容,包括生物学基础、生物化学、生理学、分子生物学等方面。
生物与医药学的大纲包括以下几个重要内容:1.生物学基础:这部分内容主要介绍生物的基本结构、功能和分类。
包括细胞学、遗传学、进化论等内容。
细胞学主要研究生物体的最基本单位-细胞的结构和功能,以及细胞的分裂和分化过程。
遗传学主要研究基因的遗传传递和表达规律,以及基因突变和遗传病的发生机制。
进化论主要研究生命的起源和演化过程,以及生物多样性的产生和维持。
2.生物化学:这部分内容主要介绍生物体内重要的有机分子和生物化学反应。
包括蛋白质、核酸、碳水化合物和脂类的结构和功能,以及酶的特性和调节。
此外,还会介绍能量转换和代谢途径,如糖酵解、呼吸链和光合作用。
3.生理学:这部分内容主要介绍生物体的生理功能和调节机制。
包括神经生理学、内分泌学、心血管生理学、呼吸生理学等方面。
神经生理学研究神经细胞的结构和功能,以及神经传递和神经调节。
内分泌学研究内分泌腺体和激素的合成和调节,以及激素在机体内的作用和相互关系。
心血管生理学研究心脏和血管的生理功能,包括心脏的收缩和舒张、血液的循环和压力调节等。
呼吸生理学研究呼吸器官的结构和功能,以及呼吸过程和气体交换。
4.分子生物学:这部分内容主要介绍生物体的分子机制和基因表达调控。
包括DNA的结构和复制、蛋白质的合成和折叠,以及基因表达的调控和分子信号传导等。
分子生物学是现代生物学的重要分支,它揭示了生物体内基本的遗传和调控机制,对于生物科学的研究和应用具有重要意义。
综上所述,生物与医药学的大纲内容包括生物学基础、生物化学、生理学和分子生物学等方面。
通过学习这些内容,可以了解生物体的基本结构和功能,以及与生命相关的重要生化和生理过程,为后续的医学和生命科学研究打下基础。
电子穴(Electron sink): 活性部位的赖氨酸或另一位置碱性基团起来此作用, 有利于醛亚胺-酮亚胺的转化. PLP也起着电子穴的作用钴铵素(维生素B12):是治疗恶性贫血的, 它的核心带有一个中心钴原子的咕啉环高氨血症(Hyperammonemia): 是因为血液中NH4+含量过高所致.家族性高胆固醇血症: 是由于血浆中LDL-胆固醇的浓度高, 胆固醇在各种组织中沉织, 患者的分子缺陷是不具备或缺乏功能完善的LDL受体天冬氨酸转氨甲酰酶(ATC酶): 是嘧啶生物合成的关键步骤, 此酶起氨甲酰化作用. 它也是一种有趣的调节酶. PRPP: 全称5-磷酸核糖-1-焦磷酸, 是组氨酸和色氨酸生物合成中的关键性中间产物,是核苷酸中核糖磷酸部份的供体. 它也参与多种生物合成.补救途径(Salvage pathway): 嘌呤核苷酸可以通过此途径事先形成碱基的合成, 它比从头合成途径的反应简单. 反应里, PRPP的核糖磷酸部份转移给嘌呤, 形成相应核苷酸.莱纳二氏综合症(Lesch-Nyhan syndrome):是因为几乎没有次黄嘌呤-鸟嘌呤磷酸核糖转移酶而带来的破坏性后果, 是先天性代谢紊乱. 它病征是强制性自残行为, 也有彼此寻衅的倾向, 同时也会智力缺陷和痉挛葡萄糖激酶:是为糖原的合成提供葡萄糖6-磷酸,在葡萄糖供应有限时,肝脏中葡萄糖激酶的高KM就给大脑和肌肉以需要萄萄糖的第一个信号西佛碱:二羟丙酮磷酸与动物醛缩酶活性部位的专一的赖氨酸残基形成质子化西佛碱烯醇化阴离子:质子化的西佛碱在催化作用中促进二羟丙酮酸形成烯醇化阴离子负碳离子:TPP(硫胺素焦磷酸)电离的,与丙酮酸的羰基加成铁硫簇:电子又由FMNH2传递到一系列的铁硫复合物,是NADH-Q还原酶中的第二种类型的辅基苹果酸-天冬氨酸穿梭: 在肝脏和心脏中,来自细胞质的NADH的电子由它带到线粒体中去的产热蛋白(thermogenin): The inner mitochondrial membrane contains a large a mount of it, generates heat by short-circuiting the mitochondrial proton battery.无效循环: 又叫底物循环, 象果糖6-磷酸磷酸化为果糖1,6-二磷酸和后者又水解为果糖6-磷酸这样的一切反应. 被认为是代谢控制中的缺陷. 其生物学作用是: (1) 放大代谢信号; (2) 由A TP水解产生热科里循环(Cori Cycle): 由肝脏给收缩中的肌肉提供葡萄糖,肌肉由于糖酵解中葡萄糖转变为乳酸而产生A TP, 然后肝脏又再从乳酸合成葡萄糖的过程1.利用维生素B12(钴胺素)衍生物做辅酶地反应(1)甲基丙二酰CoA变位酶methylmelonyl CoA mutase 25章D型——L型异构化(2)高半胱氨酸甲基转移酶homocysteine methyltransferase 高半胱氨酸——甲硫氨酸2.奇数FA可以生成Glc脂肪:甘油——DHAP——糖酵解/糖异生FA——酮体(偶数)/酮体+糖(奇数)3.CDP-DAG,UDP-Glc,UDP-choline(1)均为活性中间物(2)底物均为核苷三磷酸与磷酸化底物(3)与羟基反应(Ser/Glc)4.3HMG CoA(1) 酮体合成(线粒体)(2)胆固醇合成(胞液)5.血浆中三大抗氧化解毒剂:胆红素尿酸维生素C 细胞内:谷胱甘肽6.多功能每:(1)FA synthase (2) PFK2,FBPase3 (3)胺甲酰磷酸合成酶,天冬氨酸转胺甲酰酶,二氢乳清酸酶(4)转移酶,1,6-葡萄糖苷酶(5)异柠DH Kinase/phosphatase7.RNA是初始遗传物质的证据:(1)重要辅酶为其衍生物(2)DNA合成经由RNA脱氧(3)dTMP经由dUMP甲基化8.抗癌药物:氟尿嘧啶氨基蝶呤氨甲蝶呤9.芳环脱环反应的双加氧酶10.酶的共价修饰:糖原磷酸化酶腺苷酰化酶11.二十多种遗传病的原因12.GMP/AMP的合成及增效抑制13.PLP辅酶的反应糖原磷酸解/转氨酶/磷脂酰丝氨酸/AA合成14.TPP辅酶反应转酮醇酶/α-KG DH/Pyr DH/ Pyr——乙醛15.脱羧推动的反应:OAA——PEP/ FA elongation PPi水解推动的反应:一、名词解释(30分)1. 鞘磷脂(4分)2. 外显子(4分)3. LDL受体(4分)4. 结构域(4分)5. 细胞内信使(4分)6. 反转录病毒(5分)7. 激素反应元件8. 一碳单位(4分)二、问答题(50分)1. 简述DNA双螺旋结构模式的要点及春与DNA生物学功能的关系。
上海交通大学网络教育学院医学院分院生物化学技术课程习题册答案专业:检验技术层次:专升本绪论一、名词解释1.生物化学技术:是研究生物体的化学组成、结构、功能以及在生命活动中化学物质的代谢、调节控制等的实验方法。
2.盐溶:蛋白质、酶及其它们与其它物质的复合体在离子强度低的盐溶液中,其溶解度随着盐溶液浓度的升高而增加,此现象称为“盐溶”。
3.盐析:当溶液中盐浓度不断上升,达到一定程度,蛋白质等的溶解度反而逐渐减小,并先后从溶液中析出,称为“盐析"。
4.透析:利用溶液组分能否通过半透膜并由引起膜两边溶液的化学势能不同,而达到去除溶液中的小分子物质。
5.超滤(反向渗透):利用压力或离心力,迫使水和其他小的溶质分子通过半透膜,而蛋白质不能透过半透膜仍留在膜上。
6.凝胶层析法(Gel Chromatography):利用各种物质分子大小不同,在固定相上受到阻滞程度不同而达到分离的一种层析方法。
二、单选题1。
凝胶层析不可应用于:( B )A。
脱盐 B. 一步分离纯化生物大分子物质 C。
高分子溶液的浓缩D。
测定高分子物质的分子量 E.分离分子大小不同的物质2。
核酸在紫外区有强吸收,其最大吸收值是在波长:( C )A.206nm B.240nm C.260nm D.280nm E.304nm3.对260nm波长的紫外有强吸收主要是因为( E )A.核糖的环式结构 B。
脱氧核糖的环式结构C.嘌呤的双环结构 D.嘧啶的单环结构 E. 嘌呤和嘧啶环中的共轭双键4。
蛋白质在紫外区有强吸收,其最大吸收值是在波长:( D )A.206nm B.240nm C.260nm D.280nm E.304nm5.用紫外分光光度法测定蛋白质,因为蛋白质在紫外区有个最大吸收峰,其峰值波长是:D A.220nm B.245nm C.260nm D.280nm E.340nm6。
用吸收光谱法测量双链DNA的含量为:( A )A.C(ug/ml)=A260×50×稀释倍数B.C(ug/ml)=A260×40×稀释倍数C.C(ug/ml)=A260×30×稀释倍数D.C(ug/ml)=A260×20×稀释倍数E.C(ug/ml)=A260×10×稀释倍数7。
生物化学A?〔BiochemistryA〕科目考试大纲考试科目代码:766适合专业:生物化学与分子生物学、微生物与生化药学、食品科学课程性质和任务:生物化学是研究生物体内化学物质〔包括生物大分子〕的性质及其代谢调控的一门根底学科,研究的内容涉及糖类、脂类、蛋白质、酶、核酸、激素,以及与生物氧化相关的糖、脂、蛋白质、核酸生物合成与代谢调控有关的根底知识。
要紧任务是学习糖类、脂类、蛋白质、核酸、酶等各种生物物质的结构、性质以及这些生物物质在生物体内的代谢过程等特性,为进一步深造奠定根底。
要紧内容和全然要求:0.绪论把握生物化学的涵义;熟悉生物化学理论与实践的关系;了解生物化学的现状和进展。
1.糖类把握重要的单糖〔葡萄糖、果糖、半乳糖和核糖〕的结构和性质;熟悉几种重要的双糖〔蔗糖、麦芽糖和乳糖〕的结构和性质;了解多糖〔同多糖和杂多糖〕的种类。
2.脂质把握必需脂肪酸的概念和种类;熟悉磷脂、糖脂、胆固醇的结构和功能;了解脂质的提取、不离与分析。
3.蛋白质把握蛋白质的全然结构单位——氨基酸的结构和性质;把握蛋白质的化学结构〔一、二、三、四级结构〕和蛋白质的理化性质;熟悉蛋白质一级结构的测定方法和蛋白质的不离提纯原理;理解蛋白质结构与功能的关系;了解蛋白质折叠和结构推测,以及亚基缔合和四级结构的相关知识。
4.酶把握酶的结构与功能和酶反响动力学机理;熟悉酶的组成、分类、命名、酶活力测定和酶的提取和纯化过程;了解调节酶、同工酶、诱导酶、抗体酶和固定化酶及其应用。
5.核酸把握核酸和核苷酸的理化性质;熟悉核酸的化学组成及其化学结构;了解核酸的发觉、研究简史和方法。
熟悉一些重要的抗生素的化学和医疗特性;理解抗生素的抗菌作用机理;了解抗生素的应用。
7.激素把握激素的化学实质和作用机理;熟悉几类重要激素〔氨基酸衍生物类、多肽类和固醇类等〕的作用;了解植物激素和昆虫激素的种类和功能。
与物质运输把握生物膜的组成和性质;熟悉跨膜物质运输的种类;理解生物膜结构的要紧特征和模型;了解膜离子载体和物质运输的分子机制。
第六章生物信息学和进化的研究方法
蛋白质序列清楚地反映出生物的进化关系。
Jane Goodall和一只黑猩猩互动提示人类与黑猩猩亲缘关系近。
血红蛋白的氨基酸序列也证明人类与黑猩猩的亲缘关系。
在血红蛋白153个氨基酸残基中,人血红蛋白(红色)与黑猩猩血红蛋白(蓝色)只有一个氨基酸残基不同。
[左边, Kennan Ward/Corbis.]
如同人类家族的成员一样,分子家族的成员有一些共同的特征。
比较蛋白质的三维结构(即与蛋白功能关系最密切的参数),我们很容易鉴定蛋白家族成员。
我们在蛋白质折叠章节介绍过的牛核酸酶,其三维结构与人核酸酶的三维结构颇为类似(图6.1)。
虽然这种类
1
似性在意料之中(因为这两个蛋白质的功能是一样的),但是有些情况下这种比较却获得了我们意料之外的结果。
例如血管生成素(angiogenin)是能够刺激血管生成的蛋白质。
但是血管生成素的三维结构与核酸酶三维结构非常相似,说明血管生成素和核酸酶属于同一蛋白家族(图6.2)。
因此它们肯定来自同一祖先分子。
图6.1 牛和人核酸酶结构。
功能类似性的蛋白质常常具有结构类似性。
[Drawn from 8RAT.pdb. and 2RNF.pdb]
图6.2 血管生成素的结构。
该蛋白质能促进血管生长,具有与核酸酶非常相似的三维结构。
2
遗憾的是,知道三维结构的蛋白质数量有限。
我们知道很多蛋白质的编码基因序列或氨基酸序列(得益于DNA克隆和DNA序列测定)。
在蛋白质氨基酸序列水平就能观测到蛋白质的进化关系。
例如牛核糖核酸酶和血管生成素的氨基酸序列有35%的氨基酸残基是一致的。
那么这种相似性水平是否足以保证蛋白质的进化关系?如果不够,需要多高的相似性才能说明蛋白质有进化关系?本章介绍氨基酸序列比较的方法和推测蛋白质进化关联的方法。
序列比较已经成为现代生物化学研究的最有力工具之一。
最新鉴定的新序列与数据库比较,确定与该序列相关的分子。
利用这些信息,能够研究具有这种新近测序分子功能和机制。
如果三维结构也清楚,我们能比较三维结构、证实序列比较的结论,还能揭示那些序列比较没有发现的成员。
考察现有蛋白序列的脚印,生化学家成了分子考古学家,能了解分子进化史所发生的事件。
序列比较能够确定进化途径、估计特定进化事件发生的时间。
利用这些信息能够构建特定蛋白质或核酸从古生菌和细菌到真核生物(包括人类)的进化树。
也可以用实验方法研究分子进化。
有些化石的DNA分子也可以进行PCR扩增和测序,直接观察古代的分子序列。
此外科研人员也可以进行一些核酸复制实验观察实验室的分子进化。
这些研究的结果能揭示更多的分子进化机制。
6.1 同源物来自同一祖先
生物化学进化的研究主要是确定蛋白质、其它生物分子、以及生物化学途径如何随着时间发生的变化。
来自同一祖先的两个物体就是同源关系。
同源(homologus)分子或同源物(homologs)可以分为两类(图6.3)。
侧向同源物(paralogs)指同种生物的同源物。
直向同源物(orthologs)指不同物种间具有非常相似甚至一致功能的同源物。
了解分子间的同
3
源性能够揭示分子的进化历史和它们的生物功能。
如果新近测序的蛋白质与功能已知蛋白具有同源性,那么这个新近测序的蛋白质也可能具有这样的生物功能。
如何确定人类两种蛋白质具有侧向同源?如何确定人类蛋白和酵母蛋白具有直向同源?我们在6.2节要介绍这方面的内容。
核酸序列或氨基酸序列之间有显著的类似性常常表明这些物质之间有同源性。
当然,三维结构比较更能揭示生物分子的同源性。
图6.3 两类同源蛋白。
不同生物体内执行类似甚至相同功能蛋白质属于垂直同源物(ortholog)。
而同一物种内执行不同功能的相似蛋白叫侧向同源蛋白(paralog)。
6.2 序列比对的统计分析检测同源性(homology)
两个分子之间有显著的序列类似性提示这两个分子可能有共同的进化祖先,因此有同样的三维结构、生物功能和作用机制。
虽然核酸序列和蛋白质序列都可用来进行序列比对,但
4
是蛋白质氨基酸序列比对更好。
最显著的原因是构建蛋白质的单体有20种,而构建核酸的单体只有4种。
为了解释蛋白质比较的方法,我们先考察球蛋白。
肌红蛋白是肌肉组织的氧结合蛋白,而血红蛋白是血液的载氧蛋白(第7章)。
这两种蛋白质都有血红素辅基(一种有铁的有机分子,能结合氧)。
人血红蛋白有4个多肽链,每个多肽链结合一个血红素辅基。
这四个多肽链分别是两个完全一样的链和两个完全一致的链。
此处我们仅考察链。
研究人血红蛋白链的氨基酸序列与人肌红蛋白氨基酸序列之间的类似性(图6.4)。
为了确定这两个序列之间的类似性,建立了序列比对方法。
图6.4 人血红蛋白链和人肌球蛋白进行序列比对。
链血红蛋白有141个氨基酸,肌红蛋白有153个氨基酸。
如何比对两个序列?最简单的方法是将一个蛋白质的氨基酸序列与另一个蛋白质的氨基酸序列进行所有可能的比对,记录各种比对所获得的一致残基的数目。
这种比对不难,只需每次将一个序列沿着另一个序列滑行一位,计算匹配氨基酸残基的数量(图6.5)。
5
图6.5 人血红蛋白链和人肌球蛋白进行序列比对。
(A)一条序列沿另一条序列滑行,进行序列比对(每次滑行一个氨基酸位点),统计两条多肽链中氨基酸一致的位点数量。
(B) 匹配数量最多的比对模式(上),将一致氨基酸位点数量(纵轴)与滑行位点(横轴)作图(下)。
链和肌红蛋白最佳比对只有23个位点是一致的,分散在多肽链中央区域。
但是,相近的比对有22个一致位点,而且这些位点集中于蛋白质的N-端。
如果在比对过程中引入缺口,就能将上述两种比对的大多数一致位点都囊括进来(图6.6)。
在比对过程中需要添加这种缺口以补偿基因进化过程中出现的插入或缺失。
6
图6.6 添加缺口的比对。
人血红蛋白链和肌红蛋白在加入缺口后的序列比对。
但是用缺口的办法增加了序列比对的复杂性,因为序列比对时所选择的缺口大小有人为因素。
现在已建立了计算机自动进行序列比对时添加缺口的方案。
这种方法采用打分系统评估各种比对方案,利用缺口惩罚来排除序列比对时出现的不合理缺口。
例如一致位点加10分,一个缺口(无论缺口大小)扣25分。
图6.6的比对方案得355分(38个一致位点和一个缺口,38 x 10 - 1 x 25 = 355)。
这样,这两个蛋白质之间氨基酸一致性就达到25.9% (两个蛋白质平均长度是147氨基酸残基,有38个一致位点)。
下面的问题是,这样的一致性是否属于明显类似?
用重排的方法估计比对的统计学意义
图6.5展示的序列类似性似乎是显著的,但是不能排除偶然出现了这些一致性的可能。
如何评估这些偶然性?采用的策略是将某一蛋白质的氨基酸序列进行随机重排(shuffling),然后将重排所得蛋白序列与目标序列比对(图6.7)。
重复这一过程,构建出各种重排蛋白的得分。
7
采用这种策略,肌红蛋白和血红蛋白链之间权威比对就凸现出来(图6.8)。
权威比对的数值远高于随机重排蛋白的平均值。
随机重排1020次,才出现一次这种比对值。
因此我们可以轻松地认为这两个序列确实是类似的。
最简单的解释是这两种蛋白序列来自同一祖先,属于同源物。
图6.7 重排产生的一个新序列。
图6.8 比对计分的统计比较。
计算重排序列比对的计分值,产生该计分值出现的次数。
用出现次数对比对计分值作图。
该图表示随机重排序列比对的积分分布。
链和肌红蛋白序列比对计分(红色)远远高于随机重排的计分,强烈提示这两个蛋白序列相似性明显。
8。