第八章分子
- 格式:doc
- 大小:133.50 KB
- 文档页数:10
第八章分子标记及其应用第八章分子标记及其应用1) 分子标记的种类与特点1. 遗传标记的种类与特点遗传标记:指可以稳定遗传的、易于识别的特殊遗传多态性形式。
Minisatellites:小卫星序列遗传标记的种类与特点1)形态标记:肉眼可见的特征性状,简单实用,但数目少,受发育阶段与环境影响。
2)细胞标记:染色体核型与带型,受环境影响小,稳定可靠,但耗时耗力,信息量不足。
3)生化标记:贮藏蛋白、同工酶等,信息量较大,取材方便,但不能反映基因组非编码区信息,仍受发育阶段与环境影响。
4)DNA分子标记:基因组DNA 水平的变异,理想的遗传标记。
2. DNA分子标记DNA分子标记:简称分子标记,指基因组DNA 水平上的任何差异,来自缺失、插入、置换、颠换、重复等,通常以分子杂交或凝胶电泳图谱的形式体现。
2.1 分子标记的优点1)数量多,遍及整个基因组,理论上检测位点近乎无限;2)稳定遗传,不受环境、发育阶段和是否表达等限制;3)多态性高,自然存在,无须专门创造;4)表现为“中性”,即不影响性状的表达;5)许多为共显性,能鉴别杂合与纯合,提供完整的遗传信息。
2.2 分子标记的类型分三大类:1) 基于核酸分子杂交: 第一代,1980s, RFLP(Restriction fragmentlength polymorphism ),限制性片段长度多态性2) 基于PCR或限制酶切+PCR: 第二代,1990s ,RAPD、AFLP、SSR、ISSR、 SCAR、STS等3) 基于DNA测序:第三代,近年来SNP和EST,反转录转座子等第三节分子标记的应用1. RFLP标记RFLP (Restriction Fragment Length Polymorphism):限制性片段长度多态性,1980,Botstein。
基本原理:不同基因组DNA经特定限制酶消化后产生大小不等的片段,再经电泳分离、Southern 印迹杂交和检测后,得到特异的RFLP 标记,它反映不同DNA对所用探针限制性酶切片段长度的多态性,实际是酶切位点的变化和分布情况。
第八章构象分析8.1 引言理论分析:Barton 1950非化环已烷反应性1. 构象分析发展归因于的研究。
实验技术:IR、NMR、X-ray的引入。
(1)Barton,1950在取代环已烷反应性的研究中,指出反应性受取代分子的赤道或轴向的性质所影响,即受取代环已烷构象所影响。
(2)实验技术的引入对分子结构的测定变得可能,并且随着能力的提高,测定分子的范围、精度越来越宽,越来越精确,即使这样,目前还是不能解决所有的分子结构测定。
譬如Protein分子晶体结构数据库,还是有限,原因晶体培养不出;NMR的溶液构象虽可测定,但分子太大也受限制。
因此在这种情况下利用理论分析方法是一种很好的补充。
同时,理论方法进行构象分析的结果与实验测定的结果很接近。
ex1. 早期实验测得C-C键长为0.152nm;理计0.1530 - 0.1534nm,后来更精确的实验测定为0.1528nm。
ex2. 1960年Hendricleson用理论方法计算了扭船式与椅式构象转化过程的能量为6.7KJ.mol-1,表明扭船式是可以存在的。
直到1975年科学家才在实验中证实了环已烷扭船式的存在,这就证明以上两者都是推动构象分析发展的基础。
两者是相互相成的。
构象搜索2. 构象分析的内容构象与性能的关系研究(1)构象搜素的目的是为了确定分子的优势构象,即寻找势能面上所有极小,因此能量极小化,在构象分析中起了极重要的作用。
而执行能量优化的一个特征是,它们移动到最接近初始结构的极小点。
因此,寻找一个产生初始结构为其后优化的各种算法是非常必要的。
什么是构象搜索?所谓构象搜索,在构象空间中寻找所有可能出现的比较稳定构象。
即分子的势能面上寻找所有的极小值。
(2)构象与性能的关系研究一个分子的物理、化学和生物性质关键是依赖于三维的结构即构象。
特别是在生物体系中,生物大分子的功能更是依赖于构象(也称活性构象)。
因此,构象分析在分子模拟中是一个十分重要的过程,而构象的搜索即寻找搜索的方法也是本章的重点。
8.2 构象搜索8.2.1 几个易混淆的基本概念Structure(结构)、build(构造)、configuration(构型)、conformation(构象)。
结构:是比较广义的术语,构造、构型、构象都可以用来描述分子结构。
构造:是说明分子中原子的连接性次序和键性(单、双键等)。
构型:是分子中原子在空间的排列状况。
构象:则是分子通过单键旋转形成各原子或原子团的空间排列。
因此,构造,构型,构象是在三个不同层次上描述分子的结构。
分子的构象是以构型为前提的。
一种构型对应无数个构象,否则一种构型就是对应一种构象(如乙烯)。
构型有静止的含义,而构象有动感。
几个不同含义构象的概念活性构象(药效构象):与受体结合的构象称为活性构象,活性构象不一定是能量最低的构象。
但必定是优势构象或近似的优势构象(低能构象)。
晶体构象:是分子堆积产生的。
结晶状态代表的是最低能量的分子构象(晶体状态)。
溶液构象:是溶液中存在的构象,这种构象在溶液中可能存在几个构象之间的平衡,溶剂的极性也会使构象发生变化。
8.2.2 构象搜索的方法构象搜索的方法常用的有:1、系统搜索方法;2、模型构型方法;3、距离几何方法;4、分子动力学模拟方法;5、Monte Carlo模拟方法;6、遗传算法。
下面介绍几种方法1、系统搜索方法所谓系统搜索方法:是系统地搜索整个构象空间,借以寻找能量最小点。
最基本的系统搜索方法是格点搜索,即在构象空间中以小的间隔变量进行逐点搜索,如果变量足够小的话则有可能搜索到全部的可能性。
系统搜索方法的优越性体现在自由度在10—20的分子的构象分析。
为了加快搜索的速率现在提出了不少改进算法,如树状搜索方法、过滤算法等。
下面重点介绍格点搜索和树状搜索方法。
(1)格点搜索方法格点搜索方法的要素:(步骤)(a)固定键长、键角(b)确定分子中所有旋转键(c)设定步长(d)极小化(优化)为了说明格点搜索的算法,下面举一例说明(P415)ex Ala dipeptide(丙氨酸二肽)对完成Alanine二肽的构象空间的一个格点搜索,一系列构象将通过系统地改变ϕ和ϕ在︒0和︒60之间产生。
在图8.2中在Ramachandro等值线图上这相当于画一个二维的格点,每一格点相应于一个由格点搜索产生的一个构象。
它能够容易地看到随一些ϕ和ϕ的结合。
甚至对一个相对大的扭转步长(增量)由格点搜索所产生的大量构象比在表面上产生极小点多得多;许多初始构象极小化(优化)到同样的极小能结构。
而且许多初始构象在能量上是非常高的。
格点搜索的一个主要缺点(不是)是被产生和优化的结构数随可旋转键的数以一个特别的形式而增加。
如下式所出: Number of conformation i N i θ3601∏== (8.1)i θ是对键i 所选的两面角步长,N 为旋转键的数。
如N =5,︒=30i θ,构象数为248832。
69hr (1s )如N =7,︒=30i θ,构象数为36million 。
415天树状搜索广泛用于表示不同的状态,具体的如图8.4所示。
树中包含由边(edges )连结的一些节(nodes )。
每一个边暗示与之相连的两个节的存在;每一个节代表一个体系可能产生的状态。
图中,具体的术语定义如下:a. 根节(rood node ):表示体系的初始状态。
b. 未端节(terminal nodes ):表示无子代(孩子)的节。
c. 目标节(goal node ):表示一个特殊类型的末端节。
(它对应于一个可接受的解) 假定,我们想利用格点搜索方法来寻找一个简单的烷烃,(如正已烷)的构象空间。
首先我们将设定:a. 未端甲基基团的旋转被忽略,只变化三个旋转键;同时,b. 要求每一可变键产生三个值,即,相应于反式(︒180)、旁式(+)(+︒60)和旁式(-)(︒-60)三个低能构象。
然而,搜索的结果得到27个terminal nodes (333⨯⨯≡),如图8.5中所示。
其中, root node :表示起始点,没有任何旋转角指配它。
当第一个可旋转键设定第一个可旋转角为︒180时,相应的root node 0 移到了node 1。
当第二个可旋转键设定为︒180时,相应的root node 1移到了node 4。
当第三个可旋转键设定为︒180时,node 4移到了node 13,node 13为terminal node ,它将作为进一步极小化的备用构象。
为了进一步产生构象,继续改变三个旋转角中的一个,最方便的方法,就是设定键3为旁式(+)构象(︒+60),它等价于将node 13移回到node 4,然后再移到terminal node 14。
这样得到第二个完成结束的构象。
用这种方式通过树状搜索的过程(所谓的往返)分子的所有构象都能被产生。
这种搜索算法,就是众所周知的一级深度搜索。
一级深度搜索的有效性,可以通知撤散那些违背或被某些能量和几何标准的结构来提高。
具有高能立体相互作用的结构在能量优化阶段前将被拒绝(排除),这样,在所有旋转角被指定前,通过检查部分限制构象能进一步提高系统搜索的有效性。
譬如,我们产生一部分的结构,它包含一个在空间上很接近的非成键的原子,如图8.6所示。
由图可见,在已烷中,如果在已边远中,如果第一个旋转键设定为旁式(+),即︒+60构象和第二个键设定为旁式(-),即︒-60构象(如图8.6所示的减烷的破坏),那么,一个高能的结构就被产生。
不管什么值指定给第三个旋转角,这样的高能立体障碍将永远存在。
因此,所有处在搜索树node 9 number 9 in Fig. 8.5以下的结构都将被淘汰或者删去。
如果在分子中存在违规(破坏)的这些部分可通过一个随后的扭曲角的指定,使得它相对于其它部分不再移动是可能的,这是很重要的。
环状分子利用系统搜索来分析构象常常是困难。
一般的步骤是:首先开环,得到一个“伪非环”分子;然后再作为一个正常的环状分子来处理。
下面以环已烷为例加以说明(如图8.7)当我们搜索环分子的构象空间时,为了保证环是精确形成的,附加的控制(条件)必须被包括。
例如,正已烷的所有反式结构是一个完全地可接受的构象。
而环已烷不是一个可接受的构象,原因是在环封闭的原子之间不合理的键长。
因此它一般采用(实践)控制若干分子内的参数,当利用系统搜索来寻找环体系的构象空间时;这些参数通常包括在环封闭的键之间的键长和键角。
(图8.8)。
在某些程序中,其它的内参数也被控制。
(如,扭曲角调整为环封闭的键)。
对系统搜索环为什么出问题有疑问的主要原因是:a. 这些控制常常在构象分析的后期才被应用。
b. 在结构被拒绝和接受前,它几乎是一个完整的环。
c. 当限制环状分子时一个简单的控制是保证(确保)在每一步上生长链的距离由开始原子足够短到使维持的键能够接近环。
当可旋转键以同方向的方式被加工时,系统搜索是最有效的。
这样保证一旦一个原子相对于已经讨论的原子在空间上被固定,那么它就不再被移动。
对一个环状分子这就意味搜索在分子的一个末端开始并且移向下键。
含有环的分子通过开环的处理,得到像以上描述的伪—环状分子,然后再加工(图8.9)。
任何系统搜索最后(终极地)要求在网格的分辨力和有效的计算机能力(资源)之间得到一个平衡。
太细的一个网格然而搜索可能化费太长时间,太粗的网格,然而重要的极小值可能被错过。
非成键的标准,决定一个结构是否被拒绝,也必须被指定。
非成键的标准,常常被称为一个bump check(碰撞控制)并且通常设置为一个适中的值(2.0Å),因为能量极小化中,步长将能够排除结构中的次要问题时对环状分子,环封闭的标准也可能性影响结果。
因此也必须记住各种截断(cut offs)是互相依赖的,所以变化一个可能要求其它的也被指定(改变)。
(2)树状搜索方法树状搜索方法是让搜索沿着一个方向进行,通过不断分支搜索空间。
具体地就是从肽链的一端出发,首先搜索第一个二面角的优势值,然后在第一个二面角选定某些优势值的基础上搜索第二个二面角,并且依次进行下去,逐渐地走遍整个构象空间。
图8.4示出了树状搜索的示意图。
加新内容(3)过滤算法过滤算法是在搜索过程中不断地消除构象空间中的不合理部分,以便尽可能地减少可能性,节省计算时间。
过滤的标准有:选用合理的初始二面角值,环闭合,跨环距离等等。
加新内容2、模型搭建的方法系统搜索方法不能用于包含很多二面角自由度的分子体系,但是在这个方法基础上发展起来的“搭建(build-up )”过程可以在一定程度上打破这个限制。
这个方法假定分子的构象主要依赖于短程作用力,象搭积木似地建造模型。
首先把分子分成小片段,大约2—3个残基为一单位,然后对分子的各个小片段采用系统搜索方法寻找最低能量构象,然后把两个最低能量构象连接起来进行最小化,选择低能量构象再接上第三段,依次进行下去,最后得到整个分子的构象。