原核基因表达调控综述
- 格式:doc
- 大小:329.00 KB
- 文档页数:16
原核生物的基因调控科学家把这个从DNA到蛋白质的过程称为基因表达(gene expression),对这个过程的调节就称为基因表达调控(gene regulation或gene control)。
要了解动、植物生长发育的规律、形态结构特征和生物学功能,就必须弄清楚基因表达调控的时间和空间概念,掌握了基因表达调控的秘密,我们手中就有了一把揭示生物学奥妙的金钥匙。
基因表达调控主要表现在以下几个方面:①转录水平上的调控(transcriptional regulation);②mRNA加工成熟水平上的调控(differential processing of RNAtranscript);③翻译水平上的调控(differential translation of mRNA).原核生物中,营养状况(nutritionalstatus)和环境因素(environmental factor)对基因表达起着举足轻重的影响。
在真核生物尤其是高等真核生物中,激素水平(hormone level)和发育阶段(developmental stage)是基因表达调控的最主要手段,营养和环境因素的影响力大为下降。
二、基因表达调控的基本原理(一)基因表达的多级调控基因的结构活化、转录起始、转录后加工及转运、mRNA降解、翻译及翻译后加工及蛋白质降解等均为基因表达调控的控制点。
可见,基因表达调控是在多级水平上进行的复杂事件。
其中转录起始是基因表达的基本控制点。
四个基本的调控点:(1)基因结构的活化。
DNA暴露碱基后RNA聚合酶才能有效结合。
活化状态的基因表现为:1.对核酸酶敏感;2.结合有非组蛋白及修饰的组蛋白;3.低甲基化。
(2)转录起始。
最有效的调节环节,通过DNA元件与调控蛋白相互作用来调控基因表达。
(3)转录后加工及转运。
RNA编辑、剪接、转运。
(4)翻译及翻译后加工。
翻译水平可通过特异的蛋白因子阻断mRNA 翻译翻译后对蛋白的加工、修饰也是基本调控环节。
原核生物基因表达调控概述基因表达调控是生物体内基因表达调节控制机制,使细胞中基因表达的过程在时间,空间上处于有序状态,并对环境条件的变化做出适当的反应复杂过程。
1.基因表达调控意义在生命活动中并不是所有的基因都同时表达,代谢过程中所需各种酶和蛋白质基因以及构成细胞化学成分的各种编码基因,正常情况下是经常表达的,而与生物发育过程有关的基因则需在特定的时空才表达,还有许多基因被暂时的或永久的关闭而不来表达。
2.原核基因表达调控特点原核生物基因表达调控存在于转录和翻译的起始、延伸和终止的每一步骤中。
这种调控多以操纵子为单位进行,将功能相关的基因组织在一起,同时开启或关闭基因表达即经济又有效,保证其生命活动的需要。
调控主要发生在转录水平,有正、负调控两种机制在转录水平上对基因表达的调控决定于DNA的结构,RNA 聚合酶的功能、蛋白质因子及其他小分子配基的相互作用。
细菌的转录和翻译过程几乎在同一时间内相互偶联。
细胞要控制各种蛋白质在不同时期的表达水平,有两条途径:(1)细胞控制从其DNA模板上转录其特异的mRNA的速度,这是一条经济的途径,可减少从mRNA合成蛋白质的小分子物质消耗,这是生物长期进化过程中自然选择的结果,这种控制称为转录水平调控。
(2)在mRNA合成后,控制从mRNA翻译肽链速度,包括一些与翻译有关的酶及其复合体分子缔合的装配速度等过程。
这种蛋白质合成及其基因表达的控制称为翻译水平的调控。
二.原核生物表达调控的概念(1)细菌细胞对营养的适应细菌必须能够广泛适应变化的环境条件。
这些条件包括营养、水分、溶液浓度、温度,pH等。
而这些条件须通过细胞内的各种生化反应途径,为细胞生长的繁荣提供能量和构建细胞组分所需的小分子化合物。
(2)顺式作用元件和反式作用元件基因活性的调节主要通过反式作用因子与顺式作用元件的相互作用而实现。
反式作用因子的编码基因与其识别或结合的靶核苷酸序列在同一个DNA分子上。
RNA聚合酶是典型的反式作用因子。
原核生物基因表达的机理及其调控原核生物是一类单细胞生物,其基因组包括细胞质内的DNA和可能存在于外部的质粒DNA。
基因是生命的基本单位,通过基因表达来实现细胞内各种生物活动的调节、协调和控制。
这里将重点介绍原核生物基因表达的机理及其调控。
基因表达的三个步骤基因表达分为三个主要步骤:转录、翻译和调节。
转录是指将DNA序列转换成RNA序列的过程;翻译是指RNA序列被翻译成氨基酸序列的过程,进而合成蛋白质;调节是指生物体在不同状态下对基因表达的调整和控制。
转录的机理和调控转录是从DNA合成RNA的过程。
在细胞内,RNA聚合酶是起主导作用的酶,可以将位于DNA模板链上的核苷酸与其形成互补配对的核苷酸连接起来,从而合成RNA,这个过程是由DNA模板指导的。
在原核生物中,转录过程相对简单。
细菌细胞中,只有一个RNA聚合酶可以完成所有RNA的合成,并且细菌细胞中的大多数基因都是成串排列的,构成的连续片段被称为“操纵子”。
细菌的一个操纵子通常包含3个区域,启动子、结构基因和终止子。
其中,启动子包含一段特别的DNA序列,被RNA聚合酶认识为转录起点,使得RNA聚合酶可以将核苷酸序列转录为RNA。
结构基因由串联的核苷酸序列组成,决定了合成的RNA分子序列构建。
终止子是一些DNA序列,确定RNA聚合酶在终止转录时的位置。
转录过程中的调控非常重要。
原核生物常常通过启动子区域的开放或关闭调控基因的转录。
这可以通过转录因子的作用来实现。
例如,细菌的“cap结构”和“UTR”可以帮助细胞发现起始位置。
激活蛋白可以缠绕到基因区域,启动转录酶的工作进程。
还有其他的转录因子,他们的作用是为转录酶提供指导信号。
翻译的机理和调控翻译是在RNA模板的指导下,由核糖体将合成的氨基酸序列合成成蛋白质的过程。
在原核生物中,翻译是通过紧密联系的核糖体和RNA复合物实现的。
核糖体由大大小小两个亚基组成,并特异地识别不同氨基酸。
它通过扫描RNA序列来寻找指定的起始区域(起始密码子),并始终按照特定的氨基酸序列连接合成蛋白质。
细菌能随环境的变化,迅速改变某些基因表达的状态,这就是很好的基因表达调控的实验型。
人们就是从研究这种现象开始,打开认识基因表达调控分子机理的窗口的。
一、操纵元的提出大肠杆菌可以利用葡萄糖、乳糖、麦芽糖、阿拉伯糖等作为碳源而生长繁殖。
当培养基中有葡萄糖和乳糖时,细菌优先使用葡萄糖,当葡萄糖耗尽,细菌停止生长,经过短时间的适应,就能利用乳糖,细菌继续呈指数式繁殖增长(见下图)。
大肠杆菌利用乳糖至少需要两个酶:促使乳糖进入细菌的乳糖透过酶(lactose permease)催化乳糖分解第一步的β-半乳糖苷酶(β-galactosidase)(见下图)。
在环境中没有乳糖或其他β-半乳糖苷时,大肠杆菌合成β-半乳糖苷酶量极少,加入乳糖2-3分钟后,细菌大量合成β-半乳糖苷酶,其量可提高千倍以上,在以乳糖作为唯一碳源时,菌体内的β-半乳糖苷酶量可占到细菌总蛋白量的3%。
在上述二阶段生长细菌利用乳糖再次繁殖前,也能测出细菌中β-半乳糖苷酶活性显著增高的过程。
这种典型的诱导现象,是研究基因表达调控的极好模型。
针对大肠杆菌利用乳糖的适应现象,法国的Jacob和Monod等人做了一系列遗传学和生化学研究实验,于1961年提出乳糖操纵元(lac operon)学说,如下图所示。
下图中z、a是大肠杆菌编码利用乳糖所需酶类的基因,P是转录z、a所需要的启动子,调控基因i编码合成调控蛋白R,R能与O结合而阻碍从P开始的基因转录,所以O就是调节基因开放的操纵序列,乳糖能改变R结构使其不能与P结合,因而乳糖浓度增高时基因就开放,转录合成所编码的酶类,这样大肠杆菌就能适应外界乳糖供应的变化而改变利用乳糖的状况,这个模型是人们在科学实验的基础上第一次开始认识基因表达调控的分子机理。
二、操纵元(operon)的基本组成乳糖操纵元模型被以后的许多研究实验所证实,对其有了更深入的认识,并且发现其他原核生物基因调控也有类似的操纵元组织(见下图),操纵元是原核基因表达调控的一种重要的组织形式,大肠杆菌的基因多数以操纵元的形式组成基因表达调控的单元。
下面就以半乳糖操纵元为例子说明操纵元的最基本的组成元件(elements)。
(一)结构基因群操纵元中被调控的编码蛋白质的基因可称为结构基因(structural gene, SG)。
一个操纵元中含有2个以上的结构基因,多的可达十几个。
每个结构基因是一个连续的开放读框(open reading frame),5’端有翻译起始码(DNA存储链上是ATG,转录成mRNA就是AUG),3’端有翻译终止码(DNA存储链上是TAA、TGA或TAG,转录成mRNA就是UAA、UGA或UAG)。
各结构基因头尾衔接、串连排列,组成结构基因群。
至少在第一个结构基因5’侧具有核糖体结合位点(ribosome binding site, RBS),因而当这段含多个结构基因的DNA被转录成多顺反子mRNA,就能被核糖体所识别结合、并起始翻译。
核糖体沿mRNA移动;在合成完第一个编码的多肽后,核糖体可以不脱离mRNA而继续翻译合成下一个基因编码的多肽,直至合成完这条多顺反子mRNA所编码的全部多肽。
乳糖操纵元含有z、y和a三个结构基因。
z基因长3510bp,编码含1170个氨基酸、分子量为135,000的多肽,以四聚体形式组成有活性的β-半乳糖苷酶,催化乳糖转变为别乳糖(allolactose),再分解为半乳糖和葡萄糖;y基因长780bp,编码由260个氨基酸组成、分子量30000的半乳糖透过酶,促使环境中的乳糖进入细菌;a基因长825bp,编码含275氨基酸、分子量为32,000的转乙酰基酶,以二聚体活性形式催化半乳糖的乙酰化。
z基因5’侧具有大肠杆菌核糖体识别结合位点(ribosome binding site, RBS)特征的Shine Dalgarno(SD)序列,因而当乳糖操纵元开放时,核糖体能结合在转录产生的mRNA上。
由于z、y、a三个基因头尾相接,上一个基因的翻译终止码靠近下一个基因的翻译起始码,因而同一个核糖体能沿此转录生成的多顺反子(polycistron) mRNA移动,在翻译合成了上一个基因编码的蛋白质后,不从mRNA上掉下来而继续沿mRNA移动合成下一个基因编码的蛋白质,一气依次合成基因群所编码的所有蛋白质。
(二)启动子启动子(promoter,P)是指能被RNA聚合酶识别、结合并启动基因转录的一段DNA序列。
操纵元至少有一个启动子,一般在第一个结构基因5′侧上游,控制整个结构基因群的转录。
用RNA聚合酶与分离的一段DNA双链混合,再加入外切核酸酶去水解DNA,结果只有被RNA 聚合酶识别结合而被保护的那段DNA不被水解,由此可以测出启动子的范围及其序列。
虽然不同的启动子序列有所不同,但比较已经研究过的上百种原核生物的启动子的序列,发现有一些共同的规律,它们一般长40-60bp,含A桾碱基对较多,某些段落是很相似的,这些相似的保守性段落称为共有性序列(consensus sequences)。
如下图所示,启动子一般可分为识别(R,recognition)、结合(B, binding)和起始(I, initiation)三个区段。
转录起始第一个碱基(通常标记位置为+1)最常见的是A;在-10bp附近有TATAAT一组共有序列,因为这段共有序列是Pribnow首先发现的,称为Pribnow盒(Pribnow box);在-35bp处又有TTGACA一组共有序列。
不同的启动子序列不同,与RNA聚合酶的亲和力不同,启动转录的频率高低不同,即不同的启动子起动基因转录的强弱不同。
(三)操纵子操纵子(operator)是指能被调控蛋白特异性结合的一段DNA序列,常与启动子邻近或与启动子序列重叠,当调控蛋白结合在操纵子序列上,会影响其下游基因转录的强弱。
以前许多书中将操纵子称为操纵基因(operator gene)。
但现在基因定义是为蛋白质编码的核酸序列,而操纵序列并不是编码蛋白质的基因,却是起着调控基因表达强弱的作用,正如启动序列不叫启动基因而称为启动子一样,操纵序列就可称为操纵子。
以前将operon译为操纵子则可改译为操纵元,即基因表达操纵的单元之意。
举乳糖操纵元中的操纵子为例,如下图所示,其操纵子(o)序列位于启动子(p)与被调控的基因之间,部分序列与启动子序列重叠。
仔细分析该操纵子序列,可见这段双链DNA具有回文(palindrome)样的对称性一级结构,能形成十字形的茎环(stem loop)构造。
不少操纵子都具有类似的对称性序列,可能与特定蛋白质的结合相关。
阻遏蛋白与操纵子结合,就妨碍了RNA聚合酶与启动子的结合及其后β-半乳糖苷酶等基因的转录起始,从而阻遏了这群基因的表达。
最早只把与阻遏蛋白结合、起阻遏作用的序列称为操纵子,但其后发现有的操纵元中同一操纵序列与不同构像的蛋白质结合,可以分别起阻遏或激活基因表达的作用,阿拉伯糖操纵元中的序列就是典型的例子。
因而凡能与调控蛋白特异性结合、从而影响基因转录强弱的序列,不论其对基因转录的作用是减弱、阻止或增强、开放,都可称为操纵子。
(四)调控基因调控基因(regulatory gene)是编码能与操纵序列结合的调控蛋白的基因。
与操纵子结合后能减弱或阻止其调控基因转录的调控蛋白称为阻遏蛋白(repressive protein),其介导的调控方式称为负性调控(negative regulation);与操纵子结合后能增强或起动调控基因转录的调控蛋白称为激活蛋白(activating protein),所介导的调控方式称为正性调控(positive regulation)。
某些特定的物质能与调控蛋白结合,使调控蛋白的空间构像发生变化,从而改变其对基因录的影响,这些特定物质可称为效应物(effector),其中凡能引起诱导发生的分子称为诱导剂(inducer),能导致阻遏发生的分子称为阻遏剂或辅助阻遏剂(corepressor)。
因此,正负调控又有以下几种形式,如下图:例如在乳糖操纵元中,调控基因1ac I位于P1ac邻近,有其自身的启动子和终止子,转录方向和结构基因群的转录方向一致,编码产生由347个氨基酸组成的调控蛋白R,在环境没有乳糖存在的情况下,R形成分子量为152000的活性四聚体,能特异地与操纵子o紧密结合,从而阻止利用乳糖的酶类基因的转录,所以R是乳糖操纵元的阻遏蛋白;当环境中有足够的乳糖时,乳糖受β-半乳糖苷酶作用转变为别乳糖,别乳糖与R结合,使R的空间构像变化,四聚体解聚成单体,失去与操纵子特异性紧密结合的能力,从而解除了阻遏蛋白的作用,使其后的基因得以转录合成利用乳糖的酶类。
在这过程中乳糖(实际起作用的是别乳糖)就是诱导剂,与R结合起到去阻遏作用(derepression),诱导了利用乳糖的酶类基因转录开放。
许多调控蛋白都是变构蛋白(allosteric protein),通过与上述类似的方式与效应物结合变空间构像,从而改变活性,起到调节基因转录表达的作用。
(五)终止子终止子(terminator T)是给予RNA聚合酶转录终止信号的DNA序列。
在一个操纵元中至少在构基因群最后一个基因的后面有一个终止子。
终止子按其作用是否需蛋白因子的协助至少可以分为两类:一类是不依赖ρ因子(蛋白性终止因子)的终止子,这类终止子在序列上有一些共通的特点,即有一段富含GC的反向重复序列(inverted repeat sequence),其后跟随一段富含AT的序列(见下图),因而转录生成的mRNA的序列中能形成发夹式结构,后继一连串U,正是RNA聚合酶转录生成的这段mRNA 的结构阻止RNA聚合酶继续沿DNA移动,并使聚合酶从DNA链上脱落下来,终止转录。
另一类是依赖ρ因子的终止子,即其终止转录的作用需要ρ因子的协同,或至少是受ρ因子的影响。
不同的终止子的作用也有强弱之分,有的终止子几乎能完全停止转录;有的则只是部分终止转录,一部分RNA聚合酶能越过这类终止序列继续沿DNA移动并转录。
如果一串结构基因群中间有这种弱终止子的存在,则前后转录产物的量会有所不同,这也是终止子调节基因群中不同基因表达产物比例的一种方式。
有的蛋白因子能作用于终止序列,减弱或取消终止子的作用,称为抗终止作用(antitermination),这种蛋白因子就称为抗终止因子(antiterminator)。
以上5种元件是每一个操纵元必定含有的。
其中启动子、操纵子位于紧邻结构基因群的上游,终止子在结构基因群之后,它们都在结构基因的附近,只能对同一条DNA链上的基因表达起调控作用,这种作用在遗传学实验上称为顺式作用(cis action),启动子、操纵子和终止子就属于顺式作用元件(cis acting element)。