DNA启动子概述
- 格式:pdf
- 大小:182.98 KB
- 文档页数:5
启动子概述
启动子是DNA链上一段能与RNA聚合酶结合并能起始mRNA合成的序列,它是基因表达不可缺少的重要调控序列。
启动子是一段位于结构基因5’-端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地结合,并具有转录起始的特异性。
基因的特异性转录取决于酶与启动子能否有效地形成二元复合物。
启动子分三类:启动子Ⅰ、启动子Ⅱ、启动子Ⅲ.只有启动子Ⅱ指导mRNA的转录。
真核生物启动子Ⅱ由两大部分组成:上游元件(upstream element)和启动子核心(core promoter)。
上游元件与转录的效率有关;启动子核心包括3部分:TATA
盒、起始子(initinator)及下游元件(downstream element)。
TATA盒为转录调控因子包括各种调节蛋白的结合区,与转录起始位点的精确选择及转录有关,起始子是转录起始所必须,下游元件作用尚不清楚。
原核生物启动子区范围较小,包括TATAAT区(Pribnow区)及其上游的TTGACA区。
启动子是一段提供RNA聚合酶识别和结合位点的DNA序列,位于基因上游。
启动子具有如下特征:
1序列特异性。
在启动子的DNA序列中,通常含有几个保守的序列框,序列框中碱基的变化会导致转录启动活性的改变。
2方向性。
启动子是一种有方向性的顺式调控元件,有单向启动子和双向启动子两类。
3位置特性。
启动子一般位于所启动转录基因的上游或基因内的前端。
处于基因的下4种属特异性。
原核生物的不同种、属,真核生物的不同组织都具有不同类型的启动
没有启动子,基因就不能转录。
原核生物启动子是由两段彼此分开且又高度保守的核苷酸序列组成,对mRNA的合成极为重要。
启动子区域:(1)Pribnow盒,位于转录起始位点上游5—10bp,一般由6~8个碱基组成,富含A和T,
故又称为TATA盒或—10区。
启动子来源不同,Pribnow盒的碱基顺序稍有变化。
(2)—35区,位于转录起始位点上游35bp处,故称—35区,一般由10个碱基组成。
质粒设计时都需要加入启动子序列,以保证目的基因的表达。
启动子可分为诱导型启动子和组成型启动子两大类,后者包括CMV,SV40,T7,pMC1,PGK启动子等。
一下介绍几个常见的启动子。
(1)U6启动子
U6是二型启动子,一般发现是启动小片段,不带PolyA尾的序列。
由Ⅲ类RNA聚合酶启动子U6启动子转录产生shRNA,经剪切后产生成熟siRNA,产生干扰效果。
这一类
启动子在腺病毒和慢病毒干扰载体的构建中应用很多。
U6更多的是用在shRNA的启动,来达到敲低一个基因的作用。
(2)H1启动子
RNA聚合酶Ⅲ启动子,H1RNA是RNase P的一个组分,需在3’端加上5个连续的T作为转录终止信号。
比较:
U6和H1启动子都属于真核生物RNA聚合酶III第的三类,分别负责转录U6RNA和H1RNA,这类启动子的特点是几乎所有启动子元件(除了+1位的转录起点)都位于转录起始位点的上游,也即它对转录起点后的序列无特殊选择或要求。
U6启动子和H1启动子+1位分别是鸟苷酸和腺苷酸。
但将H1启动子的+1位腺苷酸更换为尿苷酸,胞苷酸,鸟苷酸,似乎并不影响启动子的转录活性。
RNA聚合酶III启动子识别的终止信号是连续4-5个胸苷酸,转录产物末端一般有4个尿苷酸。
U6和H1RNA启动子是两种RNA聚合酶Ⅲ依赖的启动子,其特点是启动子自身元素均位于转录区的上游,适合于表达~21ntRNA和~50ntRNA茎环结构(stem loop)。
H1启动子和U6启动子是没有物种特异性的启动子,在大鼠、小鼠或其他哺乳动物细胞中可以工作。
如果载体选择的是polⅢ类启动子如U6或者H1,则需在3’端加上5个连续的T作为转录终止信号。
常用的包括RNA聚合酶Ⅲ类启动子,如人源或小鼠U6启动子和人源的
H1RNA启动子,这类启动子相对简单,完全位于转录序列上游,转录产物不含有来自启动子的序列,转录产量相对较高,遇到3-6个连续的T就会终止转录,不需转录终止信号,适合制备端的RNAs。
shRNA的表达量取决于启动子的强弱,U6启动子比H1强,表达持续时间较长,为首选。
(3)CMV启动子
CMV是大家公认的启动真核基因表达的最有力量的启动子。
相比较H1/u6启动子是属于原核启动子,在真核细胞里面的启动效率非常低。
CMV是三型启动子,长短都可以启动,可以启动PolyA尾的序列。
一般插入某个基因的CDS区到CMV启动子下游,CMV负责启动该基因的表达,从而达到调高该基因表达
的作用。
在腺病毒和慢病毒过表达载体构建中应用最多。
CMV不是人源或鼠类细胞内源启动子,不会干扰细胞本身的转录事件,适合做长期的shRNA表达。
CMV RNA聚合酶Ⅱ类启动子能耐受4个U甚至更长的一串U,用这类启动子表达载体,需在下游添加转录终止信号,如SV40转录终止信号。
在设计shRNA时就不需要考虑
5个连续T作为转录终止信号。
当shRNA序列有连续的U时应该优先考虑这个启动子载体。
比较:
CMV启动子活性较强,而U6启动子则较弱;CMV启动子和U6启动子的转录终止序列不同。
当shRNA序列有连续U/T时应优先考虑CMV启动子载体。
(4)UBC(泛素启动子)
泛素广泛存在于真核生物,对调节细胞内蛋白周转,参与细胞多种生命活动有重要作用,其在基因家族中的泛素启动子更是在增强基因表达的长期性,稳定性等方面有显著功效。
人
源性泛素启动子作为一种非病毒性的强启动子,将在基因治疗中起到举足轻重作用。
人源性泛素基因家族包括UbA,UbB,UbC。
UbB和UbC相互独立,分别由不同的调节基因调节。
UbC启动子在泛素启动子中属于较强的启动子。
(5)CAG启动子
CAG是人工构建的组合启动子,由巨细胞病毒(the cytomegalovirus,CMV)早期增强子(early enhancer element)和鸡β-肌动蛋白(chicken beta-actin)启动子组成,用
于驱动基因在哺乳动物载体的高水平表达。
(6)T7启动子
T7启动子是当今大肠杆菌表达系统的主流,这个功能强大兼专一性高的启动子经过巧妙的设计而成为原核表达的首选,尤其以Novagen公司的pET系统为杰出代表。
强大的
T7启动子完全专一受控于T7RNA聚合酶,而高活性的T7RNA聚合酶合成mRNA的速度比大肠杆菌RNA聚合酶快5倍——当二者同时存在时,宿主本身基因的转录竞争不过T7表达系统,几乎所有的细胞资源都用于表达目的蛋白;诱导表达后仅几个小时目的蛋白通常可以占到细胞总蛋白的50%以上。
由于大肠杆菌本身不含T7RNA聚合酶,需要将外源的T7RNA聚合酶引入宿主菌,因而T7RNA聚合酶的调控模式就决定了T7系统的调控模式——非诱导条件下,可以使目的基因完全处于沉默状态而不转录,从而避免目的基因毒性对
宿主细胞以及质粒稳定性的影响;通过控制诱导条件控制T7RNA聚合酶的量,就可以控制产物表达量,某些情况下可以提高产物的可溶性部分。
(8)磷酸甘油酸激酶(PGK)启动子
从工业酿酒酵母中获得的一类启动子。
(9)两类特殊序列
目前常用的构建策略有多启动子载体,融合蛋白,插入内切蛋白酶位点,内部核糖体插入位点IRES等,但是这些构建方法往往有载体容量有限,受细胞类型限制,不能表达多个
蛋白等特点。
自裂解多肽2A可应用在多顺反子载体构建中,并且具有结构短小,上下游基
因表达平衡性好,可用于共表达多个蛋白等优点,是一种构建多顺反子载体的有效工具。
IRES序列常用于多顺反子基因表达。
例如,在目的基因之后插入IRES序列,后面是选择标记基因,这样转录出来的mRNA就可以同时表达两种蛋白,选择标记基因翻译是通
过不依赖于5’帽子的作用进行的,所以IRES的作用并非启动基因表达,而是起始翻译,它象原核生物的SD序列一样,引导核糖体的进入,即如果一段mRNA上有两个基因,如两个基因直接连在一起,只有第一个会翻译,第二个无法起始,而在两者之间插入IRES就能使第二个基因起始。
如果是带有报告基因的表达载体,如只有一个启动子,即报告基因和目的片段成为融合基因,一是目的片段在前,报告基因在后,下游一定不能加终止密码子,否则报告基因不能
表达,并且要注意不能使报告基因的读码框发生变化。
一是报告基因在前,目的片段在后,也要保证不能使目的基因的读码框变化,这时下游要加终止密码子,否则将不能终止。
如果是带有报告基因的表达载体,有两个启动子分别启动,则目的基因上游引物加起始密码子,下游加终止密码子,可以分别表达蛋白。
2A和IRES的选择有何区别
IRES的优缺点:优点:IRES被放置于两个ORF之间的时候,可以同时表达这两个ORF。
由于两个ORF
分别有自己的起始密码子和终止密码子,所以会翻译两个独立的、没有经过修饰的蛋白。
由IRES链接的每个多顺反子翻译出来的多肽段是分开的,这就避免了融合蛋白和插入蛋白水解位点策略所带来的蛋白失活,错误标记等问题,还不会带来多启动子载体中启动子相互干扰或抑制的问题。
缺点:IRES的存在有时候会影响mRNA的结构,同时由于IRES和mRNA的5‘CAP对核糖体/或翻译起始复合物的结合力不同,IRES后面的ORF翻译蛋白的水平有可能与IRES 前面的ORF蛋白水平不一致。
有的时候前面的ORF表达很好,但后面的ORF表达水平不高;有的时候后面的ORF和/或IRES会影响前面ORF的表达,甚至前面的ORF根本不表达。
2A的优缺点:优点:两个基因(ORF)通过2A多肽链连接成为一个ORF,mRNA翻译成一个融合蛋白,
但这两个融合蛋白会被识别2A的蛋白酶切成两个蛋白。
这两个蛋白的摩尔比理论上是1:1。
缺点:2A是一个大约23个氨基酸的多肽。
蛋白酶切割会发生在2A多肽C端的甘氨酸(G)和脯氨酸(P)之间。
所以,前一个蛋白的尾巴上会留下一个20多个氨基酸的多肽。
后面一个蛋白的N端会留下一个多余的脯氨酸。
尤其是第一个蛋白,如果是一个小分子(比如分泌型的细胞因子),可能其功能会受到这20多个多肽的影响。
2A多肽首先发现于小RNA病毒,长度介于18-22个氨基酸之间,在C端编码有一个高度保守的共有基序(Asp-Val/Ile-Glu-X-Asn-Pro-Gly-//-Pro)。
目前研究的最为深入的是来
自FMDV的2A序列,FMDV是一种正链RNA病毒,其基因组内含有一个长的开放读码框,编码一个223kD的多聚蛋白前体,其中2A肽段只有16个氨基酸,这个多聚蛋白前体在翻译时由2A在其C端进行剪切。
FMDV2A也是第一个被鉴定出的2A序列,在多顺反子载体构建中已经得到广泛应用。
除了来自FMDV的F2A外,常用的还有来自马鼻炎A病毒ERAV的E2A,来自猪捷申病毒PTV-1的P2A和来自一点褐翅蛾病毒TaV的T2A。
(10)其他启动子
trp-lac(tac)启动子:tac是一个由trp启动子-35区和lacUV5启动子-10区融合而成的杂合启动子,受lac阻抑物调控,而不受crp基因产物介导的cAMP调控机制的调节。
trp-lac(trc)启动子:trc也是一个由trp启动子-35区和lacUV5启动子-10区融合而成的受lac阻抑物调控的杂合启动子。
trc和tac启动子的唯一区别是-35区和-10区之间的间隔序列不同,前者中为17bp,而后者中为16bp。
lac启动子:可通过蓝白斑筛选重组克隆的任何多用载体(pUC,pTZ,pSK,pBlue,pGEM等)都可用于表达外源蛋白。